Quantitative and Qualitative Evaluation of Sequence Patterns Found by Application of Different Educational Data Preprocessing Techniques

Zobrazit minimální záznam

dc.contributor.author Munk, Michal cze
dc.contributor.author Drlik, Martin cze
dc.contributor.author Benko, Ľubomír cze
dc.contributor.author Reichel, Jaroslav cze
dc.date.accessioned 2018-02-27T03:52:56Z
dc.date.available 2018-02-27T03:52:56Z
dc.date.issued 2017 eng
dc.identifier.issn 2169-3536 eng
dc.identifier.uri https://hdl.handle.net/10195/70378
dc.description.abstract Educational data preprocessing from log files represents a time-consuming phase of the knowledge discovery process. It consists of data cleaning, user identification, session identification, and path completion phase. This paper attempts to identify phases, which are necessary in the case of preprocessing of educational data for further application of learning analytics methods. Since the sequential patterns analysis is considered suitable for estimating of discovered knowledge, this paper tries answering the question, which of these preprocessing phases has a significant impact on discovered knowledge in general, as well as in the meaning of quality and quantity of found sequence patterns. Therefore, several data preprocessing techniques for session identification and path completion were applied to prepare logfiles with different levels of data preprocessing. The results showed that the session identification technique using the reference length, calculated from the sitemap, had a significant impact on the quality of extracted sequence rules. The path completion technique had a significant impact only on the quantity of extracted sequence rules. The found results together with the results of the previous systematic research in educational data preprocessing can improve the automation of the educational data preprocessing phase as well as it can contribute to the development of learning analytics tools suitable for different groups of stakeholders engaged in the educational data mining research activities. eng
dc.format p. 8989-9004 eng
dc.language.iso eng eng
dc.publisher IEEE (Institute of Electrical and Electronics Engineers) eng
dc.relation.ispartof IEEE ACCESS, volume 5, issue: 5 eng
dc.rights open access eng
dc.subject Computational and artificial intelligence eng
dc.subject data preprocessing eng
dc.subject educational technology eng
dc.subject learning eng
dc.subject learning systems eng
dc.subject sequential analysis eng
dc.subject web mining eng
dc.subject Výpočetní inteligence cze
dc.subject umělá inteligence cze
dc.subject předzpracování dat cze
dc.title Quantitative and Qualitative Evaluation of Sequence Patterns Found by Application of Different Educational Data Preprocessing Techniques eng
dc.title.alternative Kvantitativní a kvalitativní vyhodnocení sekvenčních vzorů zjištěných aplikací různých předzpracovacích technik vzdělávacích dat cze
dc.type article eng
dc.description.abstract-translated Príprava edukačných dát z logovacích súborov predstavuje časovo náročnú fázu v procese objavovania znalostí. Pozostáva z čistenia dát, identifikácie používateľov, sedení a dopĺňania ciest. Tento článok sa snaží identifikovať fázy, ktoré sú potrebné v prípade prípravy edukačných dát pre ďalšiu aplikáciu analytických metód. Keďže je analýza sekvenčných vzorov považovaná za vhodnú na odhad objavených znalostí, tak sa tento článok snaží odpovedať na otázku, ktorá z týchto fáz prípravy dát má vo všeobecnosti významný vplyv na získané znalosti v zmysle kvality a kvantity nájdených sekvenčných vzorov. Preto boli na prípravu logovacích súborov na rôznych úrovniach prípravy dát zvolené viaceré techniky identifikácie sedení a dopĺňania ciest. Výsledky ukázali, že identifikácia sedení pomocou metódy Reference Length, vypočítaná z mapy webu, má významný vplyv na kvalitu extrahovaných sekvenčných pravidiel. Technika dopĺňania ciest mala značný vplyv iba na kvantitu extrahovaných sekvenčných pravidiel. Nadobudnuté výsledky spolu s výsledkami predchádzajúceho systematického výskumu v príprave edukačných dát, môžu zlepšiť automatizáciu fázy prípravy edukačných dát, ako aj môžu prispieť k rozvoju nástrojov na analýzu vzdelávania, vhodných pre rôzne skupiny zainteresovaných strán zaoberajúcich sa výskumom v oblasti objavovania znalostí v doméne vzdelávania. cze
dc.peerreviewed yes eng
dc.publicationstatus published eng
dc.identifier.doi 10.1109/ACCESS.2017.2706302 eng
dc.project.ID SGS_2017_019/Syntéza a analýza modelů pro podporu zavádění konceptu chytrých měst a regionů eng
dc.identifier.wos 000404270600033 eng
dc.identifier.scopus 2-s2.0-85028876204
dc.identifier.obd 39880479 eng


Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam

Vyhledávání


Rozšířené hledání

Procházet

Můj účet