Quantitative and Qualitative Evaluation of Sequence Patterns Found by Application of Different Educational Data Preprocessing Techniques

Munk, Michal; Drlik, Martin; Benko, Ľubomír; Reichel, Jaroslav

Digitální knihovna UPCE
→
Univerzita Pardubice
→
Publikační činnost akademických pracovníků UPCE / UPCE Research Outputs
→
Zobrazit záznam

dc.contributor.author	Munk, Michal	cze
dc.contributor.author	Drlik, Martin	cze
dc.contributor.author	Benko, Ľubomír	cze
dc.contributor.author	Reichel, Jaroslav	cze
dc.date.accessioned	2018-02-27T03:52:56Z
dc.date.available	2018-02-27T03:52:56Z
dc.date.issued	2017	eng
dc.identifier.issn	2169-3536	eng
dc.identifier.uri	https://hdl.handle.net/10195/70378
dc.description.abstract	Educational data preprocessing from log files represents a time-consuming phase of the knowledge discovery process. It consists of data cleaning, user identification, session identification, and path completion phase. This paper attempts to identify phases, which are necessary in the case of preprocessing of educational data for further application of learning analytics methods. Since the sequential patterns analysis is considered suitable for estimating of discovered knowledge, this paper tries answering the question, which of these preprocessing phases has a significant impact on discovered knowledge in general, as well as in the meaning of quality and quantity of found sequence patterns. Therefore, several data preprocessing techniques for session identification and path completion were applied to prepare logfiles with different levels of data preprocessing. The results showed that the session identification technique using the reference length, calculated from the sitemap, had a significant impact on the quality of extracted sequence rules. The path completion technique had a significant impact only on the quantity of extracted sequence rules. The found results together with the results of the previous systematic research in educational data preprocessing can improve the automation of the educational data preprocessing phase as well as it can contribute to the development of learning analytics tools suitable for different groups of stakeholders engaged in the educational data mining research activities.	eng
dc.format	p. 8989-9004	eng
dc.language.iso	eng	eng
dc.publisher	IEEE (Institute of Electrical and Electronics Engineers)	eng
dc.relation.ispartof	IEEE ACCESS, volume 5, issue: 5	eng
dc.rights	open access	eng
dc.subject	Computational and artificial intelligence	eng
dc.subject	data preprocessing	eng
dc.subject	educational technology	eng
dc.subject	learning	eng
dc.subject	learning systems	eng
dc.subject	sequential analysis	eng
dc.subject	web mining	eng
dc.subject	Výpočetní inteligence	cze
dc.subject	umělá inteligence	cze
dc.subject	předzpracování dat	cze
dc.title	Quantitative and Qualitative Evaluation of Sequence Patterns Found by Application of Different Educational Data Preprocessing Techniques	eng
dc.title.alternative	Kvantitativní a kvalitativní vyhodnocení sekvenčních vzorů zjištěných aplikací různých předzpracovacích technik vzdělávacích dat	cze
dc.type	article	eng
dc.description.abstract-translated	Príprava edukačných dát z logovacích súborov predstavuje časovo náročnú fázu v procese objavovania znalostí. Pozostáva z čistenia dát, identifikácie používateľov, sedení a dopĺňania ciest. Tento článok sa snaží identifikovať fázy, ktoré sú potrebné v prípade prípravy edukačných dát pre ďalšiu aplikáciu analytických metód. Keďže je analýza sekvenčných vzorov považovaná za vhodnú na odhad objavených znalostí, tak sa tento článok snaží odpovedať na otázku, ktorá z týchto fáz prípravy dát má vo všeobecnosti významný vplyv na získané znalosti v zmysle kvality a kvantity nájdených sekvenčných vzorov. Preto boli na prípravu logovacích súborov na rôznych úrovniach prípravy dát zvolené viaceré techniky identifikácie sedení a dopĺňania ciest. Výsledky ukázali, že identifikácia sedení pomocou metódy Reference Length, vypočítaná z mapy webu, má významný vplyv na kvalitu extrahovaných sekvenčných pravidiel. Technika dopĺňania ciest mala značný vplyv iba na kvantitu extrahovaných sekvenčných pravidiel. Nadobudnuté výsledky spolu s výsledkami predchádzajúceho systematického výskumu v príprave edukačných dát, môžu zlepšiť automatizáciu fázy prípravy edukačných dát, ako aj môžu prispieť k rozvoju nástrojov na analýzu vzdelávania, vhodných pre rôzne skupiny zainteresovaných strán zaoberajúcich sa výskumom v oblasti objavovania znalostí v doméne vzdelávania.	cze
dc.peerreviewed	yes	eng
dc.publicationstatus	published	eng
dc.identifier.doi	10.1109/ACCESS.2017.2706302	eng
dc.project.ID	SGS_2017_019/Syntéza a analýza modelů pro podporu zavádění konceptu chytrých měst a regionů	eng
dc.identifier.wos	000404270600033	eng
dc.identifier.scopus	2-s2.0-85028876204
dc.identifier.obd	39880479	eng