Zobrazit minimální záznam
dc.contributor.author |
Munk, Michal
|
cze |
dc.contributor.author |
Drlik, Martin |
cze |
dc.contributor.author |
Benko, Ľubomír
|
cze |
dc.contributor.author |
Reichel, Jaroslav
|
cze |
dc.date.accessioned |
2018-02-27T03:52:56Z |
|
dc.date.available |
2018-02-27T03:52:56Z |
|
dc.date.issued |
2017 |
eng |
dc.identifier.issn |
2169-3536 |
eng |
dc.identifier.uri |
https://hdl.handle.net/10195/70378 |
|
dc.description.abstract |
Educational data preprocessing from log files represents a time-consuming phase of the knowledge discovery process. It consists of data cleaning, user identification, session identification, and path completion phase. This paper attempts to identify phases, which are necessary in the case of preprocessing of educational data for further application of learning analytics methods. Since the sequential patterns analysis is considered suitable for estimating of discovered knowledge, this paper tries answering the question, which of these preprocessing phases has a significant impact on discovered knowledge in general, as well as in the meaning of quality and quantity of found sequence patterns. Therefore, several data preprocessing techniques for session identification and path completion were applied to prepare logfiles with different levels of data preprocessing. The results showed that the session identification technique using the reference length, calculated from the sitemap, had a significant impact on the quality of extracted sequence rules. The path completion technique had a significant impact only on the quantity of extracted sequence rules. The found results together with the results of the previous systematic research in educational data preprocessing can improve the automation of the educational data preprocessing phase as well as it can contribute to the development of learning analytics tools suitable for different groups of stakeholders engaged in the educational data mining research activities. |
eng |
dc.format |
p. 8989-9004 |
eng |
dc.language.iso |
eng |
eng |
dc.publisher |
IEEE (Institute of Electrical and Electronics Engineers) |
eng |
dc.relation.ispartof |
IEEE ACCESS, volume 5, issue: 5 |
eng |
dc.rights |
open access |
eng |
dc.subject |
Computational and artificial intelligence |
eng |
dc.subject |
data preprocessing |
eng |
dc.subject |
educational technology |
eng |
dc.subject |
learning |
eng |
dc.subject |
learning systems |
eng |
dc.subject |
sequential analysis |
eng |
dc.subject |
web mining |
eng |
dc.subject |
Výpočetní inteligence |
cze |
dc.subject |
umělá inteligence |
cze |
dc.subject |
předzpracování dat |
cze |
dc.title |
Quantitative and Qualitative Evaluation of Sequence Patterns Found by Application of Different Educational Data Preprocessing Techniques |
eng |
dc.title.alternative |
Kvantitativní a kvalitativní vyhodnocení sekvenčních vzorů zjištěných aplikací různých předzpracovacích technik vzdělávacích dat |
cze |
dc.type |
article |
eng |
dc.description.abstract-translated |
Príprava edukačných dát z logovacích súborov predstavuje časovo náročnú fázu v procese objavovania znalostí. Pozostáva z čistenia dát, identifikácie používateľov, sedení a dopĺňania ciest. Tento článok sa snaží identifikovať fázy, ktoré sú potrebné v prípade prípravy edukačných dát pre ďalšiu aplikáciu analytických metód. Keďže je analýza sekvenčných vzorov považovaná za vhodnú na odhad objavených znalostí, tak sa tento článok snaží odpovedať na otázku, ktorá z týchto fáz prípravy dát má vo všeobecnosti významný vplyv na získané znalosti v zmysle kvality a kvantity nájdených sekvenčných vzorov. Preto boli na prípravu logovacích súborov na rôznych úrovniach prípravy dát zvolené viaceré techniky identifikácie sedení a dopĺňania ciest. Výsledky ukázali, že identifikácia sedení pomocou metódy Reference Length, vypočítaná z mapy webu, má významný vplyv na kvalitu extrahovaných sekvenčných pravidiel. Technika dopĺňania ciest mala značný vplyv iba na kvantitu extrahovaných sekvenčných pravidiel. Nadobudnuté výsledky spolu s výsledkami predchádzajúceho systematického výskumu v príprave edukačných dát, môžu zlepšiť automatizáciu fázy prípravy edukačných dát, ako aj môžu prispieť k rozvoju nástrojov na analýzu vzdelávania, vhodných pre rôzne skupiny zainteresovaných strán zaoberajúcich sa výskumom v oblasti objavovania znalostí v doméne vzdelávania. |
cze |
dc.peerreviewed |
yes |
eng |
dc.publicationstatus |
published |
eng |
dc.identifier.doi |
10.1109/ACCESS.2017.2706302 |
eng |
dc.project.ID |
SGS_2017_019/Syntéza a analýza modelů pro podporu zavádění konceptu chytrých měst a regionů |
eng |
dc.identifier.wos |
000404270600033 |
eng |
dc.identifier.scopus |
2-s2.0-85028876204 |
|
dc.identifier.obd |
39880479 |
eng |
Tento záznam se objevuje v následujících kolekcích
Zobrazit minimální záznam
|
Vyhledávání
Procházet
-
Vše v Digitální knihovně
-
Tato kolekce
Můj účet
|