Using Entropy in Web Usage Data Preprocessing
ČlánekOtevřený přístuppeer-reviewedpublishedSoubory
Datum publikování
2018
Autoři
Vedoucí práce
Oponent
Název časopisu
Název svazku
Vydavatel
Abstrakt
The paper is focused on an examination of the use of entropy in the field of web usage mining. Entropy creates an alternative possibility of determining the ratio of auxiliary pages in the session identification using the Reference Length method. The experiment was conducted on two different web portals. The first log file was obtained from a course of virtual learning environment web portal. The second log file was received from the web portal with anonymous access. A comparison of the results of entropy estimation of the ratio of auxiliary pages and a sitemap estimation of the ratio of auxiliary pages showed that in the case of sitemap abundance, entropy could be a full-valued substitution for the estimate of the ratio of auxiliary pages.
Rozsah stran
p. 67-82
ISSN
1099-4300
Trvalý odkaz na tento záznam
Projekt
Zdrojový dokument
Entropy, volume 20, issue: 1
Vydavatelská verze
http://www.mdpi.com/1099-4300/20/1/67
Přístup k e-verzi
open access
Název akce
ISBN
Studijní obor
Studijní program
Signatura tištěné verze
Umístění tištěné verze
Přístup k tištěné verzi
Klíčová slova
data preprocessing, information entropy, web usage mining, session identification, Reference Length, příprava dat, informační entropie, web usage mining, identifikace sezení, Reference Length