Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Influence of ratio of auxiliary pages on the pre-processing phase of web usage mining

Článekopen accesspeer-reviewedpublished version
dc.contributor.authorMunk, Michelcze
dc.contributor.authorBenko, Ľubomírcze
dc.contributor.authorGangur, Mikulascze
dc.contributor.authorTurcani, Milancze
dc.date.accessioned2017-05-11T11:25:35Z
dc.date.available2017-05-11T11:25:35Z
dc.date.issued2015eng
dc.description.abstractData mining belongs to the one of the important tools for Business Intelligence. It is a means to increase competitiveness of a company. Web usage mining is engaged in data mining of web server log file and it analyzes the user´s behavior on the web site. The first step of web usage mining process is data pre-processing obtained from a web log file. Data pre-processing is an important part of web usage mining. Discovering patterns of behavior of web visitors depends on the quality of pre-processing phase. Therefore it is important to understand the used methods. This paper summarizes the pre-processing phases and especially the phases of session identification. There are introduced two algorithms for data cleaning and session identification using the reference length method. The main aim of this paper is to compare a calculation of cutoff time and its influence on discovered useful, trivial and inexplicable rules. Cutoff time is an important part of the session identification using the Reference Length method. The influence of ratio of auxiliary pages on the calculation based on a sitemap and subjective estimation was compared. Statistical methods were used to determine the difference between these two approaches. In this paper was examined the portion of found rules based on quantity and quality. The ratio of auxiliary pages has only an impact on quantity of extracted rules in the files with path completion. It has no impact on portion of extracted useful rules, on the other hand, inappropriate estimation of the ratio of auxiliary pages may cause increasing of trivial and inexplicable rules. © 2015, Technical University of Liberec. All rights reserved.eng
dc.description.abstract-translatedDolování dat patří k jedním z důležitých nástrojů Business Intelligence. Je to prostředek pro zvýšení konkurenceschopnosti společnosti. Webové dolování se zabývá dolováním dat pomocí protokolu serveru WWW a analyzuje chování uživatele na webu. Prvním krokem procesu dolování webu je předzpracování dat, získaných ze souboru protokolu web. Předzpracování dat je důležitou součástí webového dolování. Poznáváme vzorce chování návštěvníků webu závisijící na kvalitě předzpracování fáze. Proto je důležité porozumět použitým metodám. Tento dokument shrnuje fáze předběžného zpracování a zejména fáze identifikace relace.cze
dc.formatp. 144-159eng
dc.identifier.doidx.doi.org/10.15240/tul/001/2015-3-013
dc.identifier.issn1212-3609eng
dc.identifier.obd39878723eng
dc.identifier.urihttps://hdl.handle.net/10195/67786
dc.identifier.wos000361504100013
dc.language.isoengeng
dc.peerreviewedyeseng
dc.publicationstatuspublished versioneng
dc.relation.ispartofE+M Ekonomie a Management, volume 18, issue: 3eng
dc.rightsopen accesseng
dc.subjectAuxiliary pageseng
dc.subjectBusiness intelligenceeng
dc.subjectData miningeng
dc.subjectData pre-processingeng
dc.subjectLog fileseng
dc.subjectReference lengtheng
dc.subjectSession identificationeng
dc.subjectWeb usage miningeng
dc.subjectPmocné stránkycze
dc.subjectBusiness intelligencecze
dc.subjectData miningcze
dc.subjectPředzpracování datcze
dc.subjectLog souborycze
dc.subjectDélka referencícze
dc.titleInfluence of ratio of auxiliary pages on the pre-processing phase of web usage miningeng
dc.title.alternativeVliv poměru pomocných stránek na předzpracování fáze těžby využití webminingucze
dc.typeArticleeng
dspace.entity.typePublication

Soubory

Původní svazek

Nyní se zobrazuje 1 - 1 z 1
Načítá se...
Náhled
Název:
E+M.pdf
Velikost:
1.4 MB
Formát:
Adobe Portable Document Format