Selection of Suitable PageRank Calculation for Analysis of Differences Between Expected and Observed Probability of Accesses to Web Pages

Zobrazit minimální záznam

dc.contributor.author Kapusta, Jozef cze
dc.contributor.author Munk, Michal cze
dc.contributor.author Svec, Peter cze
dc.date.accessioned 2019-05-22T08:53:09Z
dc.date.available 2019-05-22T08:53:09Z
dc.date.issued 2018 eng
dc.identifier.isbn 978-3-030-03013-1 eng
dc.identifier.issn 0302-9743 eng
dc.identifier.uri https://hdl.handle.net/10195/72921
dc.description.abstract We describe various approaches how to calculate the value of PageRank in this paper. There are few methods how to calculate the PageRank, from the basic historical one to more enhanced versions. Most of them are using the original value of the damping factor. We describe the experiment we realised using our method for analysing differences between expected and observed probability of accesses to web pages of the selected portal. We used five slightly different methods for PageRank estimation using both the original value of damping factor and the value calculated from data in the web server log file. We assumed and confirmed that the estimation/calculation of the damping factor would have a significant impact on the estimation of the PageRank. We also wrongly assumed that the estimation/calculation of the damping factor would have a significant impact on the number of suspicious pages. We also compared the computational complexity of used PageRank methods, and the most effective method seems to be a method with the estimated value of the damping factor. eng
dc.format p. 139-150 eng
dc.language.iso eng eng
dc.publisher Springer eng
dc.relation.ispartof Multi-disciplinary Trends in Artificial Intelligence eng
dc.rights embargoed access eng
dc.subject Web usage mining eng
dc.subject Web structure mining eng
dc.subject PageRank eng
dc.subject Damping factor eng
dc.subject Support eng
dc.subject Observed visit rate eng
dc.subject Expected visit rate eng
dc.title Selection of Suitable PageRank Calculation for Analysis of Differences Between Expected and Observed Probability of Accesses to Web Pages eng
dc.title.alternative Výběr vhodného výpočtu PageRank pro analýzu rozdílů mezi očekávanou a zjištěnou pravděpodobností přístupu k webovým stránkám cze
dc.type ConferenceObject eng
dc.description.abstract-translated Popisujeme zde různé přístupy, jak vypočítat hodnotu PageRank. Existuje několik metod, jak vypočítat PageRank od základní historické až po vylepšené verze. Většina z nich používá původní hodnotu tlumícího faktoru. Popisujeme experiment, který jsme realizovali pomocí naší metody pro analýzu rozdílu mezi očekávanou a pozorovanou pravděpodobností přístupu na webové stránky vybraného portálu. Použili jsme pět mírně odlišných metod pro odhad PageRank pomocí původní hodnoty tlumícího faktoru a hodnoty vypočtené z dat v souboru protokolu webového serveru. Předpokládali jsme a potvrdili, že odhad / výpočet tlumícího faktoru by měl významný dopad na odhad PageRank. Nesprávně jsme také předpokládali, že odhad / výpočet tlumícího faktoru by měl významný dopad na počet podezřelých stránek. Porovnali jsme také výpočetní složitost použitých metod PageRank a nejefektivnější metoda se zdá být metodou s odhadovanou hodnotou tlumícího faktoru. cze
dc.event 12th International Conference on Multi-disciplinary Trends in Artificial Intelligence, MIWAI 2018 (18.11.2018 - 20.11.2018, Hanoj) eng
dc.peerreviewed yes eng
dc.publicationstatus postprint eng
dc.identifier.doi 10.1007/978-3-030-03014-8_12 eng
dc.relation.publisherversion https://link.springer.com/chapter/10.1007/978-3-030-03014-8_12 eng
dc.project.ID GA16-19590S/Analýza témat a sentimentu vícenásobných textových zdrojů pro finanční rozhodování eng
dc.identifier.scopus 2-s2.0-85057107915
dc.identifier.obd 39882302 eng


Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam

Vyhledávání


Rozšířené hledání

Procházet

Můj účet