dc.contributor.author |
Kapusta, Jozef
|
cze |
dc.contributor.author |
Munk, Michal
|
cze |
dc.contributor.author |
Svec, Peter
|
cze |
dc.date.accessioned |
2019-05-22T08:53:09Z |
|
dc.date.available |
2019-05-22T08:53:09Z |
|
dc.date.issued |
2018 |
eng |
dc.identifier.isbn |
978-3-030-03013-1 |
eng |
dc.identifier.issn |
0302-9743 |
eng |
dc.identifier.uri |
https://hdl.handle.net/10195/72921 |
|
dc.description.abstract |
We describe various approaches how to calculate the value of PageRank in this paper. There are few methods how to calculate the PageRank, from the basic historical one to more enhanced versions. Most of them are using the original value of the damping factor. We describe the experiment we realised using our method for analysing differences between expected and observed probability of accesses to web pages of the selected portal. We used five slightly different methods for PageRank estimation using both the original value of damping factor and the value calculated from data in the web server log file. We assumed and confirmed that the estimation/calculation of the damping factor would have a significant impact on the estimation of the PageRank. We also wrongly assumed that the estimation/calculation of the damping factor would have a significant impact on the number of suspicious pages. We also compared the computational complexity of used PageRank methods, and the most effective method seems to be a method with the estimated value of the damping factor. |
eng |
dc.format |
p. 139-150 |
eng |
dc.language.iso |
eng |
eng |
dc.publisher |
Springer |
eng |
dc.relation.ispartof |
Multi-disciplinary Trends in Artificial Intelligence |
eng |
dc.rights |
embargoed access |
eng |
dc.subject |
Web usage mining |
eng |
dc.subject |
Web structure mining |
eng |
dc.subject |
PageRank |
eng |
dc.subject |
Damping factor |
eng |
dc.subject |
Support |
eng |
dc.subject |
Observed visit rate |
eng |
dc.subject |
Expected visit rate |
eng |
dc.title |
Selection of Suitable PageRank Calculation for Analysis of Differences Between Expected and Observed Probability of Accesses to Web Pages |
eng |
dc.title.alternative |
Výběr vhodného výpočtu PageRank pro analýzu rozdílů mezi očekávanou a zjištěnou pravděpodobností přístupu k webovým stránkám |
cze |
dc.type |
ConferenceObject |
eng |
dc.description.abstract-translated |
Popisujeme zde různé přístupy, jak vypočítat hodnotu PageRank. Existuje několik metod, jak vypočítat PageRank od základní historické až po vylepšené verze. Většina z nich používá původní hodnotu tlumícího faktoru. Popisujeme experiment, který jsme realizovali pomocí naší metody pro analýzu rozdílu mezi očekávanou a pozorovanou pravděpodobností přístupu na webové stránky vybraného portálu. Použili jsme pět mírně odlišných metod pro odhad PageRank pomocí původní hodnoty tlumícího faktoru a hodnoty vypočtené z dat v souboru protokolu webového serveru. Předpokládali jsme a potvrdili, že odhad / výpočet tlumícího faktoru by měl významný dopad na odhad PageRank. Nesprávně jsme také předpokládali, že odhad / výpočet tlumícího faktoru by měl významný dopad na počet podezřelých stránek. Porovnali jsme také výpočetní složitost použitých metod PageRank a nejefektivnější metoda se zdá být metodou s odhadovanou hodnotou tlumícího faktoru. |
cze |
dc.event |
12th International Conference on Multi-disciplinary Trends in Artificial Intelligence, MIWAI 2018 (18.11.2018 - 20.11.2018, Hanoj) |
eng |
dc.peerreviewed |
yes |
eng |
dc.publicationstatus |
postprint |
eng |
dc.identifier.doi |
10.1007/978-3-030-03014-8_12 |
eng |
dc.relation.publisherversion |
https://link.springer.com/chapter/10.1007/978-3-030-03014-8_12 |
eng |
dc.project.ID |
GA16-19590S/Analýza témat a sentimentu vícenásobných textových zdrojů pro finanční rozhodování |
eng |
dc.identifier.scopus |
2-s2.0-85057107915 |
|
dc.identifier.obd |
39882302 |
eng |