Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Návrh robota pro automatické vyhledávání informací na Internetu týkajících se zvolených témat a jejich ukládání do databáze.

Bakalářská práceopen access
dc.contributor.advisorBrandejský, Tomáš
dc.contributor.authorZáleský, Zdeněk
dc.date.accepted2021-01-19
dc.date.accessioned2021-02-26T09:20:24Z
dc.date.available2021-02-26T09:20:24Z
dc.date.issued2021
dc.date.submitted2020-09-14
dc.description.abstractCílem projektu je navrhnout automatizovaný vyhledávač informací v prostředí Internetu vztahujících se ke vznikajícím společenským akcím a jejich ukládání do databáze. V práci se věnujeme morální a legální stránce této tematiky, vhodnými případy nasazení a dále jsou popsány některé postupy používající se v problematice web scrapingu, jako je například konfigurace a spuštění web crawlerů.cze
dc.description.abstract-translatedThe goal of the project is to design an automated program searching environment of the Internet that aims to search for information about new cultural events, its parsing and saving them into database. The thesis describes moral and legal aspect connected with the issue, suitable use cases of web scraping and then we cover some of the practices used in problematic of web scraping, such as using fulltext search engines, or configuring and running a web crawler.eng
dc.description.defenceCílem práce bylo navrhnout automatizovaný vyhledávač informací v prostředí Internetu vztahujících se ke zvoleným tématům( například počasí, kulturní a společenské akce, doprava apod.). Vedoucí vytkl práci několik drobností, na které student při obhajobě výborně reagoval a nejasnosti se snažil objasnit. Dle vedoucího práce se jedná o výbornou bakalářskou práci, kde student prokázal schopnost osvojit si znalosti nad rámec bakalářského studia a orientovat se v novém prostředí. Nejvyšší míra shody 21% byla při kontrole plagiátorství zjištěna u souboru middlewares.py. Ostatní soubory mají shodu pod 5%. Web spider je založen na unifikovaném prostředí Scrapy, proto je takováto míra shody očekávatelná. Vlastní text práce je též původní. Práce není plagiát.cze
dc.description.departmentFakulta elektrotechniky a informatikycze
dc.description.gradeDokončená práce s úspěšnou obhajoboucze
dc.format43 s.
dc.identifier.stag39414
dc.identifier.urihttps://hdl.handle.net/10195/76889
dc.language.isocze
dc.publisherUniverzita Pardubicecze
dc.rightsBez omezení
dc.subjectWeb scrapingcze
dc.subjectweb crawlingcze
dc.subjectbig datacze
dc.subjectScrapycze
dc.subjectPythoncze
dc.subjectApache Cassandracze
dc.subjectWeb scrapingeng
dc.subjectweb crawlingeng
dc.subjectbig dataeng
dc.subjectScrapyeng
dc.subjectPythoneng
dc.subjectApache Cassandraeng
dc.thesis.degree-disciplineInformační technologiecze
dc.thesis.degree-grantorUniverzita Pardubice. Fakulta elektrotechniky a informatikycze
dc.thesis.degree-nameBc.
dc.thesis.degree-programInformační technologiecze
dc.titleNávrh robota pro automatické vyhledávání informací na Internetu týkajících se zvolených témat a jejich ukládání do databáze.cze
dc.title.alternativeDesign of robot for automatic information seeking on the Internet related to choosen subjects and their store into database.eng
dc.typebakalářská prácecze
dspace.entity.typePublication

Soubory

Původní svazek

Nyní se zobrazuje 1 - 3 z 3
Načítá se...
Náhled
Název:
ZaleskyZ_NavrhRobota_TB_2020.pdf
Velikost:
1.04 MB
Formát:
Adobe Portable Document Format
Popis:
Plný text práce
Načítá se...
Náhled
Název:
ZaleskyZ_NavrhRobota_TB_prilohaBP_2020.zip
Velikost:
25.78 KB
Formát:
Unknown data format
Popis:
Plný text práce
Načítá se...
Náhled
Název:
Posudek_BrandejskyT_NavrhRobota_ZZ_2021.pdf
Velikost:
83.69 KB
Formát:
Adobe Portable Document Format
Popis:
Posudek vedoucího práce