dc.contributor.advisor |
Brandejský, Tomáš |
|
dc.contributor.author |
Záleský, Zdeněk
|
|
dc.date.accessioned |
2021-02-26T09:20:24Z |
|
dc.date.available |
2021-02-26T09:20:24Z |
|
dc.date.issued |
2021 |
|
dc.date.submitted |
2020-09-14 |
|
dc.identifier.uri |
https://hdl.handle.net/10195/76889 |
|
dc.description.abstract |
Cílem projektu je navrhnout automatizovaný vyhledávač informací v prostředí Internetu vztahujících se ke vznikajícím společenským akcím a jejich ukládání do databáze. V práci se věnujeme morální a legální stránce této tematiky, vhodnými případy nasazení a dále jsou popsány některé postupy používající se v problematice web scrapingu, jako je například konfigurace a spuštění web crawlerů. |
cze |
dc.format |
43 s. |
|
dc.language.iso |
cze |
|
dc.publisher |
Univerzita Pardubice |
cze |
dc.rights |
Bez omezení |
|
dc.subject |
Web scraping |
cze |
dc.subject |
web crawling |
cze |
dc.subject |
big data |
cze |
dc.subject |
Scrapy |
cze |
dc.subject |
Python |
cze |
dc.subject |
Apache Cassandra |
cze |
dc.subject |
Web scraping |
eng |
dc.subject |
web crawling |
eng |
dc.subject |
big data |
eng |
dc.subject |
Scrapy |
eng |
dc.subject |
Python |
eng |
dc.subject |
Apache Cassandra |
eng |
dc.title |
Návrh robota pro automatické vyhledávání informací na Internetu týkajících se zvolených témat a jejich ukládání do databáze. |
cze |
dc.title.alternative |
Design of robot for automatic information seeking on the Internet related to choosen subjects and their store into database. |
eng |
dc.type |
bakalářská práce |
cze |
dc.date.accepted |
2021-01-19 |
|
dc.description.abstract-translated |
The goal of the project is to design an automated program searching environment of the Internet that aims to search for information about new cultural events, its parsing and saving them into database. The thesis describes moral and legal aspect connected with the issue, suitable use cases of web scraping and then we cover some of the practices used in problematic of web scraping, such as using fulltext search engines, or configuring and running a web crawler. |
eng |
dc.description.department |
Fakulta elektrotechniky a informatiky |
cze |
dc.thesis.degree-discipline |
Informační technologie |
cze |
dc.thesis.degree-name |
Bc. |
|
dc.thesis.degree-grantor |
Univerzita Pardubice. Fakulta elektrotechniky a informatiky |
cze |
dc.thesis.degree-program |
Informační technologie |
cze |
dc.description.defence |
Cílem práce bylo navrhnout automatizovaný vyhledávač informací v prostředí Internetu vztahujících se ke zvoleným tématům( například počasí, kulturní a společenské akce, doprava apod.).
Vedoucí vytkl práci několik drobností, na které student při obhajobě výborně reagoval a nejasnosti se snažil objasnit. Dle vedoucího práce se jedná o výbornou bakalářskou práci, kde student prokázal schopnost osvojit si znalosti nad rámec bakalářského studia a orientovat se v novém prostředí.
Nejvyšší míra shody 21% byla při kontrole plagiátorství zjištěna u souboru middlewares.py. Ostatní soubory mají shodu pod 5%. Web spider je založen na unifikovaném prostředí Scrapy, proto je takováto míra shody očekávatelná. Vlastní text práce je též původní. Práce není plagiát. |
cze |
dc.identifier.stag |
39414 |
|
dc.description.grade |
Dokončená práce s úspěšnou obhajobou |
cze |