Návrh robota pro automatické vyhledávání informací na Internetu týkajících se zvolených témat a jejich ukládání do databáze.

Záleský, Zdeněk

Digitální knihovna UPCE
→
Fakulta elektrotechniky a informatiky / Faculty of Electrical Engineering and Informatics
→
Katedra informačních technologií
→
Bakalářské práce / Bachelor's works KIT FEI (Bc.)
→
Zobrazit záznam

dc.contributor.advisor	Brandejský, Tomáš
dc.contributor.author	Záleský, Zdeněk
dc.date.accessioned	2021-02-26T09:20:24Z
dc.date.available	2021-02-26T09:20:24Z
dc.date.issued	2021
dc.date.submitted	2020-09-14
dc.identifier.uri	https://hdl.handle.net/10195/76889
dc.description.abstract	Cílem projektu je navrhnout automatizovaný vyhledávač informací v prostředí Internetu vztahujících se ke vznikajícím společenským akcím a jejich ukládání do databáze. V práci se věnujeme morální a legální stránce této tematiky, vhodnými případy nasazení a dále jsou popsány některé postupy používající se v problematice web scrapingu, jako je například konfigurace a spuštění web crawlerů.	cze
dc.format	43 s.
dc.language.iso	cze
dc.publisher	Univerzita Pardubice	cze
dc.rights	Bez omezení
dc.subject	Web scraping	cze
dc.subject	web crawling	cze
dc.subject	big data	cze
dc.subject	Scrapy	cze
dc.subject	Python	cze
dc.subject	Apache Cassandra	cze
dc.subject	Web scraping	eng
dc.subject	web crawling	eng
dc.subject	big data	eng
dc.subject	Scrapy	eng
dc.subject	Python	eng
dc.subject	Apache Cassandra	eng
dc.title	Návrh robota pro automatické vyhledávání informací na Internetu týkajících se zvolených témat a jejich ukládání do databáze.	cze
dc.title.alternative	Design of robot for automatic information seeking on the Internet related to choosen subjects and their store into database.	eng
dc.type	bakalářská práce	cze
dc.date.accepted	2021-01-19
dc.description.abstract-translated	The goal of the project is to design an automated program searching environment of the Internet that aims to search for information about new cultural events, its parsing and saving them into database. The thesis describes moral and legal aspect connected with the issue, suitable use cases of web scraping and then we cover some of the practices used in problematic of web scraping, such as using fulltext search engines, or configuring and running a web crawler.	eng
dc.description.department	Fakulta elektrotechniky a informatiky	cze
dc.thesis.degree-discipline	Informační technologie	cze
dc.thesis.degree-name	Bc.
dc.thesis.degree-grantor	Univerzita Pardubice. Fakulta elektrotechniky a informatiky	cze
dc.thesis.degree-program	Informační technologie	cze
dc.description.defence	Cílem práce bylo navrhnout automatizovaný vyhledávač informací v prostředí Internetu vztahujících se ke zvoleným tématům( například počasí, kulturní a společenské akce, doprava apod.). Vedoucí vytkl práci několik drobností, na které student při obhajobě výborně reagoval a nejasnosti se snažil objasnit. Dle vedoucího práce se jedná o výbornou bakalářskou práci, kde student prokázal schopnost osvojit si znalosti nad rámec bakalářského studia a orientovat se v novém prostředí. Nejvyšší míra shody 21% byla při kontrole plagiátorství zjištěna u souboru middlewares.py. Ostatní soubory mají shodu pod 5%. Web spider je založen na unifikovaném prostředí Scrapy, proto je takováto míra shody očekávatelná. Vlastní text práce je též původní. Práce není plagiát.	cze
dc.identifier.stag	39414
dc.description.grade	Dokončená práce s úspěšnou obhajobou	cze