Návrh robota pro automatické vyhledávání informací na Internetu týkajících se zvolených témat a jejich ukládání do databáze.

Zobrazit minimální záznam

dc.contributor.advisor Brandejský, Tomáš
dc.contributor.author Záleský, Zdeněk
dc.date.accessioned 2021-02-26T09:20:24Z
dc.date.available 2021-02-26T09:20:24Z
dc.date.issued 2021
dc.date.submitted 2020-09-14
dc.identifier.uri https://hdl.handle.net/10195/76889
dc.description.abstract Cílem projektu je navrhnout automatizovaný vyhledávač informací v prostředí Internetu vztahujících se ke vznikajícím společenským akcím a jejich ukládání do databáze. V práci se věnujeme morální a legální stránce této tematiky, vhodnými případy nasazení a dále jsou popsány některé postupy používající se v problematice web scrapingu, jako je například konfigurace a spuštění web crawlerů. cze
dc.format 43 s.
dc.language.iso cze
dc.publisher Univerzita Pardubice cze
dc.rights Bez omezení
dc.subject Web scraping cze
dc.subject web crawling cze
dc.subject big data cze
dc.subject Scrapy cze
dc.subject Python cze
dc.subject Apache Cassandra cze
dc.subject Web scraping eng
dc.subject web crawling eng
dc.subject big data eng
dc.subject Scrapy eng
dc.subject Python eng
dc.subject Apache Cassandra eng
dc.title Návrh robota pro automatické vyhledávání informací na Internetu týkajících se zvolených témat a jejich ukládání do databáze. cze
dc.title.alternative Design of robot for automatic information seeking on the Internet related to choosen subjects and their store into database. eng
dc.type bakalářská práce cze
dc.date.accepted 2021-01-19
dc.description.abstract-translated The goal of the project is to design an automated program searching environment of the Internet that aims to search for information about new cultural events, its parsing and saving them into database. The thesis describes moral and legal aspect connected with the issue, suitable use cases of web scraping and then we cover some of the practices used in problematic of web scraping, such as using fulltext search engines, or configuring and running a web crawler. eng
dc.description.department Fakulta elektrotechniky a informatiky cze
dc.thesis.degree-discipline Informační technologie cze
dc.thesis.degree-name Bc.
dc.thesis.degree-grantor Univerzita Pardubice. Fakulta elektrotechniky a informatiky cze
dc.thesis.degree-program Informační technologie cze
dc.description.defence Cílem práce bylo navrhnout automatizovaný vyhledávač informací v prostředí Internetu vztahujících se ke zvoleným tématům( například počasí, kulturní a společenské akce, doprava apod.). Vedoucí vytkl práci několik drobností, na které student při obhajobě výborně reagoval a nejasnosti se snažil objasnit. Dle vedoucího práce se jedná o výbornou bakalářskou práci, kde student prokázal schopnost osvojit si znalosti nad rámec bakalářského studia a orientovat se v novém prostředí. Nejvyšší míra shody 21% byla při kontrole plagiátorství zjištěna u souboru middlewares.py. Ostatní soubory mají shodu pod 5%. Web spider je založen na unifikovaném prostředí Scrapy, proto je takováto míra shody očekávatelná. Vlastní text práce je též původní. Práce není plagiát. cze
dc.identifier.stag 39414
dc.description.grade Dokončená práce s úspěšnou obhajobou cze


Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam

Vyhledávání


Rozšířené hledání

Procházet

Můj účet