Zobrazit minimální záznam
dc.contributor.advisor |
Brandejský, Tomáš |
|
dc.contributor.author |
Bárta, Martin
|
|
dc.date.accessioned |
2020-09-16T14:18:22Z |
|
dc.date.available |
2020-09-16T14:18:22Z |
|
dc.date.issued |
2020 |
|
dc.date.submitted |
2020-08-20 |
|
dc.identifier.uri |
https://hdl.handle.net/10195/76148 |
|
dc.description.abstract |
Předmětem této diplomové práce je představit způsob, jakým lze pracovat a analyzovat výsledky experimentů, jež generují velmi obsáhlé datové sady. Pro tuto úlohu jsou využity analytické nástroje pro velká data. Pomocí těchto nástrojů je zařízeno načtení dat, které je následováno hledáním užitečných informací a jejich následným zobrazením v přívětivé formě vizualizované pomocí tabulek a grafů. V teoretické části je vysvětlen proces a techniky dolovaní dat společně s představením nástrojů použitelných pro tento úkol. Praktická část pak obsahuje postup analyzování dat s pomocí nástroje Apache Spark u vzorové datové sady získané při běhu algoritmu symbolické regrese za pomocí nástroje Apache Spark. |
cze |
dc.format |
83 s. |
|
dc.language.iso |
cze |
|
dc.publisher |
Univerzita Pardubice |
cze |
dc.rights |
Bez omezení |
|
dc.subject |
dolování dat |
cze |
dc.subject |
datová sada |
cze |
dc.subject |
velká data |
cze |
dc.subject |
vizualizace |
cze |
dc.subject |
datová analýza |
cze |
dc.subject |
Apache Spark |
cze |
dc.subject |
Data Mining |
eng |
dc.subject |
data set |
eng |
dc.subject |
Big Data |
eng |
dc.subject |
visualization |
eng |
dc.subject |
data analysis |
eng |
dc.subject |
Apache Spark |
eng |
dc.title |
Datamining výsledků experimentů |
cze |
dc.title.alternative |
Experiment Results Datamining |
eng |
dc.type |
diplomová práce |
cze |
dc.contributor.referee |
Kokeš, Josef |
|
dc.date.accepted |
2020-09-15 |
|
dc.description.abstract-translated |
The main subject of this diploma thesis is to introduce a way how to work and analyze the results of experiments which generate very big data sets. For this purpose, are used Big Data analytics tools. By using these tools, it is possible to load the data which is followed by the searching for the useful information which is later visualized in form of charts and data tables. There is explanation of data mining process and its techniques together with the introduction of tools usable for this task. Practical part contains solution of analyzing data using the Apache Spark on the example data set which was obtained by running symbolic regression algorithm. |
eng |
dc.description.department |
Fakulta elektrotechniky a informatiky |
cze |
dc.thesis.degree-discipline |
Informační technologie |
cze |
dc.thesis.degree-name |
Ing. |
|
dc.thesis.degree-grantor |
Univerzita Pardubice. Fakulta elektrotechniky a informatiky |
cze |
dc.thesis.degree-program |
Informační technologie |
cze |
dc.description.defence |
Diplomant na základě své znalosti programování, operačních systémů Linux a Windows, databází a algoritmizace implementoval v jazyce Scala v prostředí Appache Spark určeném pro práci s Big data prostředí a algoritmy pro vyhodnocení výsledků velmi rozsáhlého souboru experimentů z oblasti genetického programování. Práci považuji za zdařilou, velmi obsáhlou a zabývající se na diplomovou práci velmi rozsáhlou problémovou oblastí, kterou se z pohledu nároků na diplomovou práci podařilo diplomantovi zvládnout.
Kontrola plagiátorství zřejmě díky nepříliš frekventovanému tématu, použitým knihovnám a neobvyklému programovacímu jazyku uvedla neuvěřitelnou míru shody 0%, proto můžeme práci považovat za zcela původní.
Oponent celkově diplomovou práci hodnotí jako kvalitní. Diplomant prokázal, že se umí orientovat ve
složitém prostředí práce s velkými daty, a to nejen teoreticky, ale především prakticky. Velmi oceňuji, že se mu podařilo vyřešit všechny problémy, ke kterým v praktickém použití došlo. Zejména ta část, ve které došlo k selhání při pokusu načítat a zpracovávat data z objemné databázové tabulky, svědčí o důkladném zvládnutí technologie diplomantem. Mimoto, vyřešení problému načítáním dat po částech pomocí integrovaných funkcí Apache Spark je dosti obtížné a je jasným důkazem, že diplomant úlohu zvládl na úrovni, která je vyšší, než je běžně od studentů požadováno.
Diplomová práce byla vypracována na velmi vysoké úrovni. Položené otázky byly odpovězeny k spokojenosti komise.
Práce byla zkontrolována v systému IS/STAG, dle hodnocení komise nejeví známky |
cze |
dc.identifier.stag |
39203 |
|
dc.description.grade |
Dokončená práce s úspěšnou obhajobou |
cze |
Tento záznam se objevuje v následujících kolekcích
Zobrazit minimální záznam
|
Vyhledávání
Procházet
-
Vše v Digitální knihovně
-
Tato kolekce
Můj účet
|