Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Datamining výsledků experimentů

Diplomová práceopen access
dc.contributor.advisorBrandejský, Tomáš
dc.contributor.authorBárta, Martin
dc.contributor.refereeKokeš, Josef
dc.date.accepted2020-09-15
dc.date.accessioned2020-09-16T14:18:22Z
dc.date.available2020-09-16T14:18:22Z
dc.date.issued2020
dc.date.submitted2020-08-20
dc.description.abstractPředmětem této diplomové práce je představit způsob, jakým lze pracovat a analyzovat výsledky experimentů, jež generují velmi obsáhlé datové sady. Pro tuto úlohu jsou využity analytické nástroje pro velká data. Pomocí těchto nástrojů je zařízeno načtení dat, které je následováno hledáním užitečných informací a jejich následným zobrazením v přívětivé formě vizualizované pomocí tabulek a grafů. V teoretické části je vysvětlen proces a techniky dolovaní dat společně s představením nástrojů použitelných pro tento úkol. Praktická část pak obsahuje postup analyzování dat s pomocí nástroje Apache Spark u vzorové datové sady získané při běhu algoritmu symbolické regrese za pomocí nástroje Apache Spark.cze
dc.description.abstract-translatedThe main subject of this diploma thesis is to introduce a way how to work and analyze the results of experiments which generate very big data sets. For this purpose, are used Big Data analytics tools. By using these tools, it is possible to load the data which is followed by the searching for the useful information which is later visualized in form of charts and data tables. There is explanation of data mining process and its techniques together with the introduction of tools usable for this task. Practical part contains solution of analyzing data using the Apache Spark on the example data set which was obtained by running symbolic regression algorithm.eng
dc.description.defenceDiplomant na základě své znalosti programování, operačních systémů Linux a Windows, databází a algoritmizace implementoval v jazyce Scala v prostředí Appache Spark určeném pro práci s Big data prostředí a algoritmy pro vyhodnocení výsledků velmi rozsáhlého souboru experimentů z oblasti genetického programování. Práci považuji za zdařilou, velmi obsáhlou a zabývající se na diplomovou práci velmi rozsáhlou problémovou oblastí, kterou se z pohledu nároků na diplomovou práci podařilo diplomantovi zvládnout. Kontrola plagiátorství zřejmě díky nepříliš frekventovanému tématu, použitým knihovnám a neobvyklému programovacímu jazyku uvedla neuvěřitelnou míru shody 0%, proto můžeme práci považovat za zcela původní. Oponent celkově diplomovou práci hodnotí jako kvalitní. Diplomant prokázal, že se umí orientovat ve složitém prostředí práce s velkými daty, a to nejen teoreticky, ale především prakticky. Velmi oceňuji, že se mu podařilo vyřešit všechny problémy, ke kterým v praktickém použití došlo. Zejména ta část, ve které došlo k selhání při pokusu načítat a zpracovávat data z objemné databázové tabulky, svědčí o důkladném zvládnutí technologie diplomantem. Mimoto, vyřešení problému načítáním dat po částech pomocí integrovaných funkcí Apache Spark je dosti obtížné a je jasným důkazem, že diplomant úlohu zvládl na úrovni, která je vyšší, než je běžně od studentů požadováno. Diplomová práce byla vypracována na velmi vysoké úrovni. Položené otázky byly odpovězeny k spokojenosti komise. Práce byla zkontrolována v systému IS/STAG, dle hodnocení komise nejeví známkycze
dc.description.departmentFakulta elektrotechniky a informatikycze
dc.description.gradeDokončená práce s úspěšnou obhajoboucze
dc.format83 s.
dc.identifier.stag39203
dc.identifier.urihttps://hdl.handle.net/10195/76148
dc.language.isocze
dc.publisherUniverzita Pardubicecze
dc.rightsBez omezení
dc.subjectdolování datcze
dc.subjectdatová sadacze
dc.subjectvelká datacze
dc.subjectvizualizacecze
dc.subjectdatová analýzacze
dc.subjectApache Sparkcze
dc.subjectData Miningeng
dc.subjectdata seteng
dc.subjectBig Dataeng
dc.subjectvisualizationeng
dc.subjectdata analysiseng
dc.subjectApache Sparkeng
dc.thesis.degree-disciplineInformační technologiecze
dc.thesis.degree-grantorUniverzita Pardubice. Fakulta elektrotechniky a informatikycze
dc.thesis.degree-nameIng.
dc.thesis.degree-programInformační technologiecze
dc.titleDatamining výsledků experimentůcze
dc.title.alternativeExperiment Results Dataminingeng
dc.typediplomová prácecze
dspace.entity.typePublication

Soubory

Původní svazek

Nyní se zobrazuje 1 - 4 z 4
Načítá se...
Náhled
Název:
BartaM_DataminingVysledku_TB_2020.pdf
Velikost:
28.7 MB
Formát:
Adobe Portable Document Format
Popis:
Plný text práce
Načítá se...
Náhled
Název:
BartaM_DataminingVysledku_TB_2020.zip
Velikost:
115.84 MB
Formát:
Unknown data format
Popis:
Přílohy DP
Načítá se...
Náhled
Název:
Posudek_BrandejskyT_DataminingVysledku_MB_2020.pdf
Velikost:
21.98 KB
Formát:
Adobe Portable Document Format
Popis:
Posudek vedoucího práce
Načítá se...
Náhled
Název:
PosudekOponent_KokesJ_DataminingVysledku_MB_2020.pdf
Velikost:
129.95 KB
Formát:
Adobe Portable Document Format
Popis:
Posudek oponenta práce