Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Extrakce informace z textových dokumentů pro potřeby České obchodní inspekce

Diplomová práceopen access
dc.contributor.advisorHájek, Petr
dc.contributor.authorRejmont, Lukáš
dc.contributor.refereeKopáčková, Hana
dc.date.accepted2019-01-23
dc.date.accessioned2019-02-11T13:23:59Z
dc.date.available2019-02-11T13:23:59Z
dc.date.issued2019
dc.date.submitted2018-12-13
dc.description.abstractCílem práce je charakterizovat současné přístupy k extrakci informací z textu a aplikovat je na textových dokumentech pro potřeby České obchodní inspekce. První část práce je zaměřená na jednotlivé techniky extrakce informací z textových dokumentů. Tyto techniky jsou následně využity v druhé části práce, která se věnuje předzpracování dokumentů, návrhu jmenných entit pro extrakci a asociaci jmenných entit s ohledem na využitelnost Českou obchodní inspekcí. V samotném závěru práce je provedeno zhodnocení získaných výsledků.cze
dc.description.abstract-translatedThe goal of this thesis is to characterize current approaches of the Information Extraction from text and apply them on text documents for the Czech trade inspection needs. The first part is focused on individual techniques of information extraction from the text documents. These techniques are used in the second part of this thesis, which focused on preprocessing documents, proposal of named entity for extraction and association with regard to usability of Czech trade inspection. At the end of this thesis the obtained results are evaluated.eng
dc.description.defenceStudent představil základní teze své diplomové práce. Uvedl cíl diplomové práce, způsob řešení a prezentoval výsledky, kterých dosáhl. V rámci rozpravy odpověděl na tyto otázky: Diskutujte omezení navrženého systému a jeho další možná rozšíření. Na str. 15 píšete, že nejpravděpodobnější stem daného slova je pak nalezen na základě naučených pravidel. Z výše uvedeného jsou patrné hlavní výhody této metody, není nutná spolupráce jazykového experta či tvorba pravidel. Prosím vysvětlete, zda se pravidla používají nebo ne, z daného textu to není patrné. Ve své práci používáte nástroj, který neumí pracovat s českými texty. Jaký nástroj byste tedy doporučil zaměstnancům České obchodní inspekce pro extrakci entit? Na obrázku 19 jsou jako entity pro entitní typ LOCATION nalezeny dvě různé adresy, jak pozná uživatel, kterou adresu použít? Následně proběhla rozprava k diplomové práci, při které student odpověděl na následující otázky komise. Student vytvořil model pro extrakci, jaké součásti má tento model? Bylo by náročné vytvořit vlastní aplikaci pro extrakci textu využitelnou v českém prostředí? Spolupracoval jste s Českou obchodní inspekcí přímo nebo se jednalo pouze o předpoklad, že by výsledky využila (potřebovala)? Jaké součásti má Vámi vytvořený model? Student reagoval pohotově a diplomovou práci obhájil.cze
dc.description.departmentFakulta ekonomicko-správnícze
dc.description.gradeDokončená práce s úspěšnou obhajoboucze
dc.format82 s.
dc.identifierUniverzitní knihovna (studovna)
dc.identifier.signatureD38908
dc.identifier.stag34394
dc.identifier.urihttps://hdl.handle.net/10195/72054
dc.language.isocze
dc.publisherUniverzita Pardubicecze
dc.rightsBez omezení
dc.subjectextrakce informacícze
dc.subjectumělá inteligencecze
dc.subjectzpracování přirozeného jazykacze
dc.subjectjmenné entitycze
dc.subjectInformation extractioneng
dc.subjectartificial intelligenceeng
dc.subjectnatural language processingeng
dc.subjectnamed entityeng
dc.thesis.degree-disciplineInformatika ve veřejné správěcze
dc.thesis.degree-grantorUniverzita Pardubice. Fakulta ekonomicko-správnícze
dc.thesis.degree-nameIng.
dc.thesis.degree-programSystémové inženýrství a informatikacze
dc.titleExtrakce informace z textových dokumentů pro potřeby České obchodní inspekcecze
dc.title.alternativeExtracting information from text documents for the needs of the Czech Trade Inspectioneng
dc.typediplomová prácecze
dspace.entity.typePublication

Soubory

Původní svazek

Nyní se zobrazuje 1 - 3 z 3
Načítá se...
Náhled
Název:
RejmontL_ExtrakceInformace_PH_2019.pdf
Velikost:
2.61 MB
Formát:
Adobe Portable Document Format
Popis:
Plný text práce
Načítá se...
Náhled
Název:
HajekP_ExtrakceInformace_LR_2018.pdf
Velikost:
666 KB
Formát:
Adobe Portable Document Format
Popis:
Posudek vedoucího práce
Načítá se...
Náhled
Název:
KopackovaH_ExtrakceInformace_LR_2018.pdf
Velikost:
559.35 KB
Formát:
Adobe Portable Document Format
Popis:
Posudek oponenta práce