dc.contributor.advisor |
Hájek, Petr |
|
dc.contributor.author |
Rejmont, Lukáš
|
|
dc.date.accessioned |
2019-02-11T13:23:59Z |
|
dc.date.available |
2019-02-11T13:23:59Z |
|
dc.date.issued |
2019 |
|
dc.date.submitted |
2018-12-13 |
|
dc.identifier |
Univerzitní knihovna (studovna) |
|
dc.identifier.uri |
https://hdl.handle.net/10195/72054 |
|
dc.description.abstract |
Cílem práce je charakterizovat současné přístupy k extrakci informací z textu a aplikovat je na textových dokumentech pro potřeby České obchodní inspekce. První část práce je zaměřená na jednotlivé techniky extrakce informací z textových dokumentů. Tyto techniky jsou následně využity v druhé části práce, která se věnuje předzpracování dokumentů, návrhu jmenných entit pro extrakci a asociaci jmenných entit s ohledem na využitelnost Českou obchodní inspekcí. V samotném závěru práce je provedeno zhodnocení získaných výsledků. |
cze |
dc.format |
82 s. |
|
dc.language.iso |
cze |
|
dc.publisher |
Univerzita Pardubice |
cze |
dc.rights |
Bez omezení |
|
dc.subject |
extrakce informací |
cze |
dc.subject |
umělá inteligence |
cze |
dc.subject |
zpracování přirozeného jazyka |
cze |
dc.subject |
jmenné entity |
cze |
dc.subject |
Information extraction |
eng |
dc.subject |
artificial intelligence |
eng |
dc.subject |
natural language processing |
eng |
dc.subject |
named entity |
eng |
dc.title |
Extrakce informace z textových dokumentů pro potřeby České obchodní inspekce |
cze |
dc.title.alternative |
Extracting information from text documents for the needs of the Czech Trade Inspection |
eng |
dc.type |
diplomová práce |
cze |
dc.contributor.referee |
Kopáčková, Hana |
|
dc.date.accepted |
2019-01-23 |
|
dc.description.abstract-translated |
The goal of this thesis is to characterize current approaches of the Information Extraction from text and apply them on text documents for the Czech trade inspection needs. The first part is focused on individual techniques of information extraction from the text documents. These techniques are used in the second part of this thesis, which focused on preprocessing documents, proposal of named entity for extraction and association with regard to usability of Czech trade inspection. At the end of this thesis the obtained results are evaluated. |
eng |
dc.description.department |
Fakulta ekonomicko-správní |
cze |
dc.thesis.degree-discipline |
Informatika ve veřejné správě |
cze |
dc.thesis.degree-name |
Ing. |
|
dc.thesis.degree-grantor |
Univerzita Pardubice. Fakulta ekonomicko-správní |
cze |
dc.identifier.signature |
D38908 |
|
dc.thesis.degree-program |
Systémové inženýrství a informatika |
cze |
dc.description.defence |
Student představil základní teze své diplomové práce. Uvedl cíl diplomové práce, způsob řešení a prezentoval výsledky, kterých dosáhl. V rámci rozpravy odpověděl na tyto otázky:
Diskutujte omezení navrženého systému a jeho další možná rozšíření. Na str. 15 píšete, že nejpravděpodobnější stem daného slova je pak nalezen na základě naučených pravidel. Z výše uvedeného jsou patrné hlavní výhody této metody, není nutná spolupráce jazykového experta či tvorba pravidel. Prosím vysvětlete, zda se pravidla používají nebo ne, z daného textu to není patrné. Ve své práci používáte nástroj, který neumí pracovat s českými texty. Jaký nástroj byste tedy doporučil zaměstnancům České obchodní inspekce pro extrakci entit? Na obrázku 19 jsou jako entity pro entitní typ LOCATION nalezeny dvě různé adresy, jak pozná uživatel, kterou adresu použít?
Následně proběhla rozprava k diplomové práci, při které student odpověděl na následující otázky komise. Student vytvořil model pro extrakci, jaké součásti má tento model? Bylo by náročné vytvořit vlastní aplikaci pro extrakci textu využitelnou v českém prostředí? Spolupracoval jste s Českou obchodní inspekcí přímo nebo se jednalo pouze o předpoklad, že by výsledky využila (potřebovala)? Jaké součásti má Vámi vytvořený model? Student reagoval pohotově a diplomovou práci obhájil. |
cze |
dc.identifier.stag |
34394 |
|
dc.description.grade |
Dokončená práce s úspěšnou obhajobou |
cze |