Extrakce informace z textových dokumentů pro potřeby České obchodní inspekce

Rejmont, Lukáš

Digitální knihovna UPCE
→
Fakulta ekonomicko-správní / Faculty of Economics and Administration
→
Ústav systémového inženýrství a informatiky / Institute of System Engineering and Informatics
→
Diplomové práce / Theses ÚSII FES (Ing.)
→
Zobrazit záznam

dc.contributor.advisor	Hájek, Petr
dc.contributor.author	Rejmont, Lukáš
dc.date.accessioned	2019-02-11T13:23:59Z
dc.date.available	2019-02-11T13:23:59Z
dc.date.issued	2019
dc.date.submitted	2018-12-13
dc.identifier	Univerzitní knihovna (studovna)
dc.identifier.uri	https://hdl.handle.net/10195/72054
dc.description.abstract	Cílem práce je charakterizovat současné přístupy k extrakci informací z textu a aplikovat je na textových dokumentech pro potřeby České obchodní inspekce. První část práce je zaměřená na jednotlivé techniky extrakce informací z textových dokumentů. Tyto techniky jsou následně využity v druhé části práce, která se věnuje předzpracování dokumentů, návrhu jmenných entit pro extrakci a asociaci jmenných entit s ohledem na využitelnost Českou obchodní inspekcí. V samotném závěru práce je provedeno zhodnocení získaných výsledků.	cze
dc.format	82 s.
dc.language.iso	cze
dc.publisher	Univerzita Pardubice	cze
dc.rights	Bez omezení
dc.subject	extrakce informací	cze
dc.subject	umělá inteligence	cze
dc.subject	zpracování přirozeného jazyka	cze
dc.subject	jmenné entity	cze
dc.subject	Information extraction	eng
dc.subject	artificial intelligence	eng
dc.subject	natural language processing	eng
dc.subject	named entity	eng
dc.title	Extrakce informace z textových dokumentů pro potřeby České obchodní inspekce	cze
dc.title.alternative	Extracting information from text documents for the needs of the Czech Trade Inspection	eng
dc.type	diplomová práce	cze
dc.contributor.referee	Kopáčková, Hana
dc.date.accepted	2019-01-23
dc.description.abstract-translated	The goal of this thesis is to characterize current approaches of the Information Extraction from text and apply them on text documents for the Czech trade inspection needs. The first part is focused on individual techniques of information extraction from the text documents. These techniques are used in the second part of this thesis, which focused on preprocessing documents, proposal of named entity for extraction and association with regard to usability of Czech trade inspection. At the end of this thesis the obtained results are evaluated.	eng
dc.description.department	Fakulta ekonomicko-správní	cze
dc.thesis.degree-discipline	Informatika ve veřejné správě	cze
dc.thesis.degree-name	Ing.
dc.thesis.degree-grantor	Univerzita Pardubice. Fakulta ekonomicko-správní	cze
dc.identifier.signature	D38908
dc.thesis.degree-program	Systémové inženýrství a informatika	cze
dc.description.defence	Student představil základní teze své diplomové práce. Uvedl cíl diplomové práce, způsob řešení a prezentoval výsledky, kterých dosáhl. V rámci rozpravy odpověděl na tyto otázky: Diskutujte omezení navrženého systému a jeho další možná rozšíření. Na str. 15 píšete, že nejpravděpodobnější stem daného slova je pak nalezen na základě naučených pravidel. Z výše uvedeného jsou patrné hlavní výhody této metody, není nutná spolupráce jazykového experta či tvorba pravidel. Prosím vysvětlete, zda se pravidla používají nebo ne, z daného textu to není patrné. Ve své práci používáte nástroj, který neumí pracovat s českými texty. Jaký nástroj byste tedy doporučil zaměstnancům České obchodní inspekce pro extrakci entit? Na obrázku 19 jsou jako entity pro entitní typ LOCATION nalezeny dvě různé adresy, jak pozná uživatel, kterou adresu použít? Následně proběhla rozprava k diplomové práci, při které student odpověděl na následující otázky komise. Student vytvořil model pro extrakci, jaké součásti má tento model? Bylo by náročné vytvořit vlastní aplikaci pro extrakci textu využitelnou v českém prostředí? Spolupracoval jste s Českou obchodní inspekcí přímo nebo se jednalo pouze o předpoklad, že by výsledky využila (potřebovala)? Jaké součásti má Vámi vytvořený model? Student reagoval pohotově a diplomovou práci obhájil.	cze
dc.identifier.stag	34394
dc.description.grade	Dokončená práce s úspěšnou obhajobou	cze