Publikace: Text mining jako nástroj pro klasifikaci nevyžádané pošty
Diplomová práce| dc.contributor.advisor | Petr, Pavel | |
| dc.contributor.author | Lamr, Martin | |
| dc.contributor.referee | Komárková, Jitka | |
| dc.date.accepted | 2006 | |
| dc.date.accessioned | 2007-09-30T15:03:58Z | |
| dc.date.available | 2007-09-30T15:03:58Z | |
| dc.date.issued | 2006 | |
| dc.description.abstract | Diplomová práce se zabývá klasifikací textu, konkrétně nevyžádané pošty, která patří mezi nástroje text miningu. Výstupem této práce je ideový návrh systému pro detekci nevyžádané elektronické pošty. V teoretické části práce je uvedena problematika klasifikace textu a s ní spojených činností. Dále zde jsou charakterizovány klasifikační metody použité v této práci, mezi které byly zvoleny rozhodovací stromy ID3, CART, CHAID, QUEST, C5.0, ale také metoda založená na bayesovském klasifikátoru a neuronová síť. Praktická část se zabývá předzpracováním e-mailových zpráv a vytvořením vstupních souborů, které pak jsou klasifikovány vybranými metodami v prostředí Weka a Clementine. Nakonec je zvolena nejlepší klasifikační metoda a navrhnutý systém je ověřen. | cze |
| dc.description.abstract-translated | This thesis deals with spam classification. Text classification belongs to text mining methods. The ideological proposal of spam detection system is the output of the thesis. In the theoretical part of the thesis there are given problems associated with text classification. Then decision trees ID3, CART, QUEST, CHAID and C5.0 are characterized here as well as other alternative methods like neural network and Naive Bayes. The practical part deals with pre-processing of e-mails and an elaboration of input files which are used in classification methods within programs Weka and Clementine. Eventually the best classifier is chosen and then the proposal of spam detection system is verified. | cze |
| dc.description.department | Ústav systémového inženýrství a informatiky | cze |
| dc.description.grade | Dokončená práce s úspěšnou obhajobou | cze |
| dc.format | 77 s. | cze |
| dc.identifier | Univerzitní knihovna (sklad) | cze |
| dc.identifier.signature | D15102 | |
| dc.identifier.uri | https://hdl.handle.net/10195/26068 | |
| dc.language.iso | cze | |
| dc.publisher | Univerzita Pardubice | cze |
| dc.subject | Neural Networks | eng |
| dc.subject | Naive Bayes | eng |
| dc.subject | spams | eng |
| dc.subject | documents indexing | eng |
| dc.subject | neuronové sítě | cze |
| dc.subject | Naivní Bayesovy metody | cze |
| dc.subject | spamy | cze |
| dc.subject | indexace dokumentů | cze |
| dc.thesis.degree-discipline | Informatika ve veřejné správě | cze |
| dc.thesis.degree-grantor | Univerzita Pardubice. Fakulta ekonomicko-správní | cze |
| dc.thesis.degree-name | Ing. | cze |
| dc.thesis.degree-program | Systémové inženýrství a informatika | cze |
| dc.title | Text mining jako nástroj pro klasifikaci nevyžádané pošty | cze |
| dc.title.alternative | Using text mining for spam classification | cze |
| dc.type | diplomová práce | cze |
| dspace.entity.type | Publication |