Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Text mining jako nástroj pro klasifikaci nevyžádané pošty

Diplomová práce
dc.contributor.advisorPetr, Pavel
dc.contributor.authorLamr, Martin
dc.contributor.refereeKomárková, Jitka
dc.date.accepted2006
dc.date.accessioned2007-09-30T15:03:58Z
dc.date.available2007-09-30T15:03:58Z
dc.date.issued2006
dc.description.abstractDiplomová práce se zabývá klasifikací textu, konkrétně nevyžádané pošty, která patří mezi nástroje text miningu. Výstupem této práce je ideový návrh systému pro detekci nevyžádané elektronické pošty. V teoretické části práce je uvedena problematika klasifikace textu a s ní spojených činností. Dále zde jsou charakterizovány klasifikační metody použité v této práci, mezi které byly zvoleny rozhodovací stromy ID3, CART, CHAID, QUEST, C5.0, ale také metoda založená na bayesovském klasifikátoru a neuronová síť. Praktická část se zabývá předzpracováním e-mailových zpráv a vytvořením vstupních souborů, které pak jsou klasifikovány vybranými metodami v prostředí Weka a Clementine. Nakonec je zvolena nejlepší klasifikační metoda a navrhnutý systém je ověřen.cze
dc.description.abstract-translatedThis thesis deals with spam classification. Text classification belongs to text mining methods. The ideological proposal of spam detection system is the output of the thesis. In the theoretical part of the thesis there are given problems associated with text classification. Then decision trees ID3, CART, QUEST, CHAID and C5.0 are characterized here as well as other alternative methods like neural network and Naive Bayes. The practical part deals with pre-processing of e-mails and an elaboration of input files which are used in classification methods within programs Weka and Clementine. Eventually the best classifier is chosen and then the proposal of spam detection system is verified.cze
dc.description.departmentÚstav systémového inženýrství a informatikycze
dc.description.gradeDokončená práce s úspěšnou obhajoboucze
dc.format77 s.cze
dc.identifierUniverzitní knihovna (sklad)cze
dc.identifier.signatureD15102
dc.identifier.urihttps://hdl.handle.net/10195/26068
dc.language.isocze
dc.publisherUniverzita Pardubicecze
dc.subjectNeural Networkseng
dc.subjectNaive Bayeseng
dc.subjectspamseng
dc.subjectdocuments indexingeng
dc.subjectneuronové sítěcze
dc.subjectNaivní Bayesovy metodycze
dc.subjectspamycze
dc.subjectindexace dokumentůcze
dc.thesis.degree-disciplineInformatika ve veřejné správěcze
dc.thesis.degree-grantorUniverzita Pardubice. Fakulta ekonomicko-správnícze
dc.thesis.degree-nameIng.cze
dc.thesis.degree-programSystémové inženýrství a informatikacze
dc.titleText mining jako nástroj pro klasifikaci nevyžádané poštycze
dc.title.alternativeUsing text mining for spam classificationcze
dc.typediplomová prácecze
dspace.entity.typePublication

Soubory