Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Text mining jako nástroj pro klasifikaci nevyžádané pošty

Diplomová práce
Načítá se...
Náhled

Datum

Autoři

Lamr, Martin

Název časopisu

ISSN časopisu

Název svazku

Nakladatel

Univerzita Pardubice

Výzkumné projekty

Organizační jednotky

Číslo časopisu

Abstrakt

Diplomová práce se zabývá klasifikací textu, konkrétně nevyžádané pošty, která patří mezi nástroje text miningu. Výstupem této práce je ideový návrh systému pro detekci nevyžádané elektronické pošty. V teoretické části práce je uvedena problematika klasifikace textu a s ní spojených činností. Dále zde jsou charakterizovány klasifikační metody použité v této práci, mezi které byly zvoleny rozhodovací stromy ID3, CART, CHAID, QUEST, C5.0, ale také metoda založená na bayesovském klasifikátoru a neuronová síť. Praktická část se zabývá předzpracováním e-mailových zpráv a vytvořením vstupních souborů, které pak jsou klasifikovány vybranými metodami v prostředí Weka a Clementine. Nakonec je zvolena nejlepší klasifikační metoda a navrhnutý systém je ověřen.

Popis

Klíčová slova

Neural Networks, Naive Bayes, spams, documents indexing, neuronové sítě, Naivní Bayesovy metody, spamy, indexace dokumentů

Citace

Permanentní identifikátor

Endorsement

Review

Supplemented By

Referenced By