Publikace: Text mining jako nástroj pro klasifikaci nevyžádané pošty
Diplomová práceNačítá se...
Datum
Autoři
Lamr, Martin
Název časopisu
ISSN časopisu
Název svazku
Nakladatel
Univerzita Pardubice
Abstrakt
Diplomová práce se zabývá klasifikací textu, konkrétně nevyžádané pošty, která patří mezi nástroje text miningu. Výstupem této práce je ideový návrh systému pro detekci nevyžádané elektronické pošty. V teoretické části práce je uvedena problematika klasifikace textu a s ní spojených činností. Dále zde jsou charakterizovány klasifikační metody použité v této práci, mezi které byly zvoleny rozhodovací stromy ID3, CART, CHAID, QUEST, C5.0, ale také metoda založená na bayesovském klasifikátoru a neuronová síť. Praktická část se zabývá předzpracováním e-mailových zpráv a vytvořením vstupních souborů, které pak jsou klasifikovány vybranými metodami v prostředí Weka a Clementine. Nakonec je zvolena nejlepší klasifikační metoda a navrhnutý systém je ověřen.
Popis
Klíčová slova
Neural Networks, Naive Bayes, spams, documents indexing, neuronové sítě, Naivní Bayesovy metody, spamy, indexace dokumentů