Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Spam Filtering Using Regularized Neural Networks with Rectified Linear Units

Konferenční objektOmezený přístuppeer-reviewedpostprint
dc.contributor.authorBarushka, Aliaksandrcze
dc.contributor.authorHájek, Petrcze
dc.date.accessioned2017-05-11T10:45:45Z
dc.date.available2017-05-11T10:45:45Z
dc.date.issued2016eng
dc.description.abstractThe rapid growth of unsolicited and unwanted messages has inspired the development of many anti-spam methods. Machine-learning methods such as Naïve Bayes (NB), support vector machines (SVMs) or neural networks (NNs) have been particularly effective in categorizing spam /non-spam messages. They automatically construct word lists and their weights usually in a bag-of-words fashion. However, traditional multilayer perceptron (MLP) NNs usually suffer from slow optimization convergence to a poor local minimum and overfitting issues. To overcome this problem, we use a regularized NN with rectified linear units (RANN-ReL) for spam filtering. We compare its performance on three benchmark spam datasets (Enron, SpamAssassin, and SMS spam collection) with four machine algorithms commonly used in text classification, namely NB, SVM, MLP, and k-NN. We show that the RANN-ReL outperforms other methods in terms of classification accuracy, false negative and false positive rates. Notably, it classifies well both major (legitimate) and minor (spam) classes.eng
dc.description.abstract-translatedRychlý růst nevyžádaných a nežádoucích zpráv inspiroval vývoj mnoha anti-spamových metod. Metody strojového učení, jako je Naive Bayes (NB), podpůrné vektorové stroje (SVM) nebo neuronové sítě (NN) byly při kategorizaci spamu obzvláště účinné. Tyto metody automaticky sestavují seznamy slov a jejich váhy obvykle v módu balíků slov. Nicméně, tradiční vícevrstvý perceptron (MLP) obvykle trpí pomalou konvergencí ke horšímu lokálním minimu a problémem přeučení. K překonání tohoto problému používáme pro filtrování nevyžádané pošty regularizované NN s rektifikovanými lineárními jednotkami (RANN-ReL). Porovnáváme jejich výkon na třech testovacích datových sadách (Enron, SpamAssassin a SMS spamu) se čtyřmi algoritmy strojového učení běžně používaných v textovém klasifikaci, a to NB, SVM, MLP a k-NN. Ukázali jsme, že RANN-ReL překonává jiné metody pokud jde o přesnost klasifikace, chybně negativní a chybně pozitivní míry. Tento systém klasifikuje jak majoritní (oprávněné) tak minoritní (spam) třídy.cze
dc.event15th International Conference of the Italian Association for Artificial Intelligence (28.11.2016 - 01.12.2016)eng
dc.formatp. 65-75eng
dc.identifier.isbn978-3-319-49129-5eng
dc.identifier.issn0302-9743eng
dc.identifier.obd39877838eng
dc.identifier.scopus2-s2.0-85006021653
dc.identifier.urihttps://hdl.handle.net/10195/67259
dc.identifier.wos000389797400006
dc.language.isoengeng
dc.peerreviewedyeseng
dc.project.IDSGS_2016_023/Ekonomický a sociální rozvoj v soukromém a veřejném sektorueng
dc.publicationstatuspostprinteng
dc.publisherSpringereng
dc.relation.ispartofAIIA 2016 Advances in Artificial Intelligenceeng
dc.relation.publisherversionhttp://link.springer.com/chapter/10.1007/978-3-319-49130-1_6
dc.rightsPouze v rámci univerzityeng
dc.subjectSpam filtereng
dc.subjectEmaileng
dc.subjectSmseng
dc.subjectNeural networkeng
dc.subjectRegularizationeng
dc.subjectRectified linear uniteng
dc.subjectSpamový filtrcze
dc.subjectEmailcze
dc.subjectSmscze
dc.subjectneuronová síťcze
dc.subjectregularizacecze
dc.subjectrektifikovaná lineární jednotkacze
dc.titleSpam Filtering Using Regularized Neural Networks with Rectified Linear Unitseng
dc.title.alternativeFiltrování nevyžádané pošty pomocí regularizovaných neuronových sítí s rektifikovanými lineárními jednotkamicze
dc.typeConferenceObjecteng
dspace.entity.typePublication

Soubory

Původní svazek

Nyní se zobrazuje 1 - 1 z 1
Načítá se...
Náhled
Název:
Barushka.pdf
Velikost:
458.02 KB
Formát:
Adobe Portable Document Format