Comparison of fake and real news based on morphological analysis

Zobrazit minimální záznam

dc.contributor.author Kapusta, Jozef cze
dc.contributor.author Hájek, Petr cze
dc.contributor.author Munk, Michal cze
dc.contributor.author Benko, Lubomír cze
dc.date.accessioned 2021-05-15T18:38:51Z
dc.date.available 2021-05-15T18:38:51Z
dc.date.issued 2020 eng
dc.identifier.issn 1877-0509 eng
dc.identifier.uri https://hdl.handle.net/10195/77263
dc.description.abstract Easy access to information results in the phenomenon of false news spreading intentionally through social networks to manipulate people's opinions. Fake news detection has recently attracted growing interest from the general public and researchers. The paper deals with the morphological analysis of two datasets containing 28 870 news articles. The results were verified using the third dataset consisting of 402 news articles. The analysis of the datasets was carried out using lemmatization and POS tagging. The morphological analysis as a process of classifying the words into grammatical-semantic classes and assigning grammatical categories to these words. Individual words from articles were annotated and statistically significant differences were examined between the classes found in fake and real news articles. The results of the analysis show that statistically significant differences are mainly in the verbs and nouns word classes. Finding statistically significant differences in individual categories of word classes is an important piece of information for the future fake news classifier in terms of selecting appropriate variables for the classification. eng
dc.format p. 2285-2293 eng
dc.language.iso eng eng
dc.publisher Elsevier Science BV eng
dc.relation.ispartof Procedia Computer Science : Third International Conference on Computing and Network Communications (CoCoNet'19) eng
dc.rights open access eng
dc.rights.uri https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject fake news eng
dc.subject identification eng
dc.subject text mining eng
dc.subject natural language processing eng
dc.subject post-editing eng
dc.subject POS tagging eng
dc.subject morphological analysis eng
dc.title Comparison of fake and real news based on morphological analysis eng
dc.title.alternative Porovnání falšených a skutečných zpráv založené na morfologické analýze cze
dc.type ConferenceObject eng
dc.description.abstract-translated Snadný přístup k informacím vede k tomu, že se falešné zprávy záměrně šíří prostřednictvím sociálních sítí a manipulují s názory lidí. Detekce falešných zpráv v poslední době přitahuje rostoucí zájem široké veřejnosti a výzkumných pracovníků. Příspěvek se zabývá morfologickou analýzou dvou datových souborů obsahujících 28 870 zpravodajských článků. Výsledky byly ověřeny pomocí třetího souboru údajů, který se skládá ze 402 zpravodajských článků. Analýza datových souborů byla provedena pomocí lemmatizace a POS. Morfologická analýza jako proces klasifikace slov do gramaticko-sémantických tříd a přiřazení gramatických kategorií k těmto slovům. Jednotlivá slova z článků byla anotována a byly zkoumány statisticky významné rozdíly mezi třídami nalezenými ve falešných a skutečných zpravodajských článcích. Výsledky analýzy ukazují, že statisticky významné rozdíly jsou hlavně ve slovesných a podstatných třídách slov. Nalezení statisticky významných rozdílů v jednotlivých kategoriích tříd slov je důležitou informací pro budoucího klasifikátora falešných zpráv, pokud jde o výběr vhodných proměnných pro klasifikaci. cze
dc.event Third International Conference on Computing and Network Communications (CoCoNet'19) (18.12.2019 - 21.12.2019, Trivadrum) eng
dc.peerreviewed yes eng
dc.publicationstatus postprint eng
dc.identifier.doi 10.1016/j.procs.2020.04.247 eng
dc.relation.publisherversion https://www.sciencedirect.com/science/article/pii/S1877050920312394 eng
dc.rights.licence CC BY-NC-ND
dc.identifier.scopus 2-s2.0-85086635816
dc.identifier.obd 39885184 eng


Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam

open access Kromě případů, kde je uvedeno jinak, licence tohoto záznamu je open access

Vyhledávání


Rozšířené hledání

Procházet

Můj účet