dc.contributor.author |
Kapusta, Jozef
|
cze |
dc.contributor.author |
Hájek, Petr
|
cze |
dc.contributor.author |
Munk, Michal
|
cze |
dc.contributor.author |
Benko, Lubomír
|
cze |
dc.date.accessioned |
2021-05-15T18:38:51Z |
|
dc.date.available |
2021-05-15T18:38:51Z |
|
dc.date.issued |
2020 |
eng |
dc.identifier.issn |
1877-0509 |
eng |
dc.identifier.uri |
https://hdl.handle.net/10195/77263 |
|
dc.description.abstract |
Easy access to information results in the phenomenon of false news spreading intentionally through social networks to manipulate people's opinions. Fake news detection has recently attracted growing interest from the general public and researchers. The paper deals with the morphological analysis of two datasets containing 28 870 news articles. The results were verified using the third dataset consisting of 402 news articles. The analysis of the datasets was carried out using lemmatization and POS tagging. The morphological analysis as a process of classifying the words into grammatical-semantic classes and assigning grammatical categories to these words. Individual words from articles were annotated and statistically significant differences were examined between the classes found in fake and real news articles. The results of the analysis show that statistically significant differences are mainly in the verbs and nouns word classes. Finding statistically significant differences in individual categories of word classes is an important piece of information for the future fake news classifier in terms of selecting appropriate variables for the classification. |
eng |
dc.format |
p. 2285-2293 |
eng |
dc.language.iso |
eng |
eng |
dc.publisher |
Elsevier Science BV |
eng |
dc.relation.ispartof |
Procedia Computer Science : Third International Conference on Computing and Network Communications (CoCoNet'19) |
eng |
dc.rights |
open access |
eng |
dc.rights.uri |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
|
dc.subject |
fake news |
eng |
dc.subject |
identification |
eng |
dc.subject |
text mining |
eng |
dc.subject |
natural language processing |
eng |
dc.subject |
post-editing |
eng |
dc.subject |
POS tagging |
eng |
dc.subject |
morphological analysis |
eng |
dc.title |
Comparison of fake and real news based on morphological analysis |
eng |
dc.title.alternative |
Porovnání falšených a skutečných zpráv založené na morfologické analýze |
cze |
dc.type |
ConferenceObject |
eng |
dc.description.abstract-translated |
Snadný přístup k informacím vede k tomu, že se falešné zprávy záměrně šíří prostřednictvím sociálních sítí a manipulují s názory lidí. Detekce falešných zpráv v poslední době přitahuje rostoucí zájem široké veřejnosti a výzkumných pracovníků. Příspěvek se zabývá morfologickou analýzou dvou datových souborů obsahujících 28 870 zpravodajských článků. Výsledky byly ověřeny pomocí třetího souboru údajů, který se skládá ze 402 zpravodajských článků. Analýza datových souborů byla provedena pomocí lemmatizace a POS. Morfologická analýza jako proces klasifikace slov do gramaticko-sémantických tříd a přiřazení gramatických kategorií k těmto slovům. Jednotlivá slova z článků byla anotována a byly zkoumány statisticky významné rozdíly mezi třídami nalezenými ve falešných a skutečných zpravodajských článcích. Výsledky analýzy ukazují, že statisticky významné rozdíly jsou hlavně ve slovesných a podstatných třídách slov. Nalezení statisticky významných rozdílů v jednotlivých kategoriích tříd slov je důležitou informací pro budoucího klasifikátora falešných zpráv, pokud jde o výběr vhodných proměnných pro klasifikaci. |
cze |
dc.event |
Third International Conference on Computing and Network Communications (CoCoNet'19) (18.12.2019 - 21.12.2019, Trivadrum) |
eng |
dc.peerreviewed |
yes |
eng |
dc.publicationstatus |
postprint |
eng |
dc.identifier.doi |
10.1016/j.procs.2020.04.247 |
eng |
dc.relation.publisherversion |
https://www.sciencedirect.com/science/article/pii/S1877050920312394 |
eng |
dc.rights.licence |
CC BY-NC-ND |
|
dc.identifier.scopus |
2-s2.0-85086635816 |
|
dc.identifier.obd |
39885184 |
eng |