Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Comparison of fake and real news based on morphological analysis

Konferenční objektopen accesspeer-reviewedpostprint
dc.contributor.authorKapusta, Jozefcze
dc.contributor.authorHájek, Petrcze
dc.contributor.authorMunk, Michalcze
dc.contributor.authorBenko, Lubomírcze
dc.date.accessioned2021-05-15T18:38:51Z
dc.date.available2021-05-15T18:38:51Z
dc.date.issued2020eng
dc.description.abstractEasy access to information results in the phenomenon of false news spreading intentionally through social networks to manipulate people's opinions. Fake news detection has recently attracted growing interest from the general public and researchers. The paper deals with the morphological analysis of two datasets containing 28 870 news articles. The results were verified using the third dataset consisting of 402 news articles. The analysis of the datasets was carried out using lemmatization and POS tagging. The morphological analysis as a process of classifying the words into grammatical-semantic classes and assigning grammatical categories to these words. Individual words from articles were annotated and statistically significant differences were examined between the classes found in fake and real news articles. The results of the analysis show that statistically significant differences are mainly in the verbs and nouns word classes. Finding statistically significant differences in individual categories of word classes is an important piece of information for the future fake news classifier in terms of selecting appropriate variables for the classification.eng
dc.description.abstract-translatedSnadný přístup k informacím vede k tomu, že se falešné zprávy záměrně šíří prostřednictvím sociálních sítí a manipulují s názory lidí. Detekce falešných zpráv v poslední době přitahuje rostoucí zájem široké veřejnosti a výzkumných pracovníků. Příspěvek se zabývá morfologickou analýzou dvou datových souborů obsahujících 28 870 zpravodajských článků. Výsledky byly ověřeny pomocí třetího souboru údajů, který se skládá ze 402 zpravodajských článků. Analýza datových souborů byla provedena pomocí lemmatizace a POS. Morfologická analýza jako proces klasifikace slov do gramaticko-sémantických tříd a přiřazení gramatických kategorií k těmto slovům. Jednotlivá slova z článků byla anotována a byly zkoumány statisticky významné rozdíly mezi třídami nalezenými ve falešných a skutečných zpravodajských článcích. Výsledky analýzy ukazují, že statisticky významné rozdíly jsou hlavně ve slovesných a podstatných třídách slov. Nalezení statisticky významných rozdílů v jednotlivých kategoriích tříd slov je důležitou informací pro budoucího klasifikátora falešných zpráv, pokud jde o výběr vhodných proměnných pro klasifikaci.cze
dc.eventThird International Conference on Computing and Network Communications (CoCoNet'19) (18.12.2019 - 21.12.2019, Trivadrum)eng
dc.formatp. 2285-2293eng
dc.identifier.doi10.1016/j.procs.2020.04.247eng
dc.identifier.issn1877-0509eng
dc.identifier.obd39885184eng
dc.identifier.scopus2-s2.0-85086635816
dc.identifier.urihttps://hdl.handle.net/10195/77263
dc.language.isoengeng
dc.peerreviewedyeseng
dc.publicationstatuspostprinteng
dc.publisherElsevier Science BVeng
dc.relation.ispartofProcedia Computer Science : Third International Conference on Computing and Network Communications (CoCoNet'19)eng
dc.relation.publisherversionhttps://www.sciencedirect.com/science/article/pii/S1877050920312394eng
dc.rightsopen accesseng
dc.rights.licenceCC BY-NC-ND
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectfake newseng
dc.subjectidentificationeng
dc.subjecttext miningeng
dc.subjectnatural language processingeng
dc.subjectpost-editingeng
dc.subjectPOS taggingeng
dc.subjectmorphological analysiseng
dc.titleComparison of fake and real news based on morphological analysiseng
dc.title.alternativePorovnání falšených a skutečných zpráv založené na morfologické analýzecze
dc.typeConferenceObjecteng
dspace.entity.typePublication

Soubory

Původní svazek

Nyní se zobrazuje 1 - 1 z 1
Načítá se...
Náhled
Název:
Kapusta.pdf
Velikost:
358.68 KB
Formát:
Adobe Portable Document Format