Publikace: Detecting Fake Online Reviews using Fine-tuned BERT
Konferenční objektopen accesspeer-reviewedpostprint (accepted version)| dc.contributor.author | Refaeli, David | cze |
| dc.contributor.author | Hájek, Petr | cze |
| dc.date.accessioned | 2022-06-03T12:16:14Z | |
| dc.date.available | 2022-06-03T12:16:14Z | |
| dc.date.issued | 2021 | |
| dc.description.abstract | Fake online reviews are becoming a major problem nowadays with the growing number of online purchases. Recently, natural language processing (NLP) methods that analyze the content of reviews have been increasingly used to detect fake reviews. The problem becomes extremely difficult due to the lack of reliable data caused by the difficulty in labeling fake and honest reviews. In this paper, we not only conduct a structural taxonomy of this topic, but we also present extensive experiments using a state-of-the-art language model BERT (Bidirectional Encoder Representations from Transformers) on different online review datasets. By efficiently fine-tuning this model, we outperform existing detection models by achieving 91% accuracy on the balanced crowdsourced dataset of hotel, restaurant, and doctor reviews and 73% accuracy on the imbalanced third-party Yelp dataset of restaurant reviews. | eng |
| dc.description.abstract-translated | Falešné online recenze se v dnešní době stávají s rostoucím počtem online nákupů velkým problémem. V poslední době se k odhalování falešných recenzí stále častěji používají metody zpracování přirozeného jazyka (NLP), které analyzují obsah recenzí. Problém se stává mimořádně obtížným kvůli nedostatku spolehlivých dat způsobenému obtížným označováním falešných a poctivých recenzí. V tomto článku provádíme nejen strukturální taxonomii tohoto tématu, ale také představujeme rozsáhlé experimenty s využitím nejmodernějšího jazykového modelu BERT (Bidirectional Encoder Representations from Transformers) na různých souborech dat o online recenzích. Efektivním vyladěním tohoto modelu překonáváme stávající detekční modely tím, že dosahujeme 91% přesnosti na vyváženém crowdsourcovém datasetu recenzí hotelů, restaurací a lékařů a 73% přesnosti na nevyváženém datasetu recenzí restaurací od třetí strany Yelp. | cze |
| dc.event | 5th International Conference on E-Business and Internet, ICEBI 2021 (12.10.2021 - 17.10.2021, Singapur) | eng |
| dc.format | p. 76-80 | eng |
| dc.identifier.doi | 10.1145/3497701.3497714 | |
| dc.identifier.isbn | 978-1-4503-8565-7 | |
| dc.identifier.obd | 39887061 | |
| dc.identifier.scopus | 2-s2.0-85123998564 | |
| dc.identifier.uri | https://hdl.handle.net/10195/79117 | |
| dc.language.iso | eng | eng |
| dc.peerreviewed | yes | eng |
| dc.project.ID | GA19-15498S/Modelování emocí ve verbální a neverbální manažerské komunikaci pro predikci podnikových finančních rizik | eng |
| dc.publicationstatus | postprint (accepted version) | eng |
| dc.publisher | ACM (Association for Computing Machinery) | eng |
| dc.relation.ispartof | ICEBI 2021: proceedings of the 2021 5th International Conference on E-Business and Internet | eng |
| dc.relation.publisherversion | https://dl.acm.org/doi/abs/10.1145/3497701.3497714 | |
| dc.rights | open access (green) | eng |
| dc.subject | BERT | eng |
| dc.subject | detection | eng |
| dc.subject | fake review | eng |
| dc.subject | fine-tuning | eng |
| dc.title | Detecting Fake Online Reviews using Fine-tuned BERT | eng |
| dc.title.alternative | Detekce falešných online recenzí pomocí vyladěného BERT | cze |
| dc.type | ConferenceObject | eng |
| dspace.entity.type | Publication |
Soubory
Původní svazek
1 - 1 z 1
Načítá se...
- Název:
- icebi2021-13.pdf
- Velikost:
- 414.67 KB
- Formát:
- Adobe Portable Document Format