Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Combining bag-of-words and sentiment features of annual reports to predict abnormal stock returns

Článekopen accesspeer-reviewedpostprint
dc.contributor.authorHájek, Petrcze
dc.date.accessioned2019-05-22T08:33:49Z
dc.date.available2019-05-22T08:33:49Z
dc.date.issued2018eng
dc.description.abstractAutomated textual analysis of firm-related documents has become an important decision support tool for stock market investors. Previous studies tended to adopt either dictionary-based or machine learning approach. Nevertheless, little is known about their concurrent use. Here we use the combination of financial indicators, readability, sentiment categories, and bag-of-words (BoW) to increase prediction accuracy. This paper aims to extract both sentiment and BoW information from the annual reports of US firms. The sentiment analysis is based on two commonly used dictionaries, namely a general dictionary Diction 7.0 and a finance-specific dictionary proposed by Loughran and McDonald (J Finance 66:35-65, 2011. doi:10.1111/j.1540-6261.2010.01625.x). The BoW are selected according to their tf-idf. We combine these features with financial indicators to predict abnormal stock returns using a multilayer perceptron neural network with dropout regularization and rectified linear units. We show that this method performs similarly as na Naive Bayes and outperforms other machine learning algorithms (support vector machine, C4.5 decision tree, and k-nearest neighbour classifier) in predicting positive/negative abnormal stock returns in terms of ROC. We also show that the quality of the prediction significantly increased when using the correlation-based feature selection of BoW. This prediction performance is robust to industry categorization and event window.eng
dc.description.abstract-translatedAutomatizovaná textová analýza firemních dokumentů se stala důležitým nástrojem podpory rozhodování pro investory na akciových trzích. Předchozí studie měly tendenci přijmout přístup založený buď na slovnících nebo strojovém učení. Přesto je málo známo jejich souběžné využití. Zde používáme kombinaci finančních ukazatelů, čitelnosti, kategorií sentimentů a balíků slov (BoW) pro zvýšení predikční přesnosti. Cílem tohoto příspěvku je získání informací o sentimentu a BoW z výročních zpráv amerických firem. Analýza sentimentu je založena na dvou běžně používaných slovnících, jmenovitě obecném slovníku Diction 7.0 a slovníku specifických pro finance. BoW jsou vybrány podle jejich tf-idf. Kombinujeme tyto funkce s finančními ukazateli, abychom mohli předvídat abnormální výnos akcií pomocí vícevrstvé neuronové sítě s regularizací a rektifikovanými lineárními jednotkami. Ukazujeme, že tato metoda funguje podobně jako na Naive Bayes a překonává jiné algoritmy strojového učení (podpůrné vektorové stroje, C4.5 rozhodovací strom a k-nejbližších sousedů) při predikci pozitivních / negativních abnormálních výnosů akcií měřeno ROC. Ukazujeme také, že kvalita předpovědi výrazně vzrostla při použití filtru založeného na korelaci pro selekci BoW. Tento výkon je robustní pro kategorizaci odvětví i oken událostí.cze
dc.formatp. 343-358eng
dc.identifier.doi10.1007/s00521-017-3194-2eng
dc.identifier.issn0941-0643eng
dc.identifier.obd39881875eng
dc.identifier.scopus2-s2.0-85028574890
dc.identifier.urihttps://hdl.handle.net/10195/72754
dc.identifier.wos000427799400005eng
dc.language.isoengeng
dc.peerreviewedyeseng
dc.project.IDGA16-19590S/Analýza témat a sentimentu vícenásobných textových zdrojů pro finanční rozhodováníeng
dc.publicationstatuspostprinteng
dc.publisherSpringereng
dc.relation.ispartofNeural Computing and Applications, volume 29, issue: 7eng
dc.relation.publisherversionhttps://link.springer.com/article/10.1007/s00521-017-3194-2eng
dc.rightsopen accesseng
dc.subjectStock returneng
dc.subjectPredictioneng
dc.subjectText miningeng
dc.subjectSentimenteng
dc.subjectNeural networkeng
dc.titleCombining bag-of-words and sentiment features of annual reports to predict abnormal stock returnseng
dc.title.alternativeKombinace balíků slov a sentimentu výročních zpráv k predikci abnormálních akciových výnosůcze
dc.typeArticleeng
dspace.entity.typePublication

Soubory

Původní svazek

Nyní se zobrazuje 1 - 1 z 1
Načítá se...
Náhled
Název:
Manuscript-OBD.pdf
Velikost:
882.61 KB
Formát:
Adobe Portable Document Format