Identification of Relevant and Redundant Automatic Metrics for MT Evaluation

Zobrazit minimální záznam

dc.contributor.author Benko, Ľubomír cze
dc.contributor.author Munk, Michal cze
dc.contributor.author Munková, Daša cze
dc.date.accessioned 2017-05-11T10:56:22Z
dc.date.available 2017-05-11T10:56:22Z
dc.date.issued 2016 eng
dc.identifier.isbn 978-3-319-49396-1 eng
dc.identifier.issn 0302-9743 eng
dc.identifier.uri http://hdl.handle.net/10195/67402
dc.description.abstract The paper is aimed at automatic metrics for translation quality assessment (TQA), specifically at machine translation (MT) output and the metrics for the evaluation of MT output (Precision, Recall, F-measure, BLEU, PER, WER and CDER). We examine their reliability and we determine the metrics which show decreasing reliability of the automatic evaluation of MT output. Besides the traditional measures (Cronbach’s alpha and standardized alpha) we use entropy for assessing the reliability of the automatic metrics of MT output. The results were obtained on a dataset covering translation from a low resource language (SK) into English (EN). The main contribution consists of the identification of the redundant automatic MT evaluation metrics. eng
dc.format p. 141-152 eng
dc.language.iso eng eng
dc.publisher Springer eng
dc.relation.ispartof Lecture Notes in Computer Science eng
dc.rights Pouze v rámci univerzity eng
dc.subject Machine translation eng
dc.subject Evaluation eng
dc.subject Automatic metrics eng
dc.subject Reliability eng
dc.subject Entropy eng
dc.subject Redundancy eng
dc.subject Strojový překlad cze
dc.subject Evaluace cze
dc.subject Entropie cze
dc.title Identification of Relevant and Redundant Automatic Metrics for MT Evaluation eng
dc.title.alternative Identifikace relevantních a redundantních automatických metrik pro MT evaluaci cze
dc.type ConferenceObject eng
dc.description.abstract-translated Tento článek je zaměřen na automatické metriky pro hodnocení kvality překladu (TQA), konkrétně na výstup strojového překladu (MT) a metriky pro hodnocení MT výstupu (přesnost, vzpomínáte, F-opatření, BLEU, PER, WER a CDER). Zkoumáme jejich spolehlivost a určíme metriky, které ukazují klesající spolehlivost automatického hodnocení MT výstup. Kromě tradiční opatření (Cronbach si alfa a standardizované alfa) používáme entropie pro posuzování spolehlivosti automatické metriky MT výstupu. Výsledky byly získány na dataset pokrývající překlad z nedostatku prostředků jazyka (SK) do anglicky (EN). Hlavním přínosem je tvořena identifikace redundantní automatické MT hodnocení metriky. cze
dc.event 10th Multi-Disciplinary International Workshop on Artificial Intelligence, MIWAI 2016 (07.12.2016 - 09.12.2016) eng
dc.peerreviewed yes eng
dc.publicationstatus postprint eng
dc.identifier.doi 10.1007/978-3-319-49397-8_12
dc.relation.publisherversion https://link.springer.com/chapter/10.1007/978-3-319-49397-8_12
dc.project.ID SGS_2016_023/Ekonomický a sociální rozvoj v soukromém a veřejném sektoru eng
dc.identifier.wos 000389332100012
dc.identifier.scopus 2-s2.0-85007238734
dc.identifier.obd 39878534 eng


Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam

Vyhledávání


Rozšířené hledání

Procházet

Můj účet