dc.contributor.author |
Benko, Ľubomír
|
cze |
dc.contributor.author |
Munk, Michal
|
cze |
dc.contributor.author |
Munková, Daša
|
cze |
dc.date.accessioned |
2017-05-11T10:56:22Z |
|
dc.date.available |
2017-05-11T10:56:22Z |
|
dc.date.issued |
2016 |
eng |
dc.identifier.isbn |
978-3-319-49396-1 |
eng |
dc.identifier.issn |
0302-9743 |
eng |
dc.identifier.uri |
http://hdl.handle.net/10195/67402 |
|
dc.description.abstract |
The paper is aimed at automatic metrics for translation quality assessment (TQA), specifically at machine translation (MT) output and the metrics for the evaluation of MT output (Precision, Recall, F-measure, BLEU, PER, WER and CDER). We examine their reliability and we determine the metrics which show decreasing reliability of the automatic evaluation of MT output. Besides the traditional measures (Cronbach’s alpha and standardized alpha) we use entropy for assessing the reliability of the automatic metrics of MT output. The results were obtained on a dataset covering translation from a low resource language (SK) into English (EN). The main contribution consists of the identification of the redundant automatic MT evaluation metrics. |
eng |
dc.format |
p. 141-152 |
eng |
dc.language.iso |
eng |
eng |
dc.publisher |
Springer |
eng |
dc.relation.ispartof |
Lecture Notes in Computer Science |
eng |
dc.rights |
Pouze v rámci univerzity |
eng |
dc.subject |
Machine translation |
eng |
dc.subject |
Evaluation |
eng |
dc.subject |
Automatic metrics |
eng |
dc.subject |
Reliability |
eng |
dc.subject |
Entropy |
eng |
dc.subject |
Redundancy |
eng |
dc.subject |
Strojový překlad |
cze |
dc.subject |
Evaluace |
cze |
dc.subject |
Entropie |
cze |
dc.title |
Identification of Relevant and Redundant Automatic Metrics for MT Evaluation |
eng |
dc.title.alternative |
Identifikace relevantních a redundantních automatických metrik pro MT evaluaci |
cze |
dc.type |
ConferenceObject |
eng |
dc.description.abstract-translated |
Tento článek je zaměřen na automatické metriky pro hodnocení kvality překladu (TQA), konkrétně na výstup strojového překladu (MT) a metriky pro hodnocení MT výstupu (přesnost, vzpomínáte, F-opatření, BLEU, PER, WER a CDER). Zkoumáme jejich spolehlivost a určíme metriky, které ukazují klesající spolehlivost automatického hodnocení MT výstup. Kromě tradiční opatření (Cronbach si alfa a standardizované alfa) používáme entropie pro posuzování spolehlivosti automatické metriky MT výstupu. Výsledky byly získány na dataset pokrývající překlad z nedostatku prostředků jazyka (SK) do anglicky (EN). Hlavním přínosem je tvořena identifikace redundantní automatické MT hodnocení metriky. |
cze |
dc.event |
10th Multi-Disciplinary International Workshop on Artificial Intelligence, MIWAI 2016 (07.12.2016 - 09.12.2016) |
eng |
dc.peerreviewed |
yes |
eng |
dc.publicationstatus |
postprint |
eng |
dc.identifier.doi |
10.1007/978-3-319-49397-8_12 |
|
dc.relation.publisherversion |
https://link.springer.com/chapter/10.1007/978-3-319-49397-8_12 |
|
dc.project.ID |
SGS_2016_023/Ekonomický a sociální rozvoj v soukromém a veřejném sektoru |
eng |
dc.identifier.wos |
000389332100012 |
|
dc.identifier.scopus |
2-s2.0-85007238734 |
|
dc.identifier.obd |
39878534 |
eng |