Automatické zjednodušování textů pro překlad
Automatické zjednodušování textů pro překlad
diploma thesis (DEFENDED)
![Document thumbnail](/bitstream/handle/20.500.11956/13259/thumbnail.png?sequence=7&isAllowed=y)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/13259Identifiers
Study Information System: 42005
Collections
- Kvalifikační práce [11264]
Author
Advisor
Referee
Zeman, Daniel
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computational and Formal Linguistics
Department
Institute of Formal and Applied Linguistics
Date of defense
11. 9. 2007
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Tato práce se zabývá využitím automatického zjednodušování (simplifi akce) textů pro účely automatického překladu. Práce srovnává automatické zjednodušování a kotrolované psaní, co mají společného a jaké jsou jejich rozdíly. Dále se zaměřuje na zjednodušování v souvislosti s automatickým překladem. Je popsáno jaké problémy může zjednodušování vyřešit a pro část z nich je řešení navrženo. V rámci práce byl implementován systém ASOFT, který provádí vybrané transformace na větách. Výsledky systému ASOFT ve spojení se systémem automatického překladu PC Transaltor byly vyhodnoceny pomocí několika metrik, zvolili jsem automatické vyhodnocení pomocí BLEU a NIST a vyhodnocení provedené lidskými anotátory. V závěru nastiňujeme jakými dalšími způsoby by se dané téma mohlo rozvíjet.
This thesis describes one of the areas where automatic simpli fication can be used: simpli cation of texts for machine translation. We start by comparing methods of automatic simpli cation and controlled language, describing their similarities and di erences. Further on we focus only on automatic simpli cation used as a preprocessing step for machine translation. We describe what issues can be solved and address some of them using our own system ASOFT. A text preprocessed by ASOFT is intended to be translated by a machine translation system PC Translator. We evaluate the output of the PC Translator using two automatic methods, BLEU and NIST scores, and one method of human evaluation. In the end we propose other issues that can be addressed by means of automatic simpli fication.