dc.contributor.advisor | Popel, Martin | |
dc.creator | Závodská, Gabriela | |
dc.date.accessioned | 2024-11-28T22:00:26Z | |
dc.date.available | 2024-11-28T22:00:26Z | |
dc.date.issued | 2024 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/192874 | |
dc.description.abstract | Cieľom tejto práce je nájsť rozdiely medzi optimálnymi referenčnými prekladmi (ORT) a štandardnými referenčnými prekladmi (SRT) pomocou nástroja MCC vyvinutého na ich porovnanie. Pre tieto alternatívne preklady sa porovnávajú rôzne metriky založené na morfológii, syntaxi, jazykových modeloch a iných a vyhodnocujú sa pomocou rozdielu a t-testu. Tie, ktoré sú medzi prekladmi dostatočne kontrastné, sú ďalej analyzované po- mocou príkladov. Zistili sme výrazne vyššie využitie priamej reči v ORT, ktorá je v SRT nahradená nepriamou rečou. Vyššiu syntaktickú náročnosť (priemerný počet vedľajších viet) nachádzame v ORT, čo pripisujeme najmä vyššiemu podielu vedľajších viet rozvíjaj- úcich podstatné meno v tomto preklade. Nakoniec sme zahrnuli porovnanie dĺžky ORT s dvoma vybranými strojovými prekladmi. Zistili sme, že ORT je dlhší v oboch prípadoch na úrovni dokumentu aj na úrovni segmentov, ktoré sú kratšie väčšinou z dôvodu úplného vynechania prekladov celých súvetí alebo dokonca viet. | cs_CZ |
dc.description.abstract | This thesis aims to find differences between optimal reference translations (ORT) and standard reference translations (SRT) using the MCC tool developed for their comparison. Various metrics based on morphology, syntax, language models and others are compared for these alternative translations and evaluated using difference and t-test. The ones that contrast enough between the translations are further analyzed using examples. We found a significantly higher use of active voice in the ORTs, substituted by passive voice in the SRTs. A higher syntactic complexity (average number of subordinate clauses) is found in ORT, which we mainly attribute to a higher proportion of adnominal clauses in this translation. Lastly, we included a length comparison of an ORT with two selected machine translations. We found that the ORT is longer in both cases on the document and the segment level, which are shorter mostly because of completely omitting translations of whole phrases or even sentences. | en_US |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | machine translation|text analysis|optimal reference translation|translation|comparison | en_US |
dc.subject | strojový překlad|analýza textu|optimální referenční překlad|překlad|srovnání | cs_CZ |
dc.title | Analyzing differences in alternative translations | en_US |
dc.type | bakalářská práce | cs_CZ |
dcterms.created | 2024 | |
dcterms.dateAccepted | 2024-09-05 | |
dc.description.department | Institute of Formal and Applied Linguistics | en_US |
dc.description.department | Ústav formální a aplikované lingvistiky | cs_CZ |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 257455 | |
dc.title.translated | Analýza rozdílů v alternativních překladech | cs_CZ |
dc.contributor.referee | Kloudová, Věra | |
thesis.degree.name | Bc. | |
thesis.degree.level | bakalářské | cs_CZ |
thesis.degree.discipline | Computer Science with specialisation in Foundations of Computer Science | en_US |
thesis.degree.discipline | Informatika se specializací Obecná informatika | cs_CZ |
thesis.degree.program | Computer Science | en_US |
thesis.degree.program | Informatika | cs_CZ |
uk.thesis.type | bakalářská práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Ústav formální a aplikované lingvistiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Institute of Formal and Applied Linguistics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Informatika se specializací Obecná informatika | cs_CZ |
uk.degree-discipline.en | Computer Science with specialisation in Foundations of Computer Science | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Computer Science | en_US |
thesis.grade.cs | Velmi dobře | cs_CZ |
thesis.grade.en | Very good | en_US |
uk.abstract.cs | Cieľom tejto práce je nájsť rozdiely medzi optimálnymi referenčnými prekladmi (ORT) a štandardnými referenčnými prekladmi (SRT) pomocou nástroja MCC vyvinutého na ich porovnanie. Pre tieto alternatívne preklady sa porovnávajú rôzne metriky založené na morfológii, syntaxi, jazykových modeloch a iných a vyhodnocujú sa pomocou rozdielu a t-testu. Tie, ktoré sú medzi prekladmi dostatočne kontrastné, sú ďalej analyzované po- mocou príkladov. Zistili sme výrazne vyššie využitie priamej reči v ORT, ktorá je v SRT nahradená nepriamou rečou. Vyššiu syntaktickú náročnosť (priemerný počet vedľajších viet) nachádzame v ORT, čo pripisujeme najmä vyššiemu podielu vedľajších viet rozvíjaj- úcich podstatné meno v tomto preklade. Nakoniec sme zahrnuli porovnanie dĺžky ORT s dvoma vybranými strojovými prekladmi. Zistili sme, že ORT je dlhší v oboch prípadoch na úrovni dokumentu aj na úrovni segmentov, ktoré sú kratšie väčšinou z dôvodu úplného vynechania prekladov celých súvetí alebo dokonca viet. | cs_CZ |
uk.abstract.en | This thesis aims to find differences between optimal reference translations (ORT) and standard reference translations (SRT) using the MCC tool developed for their comparison. Various metrics based on morphology, syntax, language models and others are compared for these alternative translations and evaluated using difference and t-test. The ones that contrast enough between the translations are further analyzed using examples. We found a significantly higher use of active voice in the ORTs, substituted by passive voice in the SRTs. A higher syntactic complexity (average number of subordinate clauses) is found in ORT, which we mainly attribute to a higher proportion of adnominal clauses in this translation. Lastly, we included a length comparison of an ORT with two selected machine translations. We found that the ORT is longer in both cases on the document and the segment level, which are shorter mostly because of completely omitting translations of whole phrases or even sentences. | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky | cs_CZ |
thesis.grade.code | 2 | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |