Multi-Source Simultaneous Speech Translation
Simultánní překlad řeči z více zdrojů
dizertační práce (OBHÁJENO)

Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/190381Identifikátory
SIS: 213233
Kolekce
- Kvalifikační práce [11327]
Autor
Vedoucí práce
Oponent práce
Yvon, Francois
Niehues, Jan
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Matematická lingvistika
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
6. 6. 2024
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Prospěl/a
Klíčová slova (česky)
simultánní překlad řeči|překlad řeči|překlad z řeči do textu|strojový překlad|vícejazyčnost|vícezdrojovost|simultánní tlumočení|zpracování přirozeného jazykaKlíčová slova (anglicky)
simultaneous speech translation|speech translation|speech-to-text translation|machine translation|multilinguality|multi-sourcing|simultaneous interpreting|natural language processingNeuronový strojový překlad má schopnost překládat z několika paralelních vstupů v různých jazycích. Kvalita současného automatického simultánního překladu řeči trpí zejména když je zdroj zašumněný. Zkoumáme možnost využití více paralelních řečových signálů - originál a simultánní tlumočení - jako zdroje překladu s cílem dosáhnout vyšší kvality. Proto jsme vytvořili evaluační dataset ESIC (Europarl Simultaneous Interpreting Corpus). Dále analyzujeme aspekty simultánního tlumočení jako doplňkového paralel- ního zdroje. Poté zkoumáme odolnost vícezdrojového překladu proti chybám v přepisu a hodnotíme spolehlivost metrik strojového překladu na hodnocení simultánního překladu řeči. V neposlední řadě implementujeme Whisper-Streaming, nástroj na simultánní re- žim velkých offline modelů pro převod z řeči na text, který demonstruje současný stav poznání. 1
Neural machine translation has the capability to translate from several parallel in- puts into different languages. Current simultaneous speech translation sometimes faces issues with quality, especially when the source is noisy. We investigate the opportunity to use multiple parallel speech signals - the original and simultaneous interpreting - as sources for translation to achieve higher quality. We create an evaluation set ESIC (Europarl Simultaneous Interpreting Corpus). We analyze the challenges of simultane- ous interpreting when used as an additional parallel source. Then, we investigate the robustness of multi-sourcing to transcription errors and assess the reliability of machine translation metrics when evaluating simultaneous speech translation. Last but not least, we implement Whisper-Streaming, a tool that enables real-time processing of large offline speech-to-text models and demonstrates the state of the art. 1
Citace dokumentu
Metadata
Zobrazit celý záznamSouvisející záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
Komparace výstupů z veřejně dostupných překladačů ve směru němčina-čeština
Výsledek obhajoby: OBHÁJENOŘehořová, Klára (Univerzita Karlova, Filozofická fakulta, 2022)Datum obhajoby: 1. 2. 2022Tato diplomová práce se zabývá kvalitou výstupů veřejně dostupných překladačů: překladače mezi sebou kvalitativně porovnat a otestovat jejich možnosti na překladu několika typů textů - textů uměleckých, informativních a ... -
Komentovaný překlad: Tomas Nagel: What is it like to be bat?(In: Philosophical Review LXXXIII, 4 (October 1974)
Výsledek obhajoby: OBHÁJENOHnyk, Tomáš (Univerzita Karlova, Filozofická fakulta, 2012)Datum obhajoby: 10. 9. 2012 -
Překladatel Ludvík Kundera
Výsledek obhajoby: OBHÁJENONešporová, Jitka (Univerzita Karlova, Filozofická fakulta, 2014)Datum obhajoby: 21. 5. 2014Jitka Nešporová disertační práce ABSTRAKT Předmětem předkládané disertační práce, která je příspěvkem k dějinám českého uměleckého překladu po roce 1945, je osobnost a překladatelské dílo Ludvíka Kundery. Tento básník ...