Silence in dialogue
Ticho v dialogu
diplomová práce (OBHÁJENO)

Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/182684Identifikátory
SIS: 245655
Kolekce
- Kvalifikační práce [23838]
Autor
Vedoucí práce
Oponent práce
Dušek, Ondřej
Fakulta / součást
Filozofická fakulta
Obor
Logika
Katedra / ústav / klinika
Katedra logiky
Datum obhajoby
16. 6. 2023
Nakladatel
Univerzita Karlova, Filozofická fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
dialog|ticho|GPT-3|ladění|jazykové modelyKlíčová slova (anglicky)
dialogue|silence|GPT-3|fine-tuning|language modelsTicho je nezbytnou součástí dialogu. Následující diplomová práce zkoumá ticho v dialogu z teoretické a aplikované perspektivy. Nejprve mapuje historický vývoj teorií dialogu a jejich přístup k tichu. Dále zahrnuje studii schopnosti jednoho z nejvýznamnějších současných jazykových modelů GPT-3 modelovat ticho v dialogu. Model je laděn na datasetu založeném na datech titulků z filmů. Jeho výkon je hodnocen na základě schopnosti odhadovat délku ticha mezi dvojicemi titulků. Experiment navrhuje metodu ladění jazykového modelu pomocí ticha zakódovaného jako řetězce znaků. Výsledky ukazují, že ladění GPT-3 skutečně může zlepšit výkon modelu při odhadování mezer ticha mezi řadami titulků. Keywords: dialog, ticho, GPT-3, ladění, jazykové modely Prohlašuji, že jsem diplomovou práci vypracoval samostatně, že jsem řádně citoval všechny použité prameny a literaturu a že práce nebyla využita v rámci jiného vysokoškolského studia či k získání jiného nebo stejného titulu. viii
Silence is an indispensable aspect of dialogue. The following thesis examines the silence in dialogue from a variety of perspectives. First, I provide a background on the historical development of theories of dialogue and the place of silence within them. Second, I conduct a study of the capacity of one of the most prominent contemporary language models, called the GPT-3, to model silence in dialogue. I fine-tune the model on a dataset based on movie subtitle data. I evaluate its performance on its capacity to infer the length of silence between subtitle pairs. The experiment proposes a method of fine-tuning the language model via silence encoded as character strings. The results show that GPT-3 fine-tuning can indeed improve the model's performance by inferring silence gaps between subtitle turns. Keywords: dialogue, silence, GPT-3, fine-tuning, language models I declare that I have written my diploma thesis independently and that I have properly cited all the sources and literature used, and that the work has not been used in the context of another university study or to obtain another or the same degree. vii