Silence in dialogue

Laichter, Štěpán

Ticho v dialogu

diplomová práce (OBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (334.1Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/182684

Identifikátory

SIS: 245655

Oponent práce

Dušek, Ondřej

Fakulta / součást

Filozofická fakulta

Obor

Logika

Katedra / ústav / klinika

Katedra logiky

Datum obhajoby

16. 6. 2023

Nakladatel

Univerzita Karlova, Filozofická fakulta

Jazyk

Angličtina

Známka

Výborně

Klíčová slova (česky)

dialog|ticho|GPT-3|ladění|jazykové modely

Klíčová slova (anglicky)

dialogue|silence|GPT-3|fine-tuning|language models

Ticho je nezbytnou součástí dialogu. Následující diplomová práce zkoumá ticho v dialogu z teoretické a aplikované perspektivy. Nejprve mapuje historický vývoj teorií dialogu a jejich přístup k tichu. Dále zahrnuje studii schopnosti jednoho z nejvýznamnějších současných jazykových modelů GPT-3 modelovat ticho v dialogu. Model je laděn na datasetu založeném na datech titulků z filmů. Jeho výkon je hodnocen na základě schopnosti odhadovat délku ticha mezi dvojicemi titulků. Experiment navrhuje metodu ladění jazykového modelu pomocí ticha zakódovaného jako řetězce znaků. Výsledky ukazují, že ladění GPT-3 skutečně může zlepšit výkon modelu při odhadování mezer ticha mezi řadami titulků. Keywords: dialog, ticho, GPT-3, ladění, jazykové modely Prohlašuji, že jsem diplomovou práci vypracoval samostatně, že jsem řádně citoval všechny použité prameny a literaturu a že práce nebyla využita v rámci jiného vysokoškolského studia či k získání jiného nebo stejného titulu. viii

Abstrakt (anglicky)

Silence is an indispensable aspect of dialogue. The following thesis examines the silence in dialogue from a variety of perspectives. First, I provide a background on the historical development of theories of dialogue and the place of silence within them. Second, I conduct a study of the capacity of one of the most prominent contemporary language models, called the GPT-3, to model silence in dialogue. I fine-tune the model on a dataset based on movie subtitle data. I evaluate its performance on its capacity to infer the length of silence between subtitle pairs. The experiment proposes a method of fine-tuning the language model via silence encoded as character strings. The results show that GPT-3 fine-tuning can indeed improve the model's performance by inferring silence gaps between subtitle turns. Keywords: dialogue, silence, GPT-3, fine-tuning, language models I declare that I have written my diploma thesis independently and that I have properly cited all the sources and literature used, and that the work has not been used in the context of another university study or to obtain another or the same degree. vii

Citace dokumentu

Metadata

Zobrazit celý záznam