Silence in dialogue

Laichter, Štěpán

Ticho v dialogu

dc.contributor.advisor	Fernandez Rovira, Raquel
dc.creator	Laichter, Štěpán
dc.date.accessioned	2023-07-24T19:17:18Z
dc.date.available	2023-07-24T19:17:18Z
dc.date.issued	2023
dc.identifier.uri	http://hdl.handle.net/20.500.11956/182684
dc.description.abstract	Silence is an indispensable aspect of dialogue. The following thesis examines the silence in dialogue from a variety of perspectives. First, I provide a background on the historical development of theories of dialogue and the place of silence within them. Second, I conduct a study of the capacity of one of the most prominent contemporary language models, called the GPT-3, to model silence in dialogue. I fine-tune the model on a dataset based on movie subtitle data. I evaluate its performance on its capacity to infer the length of silence between subtitle pairs. The experiment proposes a method of fine-tuning the language model via silence encoded as character strings. The results show that GPT-3 fine-tuning can indeed improve the model's performance by inferring silence gaps between subtitle turns. Keywords: dialogue, silence, GPT-3, fine-tuning, language models I declare that I have written my diploma thesis independently and that I have properly cited all the sources and literature used, and that the work has not been used in the context of another university study or to obtain another or the same degree. vii	en_US
dc.description.abstract	Ticho je nezbytnou součástí dialogu. Následující diplomová práce zkoumá ticho v dialogu z teoretické a aplikované perspektivy. Nejprve mapuje historický vývoj teorií dialogu a jejich přístup k tichu. Dále zahrnuje studii schopnosti jednoho z nejvýznamnějších současných jazykových modelů GPT-3 modelovat ticho v dialogu. Model je laděn na datasetu založeném na datech titulků z filmů. Jeho výkon je hodnocen na základě schopnosti odhadovat délku ticha mezi dvojicemi titulků. Experiment navrhuje metodu ladění jazykového modelu pomocí ticha zakódovaného jako řetězce znaků. Výsledky ukazují, že ladění GPT-3 skutečně může zlepšit výkon modelu při odhadování mezer ticha mezi řadami titulků. Keywords: dialog, ticho, GPT-3, ladění, jazykové modely Prohlašuji, že jsem diplomovou práci vypracoval samostatně, že jsem řádně citoval všechny použité prameny a literaturu a že práce nebyla využita v rámci jiného vysokoškolského studia či k získání jiného nebo stejného titulu. viii	cs_CZ
dc.language	English	cs_CZ
dc.language.iso	en_US
dc.publisher	Univerzita Karlova, Filozofická fakulta	cs_CZ
dc.subject	dialogue\|silence\|GPT-3\|fine-tuning\|language models	en_US
dc.subject	dialog\|ticho\|GPT-3\|ladění\|jazykové modely	cs_CZ
dc.title	Silence in dialogue	en_US
dc.type	diplomová práce	cs_CZ
dcterms.created	2023
dcterms.dateAccepted	2023-06-16
dc.description.department	Katedra logiky	cs_CZ
dc.description.department	Department of Logic	en_US
dc.description.faculty	Faculty of Arts	en_US
dc.description.faculty	Filozofická fakulta	cs_CZ
dc.identifier.repId	245655
dc.title.translated	Ticho v dialogu	cs_CZ
dc.contributor.referee	Dušek, Ondřej
thesis.degree.name	Mgr.
thesis.degree.level	navazující magisterské	cs_CZ
thesis.degree.discipline	Logika	cs_CZ
thesis.degree.discipline	Logic	en_US
thesis.degree.program	Logika	cs_CZ
thesis.degree.program	Logic	en_US
uk.thesis.type	diplomová práce	cs_CZ
uk.taxonomy.organization-cs	Filozofická fakulta::Katedra logiky	cs_CZ
uk.taxonomy.organization-en	Faculty of Arts::Department of Logic	en_US
uk.faculty-name.cs	Filozofická fakulta	cs_CZ
uk.faculty-name.en	Faculty of Arts	en_US
uk.faculty-abbr.cs	FF	cs_CZ
uk.degree-discipline.cs	Logika	cs_CZ
uk.degree-discipline.en	Logic	en_US
uk.degree-program.cs	Logika	cs_CZ
uk.degree-program.en	Logic	en_US
thesis.grade.cs	Výborně	cs_CZ
thesis.grade.en	Excellent	en_US
uk.abstract.cs	Ticho je nezbytnou součástí dialogu. Následující diplomová práce zkoumá ticho v dialogu z teoretické a aplikované perspektivy. Nejprve mapuje historický vývoj teorií dialogu a jejich přístup k tichu. Dále zahrnuje studii schopnosti jednoho z nejvýznamnějších současných jazykových modelů GPT-3 modelovat ticho v dialogu. Model je laděn na datasetu založeném na datech titulků z filmů. Jeho výkon je hodnocen na základě schopnosti odhadovat délku ticha mezi dvojicemi titulků. Experiment navrhuje metodu ladění jazykového modelu pomocí ticha zakódovaného jako řetězce znaků. Výsledky ukazují, že ladění GPT-3 skutečně může zlepšit výkon modelu při odhadování mezer ticha mezi řadami titulků. Keywords: dialog, ticho, GPT-3, ladění, jazykové modely Prohlašuji, že jsem diplomovou práci vypracoval samostatně, že jsem řádně citoval všechny použité prameny a literaturu a že práce nebyla využita v rámci jiného vysokoškolského studia či k získání jiného nebo stejného titulu. viii	cs_CZ
uk.abstract.en	Silence is an indispensable aspect of dialogue. The following thesis examines the silence in dialogue from a variety of perspectives. First, I provide a background on the historical development of theories of dialogue and the place of silence within them. Second, I conduct a study of the capacity of one of the most prominent contemporary language models, called the GPT-3, to model silence in dialogue. I fine-tune the model on a dataset based on movie subtitle data. I evaluate its performance on its capacity to infer the length of silence between subtitle pairs. The experiment proposes a method of fine-tuning the language model via silence encoded as character strings. The results show that GPT-3 fine-tuning can indeed improve the model's performance by inferring silence gaps between subtitle turns. Keywords: dialogue, silence, GPT-3, fine-tuning, language models I declare that I have written my diploma thesis independently and that I have properly cited all the sources and literature used, and that the work has not been used in the context of another university study or to obtain another or the same degree. vii	en_US
uk.file-availability	V
uk.grantor	Univerzita Karlova, Filozofická fakulta, Katedra logiky	cs_CZ
thesis.grade.code	1
uk.publication-place	Praha	cs_CZ
uk.thesis.defenceStatus	O