dc.contributor.advisor | Fernandez Rovira, Raquel | |
dc.creator | Laichter, Štěpán | |
dc.date.accessioned | 2023-07-24T19:17:18Z | |
dc.date.available | 2023-07-24T19:17:18Z | |
dc.date.issued | 2023 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/182684 | |
dc.description.abstract | Silence is an indispensable aspect of dialogue. The following thesis examines the silence in dialogue from a variety of perspectives. First, I provide a background on the historical development of theories of dialogue and the place of silence within them. Second, I conduct a study of the capacity of one of the most prominent contemporary language models, called the GPT-3, to model silence in dialogue. I fine-tune the model on a dataset based on movie subtitle data. I evaluate its performance on its capacity to infer the length of silence between subtitle pairs. The experiment proposes a method of fine-tuning the language model via silence encoded as character strings. The results show that GPT-3 fine-tuning can indeed improve the model's performance by inferring silence gaps between subtitle turns. Keywords: dialogue, silence, GPT-3, fine-tuning, language models I declare that I have written my diploma thesis independently and that I have properly cited all the sources and literature used, and that the work has not been used in the context of another university study or to obtain another or the same degree. vii | en_US |
dc.description.abstract | Ticho je nezbytnou součástí dialogu. Následující diplomová práce zkoumá ticho v dialogu z teoretické a aplikované perspektivy. Nejprve mapuje historický vývoj teorií dialogu a jejich přístup k tichu. Dále zahrnuje studii schopnosti jednoho z nejvýznamnějších současných jazykových modelů GPT-3 modelovat ticho v dialogu. Model je laděn na datasetu založeném na datech titulků z filmů. Jeho výkon je hodnocen na základě schopnosti odhadovat délku ticha mezi dvojicemi titulků. Experiment navrhuje metodu ladění jazykového modelu pomocí ticha zakódovaného jako řetězce znaků. Výsledky ukazují, že ladění GPT-3 skutečně může zlepšit výkon modelu při odhadování mezer ticha mezi řadami titulků. Keywords: dialog, ticho, GPT-3, ladění, jazykové modely Prohlašuji, že jsem diplomovou práci vypracoval samostatně, že jsem řádně citoval všechny použité prameny a literaturu a že práce nebyla využita v rámci jiného vysokoškolského studia či k získání jiného nebo stejného titulu. viii | cs_CZ |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Filozofická fakulta | cs_CZ |
dc.subject | dialogue|silence|GPT-3|fine-tuning|language models | en_US |
dc.subject | dialog|ticho|GPT-3|ladění|jazykové modely | cs_CZ |
dc.title | Silence in dialogue | en_US |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2023 | |
dcterms.dateAccepted | 2023-06-16 | |
dc.description.department | Katedra logiky | cs_CZ |
dc.description.department | Department of Logic | en_US |
dc.description.faculty | Faculty of Arts | en_US |
dc.description.faculty | Filozofická fakulta | cs_CZ |
dc.identifier.repId | 245655 | |
dc.title.translated | Ticho v dialogu | cs_CZ |
dc.contributor.referee | Dušek, Ondřej | |
thesis.degree.name | Mgr. | |
thesis.degree.level | navazující magisterské | cs_CZ |
thesis.degree.discipline | Logika | cs_CZ |
thesis.degree.discipline | Logic | en_US |
thesis.degree.program | Logika | cs_CZ |
thesis.degree.program | Logic | en_US |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Filozofická fakulta::Katedra logiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Arts::Department of Logic | en_US |
uk.faculty-name.cs | Filozofická fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Arts | en_US |
uk.faculty-abbr.cs | FF | cs_CZ |
uk.degree-discipline.cs | Logika | cs_CZ |
uk.degree-discipline.en | Logic | en_US |
uk.degree-program.cs | Logika | cs_CZ |
uk.degree-program.en | Logic | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Ticho je nezbytnou součástí dialogu. Následující diplomová práce zkoumá ticho v dialogu z teoretické a aplikované perspektivy. Nejprve mapuje historický vývoj teorií dialogu a jejich přístup k tichu. Dále zahrnuje studii schopnosti jednoho z nejvýznamnějších současných jazykových modelů GPT-3 modelovat ticho v dialogu. Model je laděn na datasetu založeném na datech titulků z filmů. Jeho výkon je hodnocen na základě schopnosti odhadovat délku ticha mezi dvojicemi titulků. Experiment navrhuje metodu ladění jazykového modelu pomocí ticha zakódovaného jako řetězce znaků. Výsledky ukazují, že ladění GPT-3 skutečně může zlepšit výkon modelu při odhadování mezer ticha mezi řadami titulků. Keywords: dialog, ticho, GPT-3, ladění, jazykové modely Prohlašuji, že jsem diplomovou práci vypracoval samostatně, že jsem řádně citoval všechny použité prameny a literaturu a že práce nebyla využita v rámci jiného vysokoškolského studia či k získání jiného nebo stejného titulu. viii | cs_CZ |
uk.abstract.en | Silence is an indispensable aspect of dialogue. The following thesis examines the silence in dialogue from a variety of perspectives. First, I provide a background on the historical development of theories of dialogue and the place of silence within them. Second, I conduct a study of the capacity of one of the most prominent contemporary language models, called the GPT-3, to model silence in dialogue. I fine-tune the model on a dataset based on movie subtitle data. I evaluate its performance on its capacity to infer the length of silence between subtitle pairs. The experiment proposes a method of fine-tuning the language model via silence encoded as character strings. The results show that GPT-3 fine-tuning can indeed improve the model's performance by inferring silence gaps between subtitle turns. Keywords: dialogue, silence, GPT-3, fine-tuning, language models I declare that I have written my diploma thesis independently and that I have properly cited all the sources and literature used, and that the work has not been used in the context of another university study or to obtain another or the same degree. vii | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Filozofická fakulta, Katedra logiky | cs_CZ |
thesis.grade.code | 1 | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |