dc.contributor.advisor | Kasner, Zdeněk | |
dc.creator | Bucková, Katarína | |
dc.date.accessioned | 2025-02-06T11:39:32Z | |
dc.date.available | 2025-02-06T11:39:32Z | |
dc.date.issued | 2023 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/196385 | |
dc.description.abstract | Story generation, especially generating longer stories, is a complex problem regarding coherency and repetition. Even hierarchically generated stories may diverge from the outline due to the nature of left-to-right autoregressive decoding, which provides only a weak supervision signal. An alternative to left-to-right decoding is text infilling, which may achieve better coherence in text generation based on providing the left and right context. The goal of the work is to examine the potential of text infilling for generating stories. We propose a method of story generation by expanding the plot by infilling sentences between the plot points. We evaluate the generated stories and compare them to stories generated by prompted large language model. The results show that stories generated by text infilling are worse than stories generated by the large language model. Even though they achieve good coherence, the stories generated by text infilling are deemed confusing and repetitive. 1 | en_US |
dc.description.abstract | Generovanie príbehov, najmä generovanie dlhších príbehov, je komplexný problém z hľadiska koherencie a opakovania. Aj hierarchicky generované príbehy sa môžu líšiť od osnovy kvôli povahe ľavo-pravého autoregresívneho dekódovania, ktoré poskytuje len slabý signál dohľadu. Alternatívou k dekódovaniu zľava doprava je vypĺňanie textu, ktoré môže dosahovať lepšiu koherenciu pri generovaní textu na základe poskytnutia ľavého a pravého kontextu. Cieľom práce je preskúmať potenciál generovania príbehov vypĺňaním textu. Navrhu- jeme spôsob generovania príbehov rozšírením osnovy dopĺňaním viet medzi jednotlivé body osnovy. Vygenerované príbehy vyhodnocujeme a porovnávame s príbehmi vygenerovanými veľkým jazykovým modelom. Výsledky ukazujú, že príbehy generované dopĺňaním textu sú horšie ako príbehy generované veľkým jazykovým modelom. Aj napriek dosahu dobrej koherencie, príbehy generované vypĺňaním textu sú vyhodnotené ako mätúce a obsahu- júce opakujúce sa sekvencie. 1 | cs_CZ |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | generování příběhů|jazykové modely|neuronové sítě | cs_CZ |
dc.subject | story generation|language models|neural networks | en_US |
dc.title | Story Generation Using Dynamic Text Infilling | en_US |
dc.type | bakalářská práce | cs_CZ |
dcterms.created | 2023 | |
dcterms.dateAccepted | 2023-09-07 | |
dc.description.department | Ústav formální a aplikované lingvistiky | cs_CZ |
dc.description.department | Institute of Formal and Applied Linguistics | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 253716 | |
dc.title.translated | Generování příběhů pomocí dynamického rozšiřování textu | cs_CZ |
dc.contributor.referee | Rosa, Rudolf | |
thesis.degree.name | Bc. | |
thesis.degree.level | bakalářské | cs_CZ |
thesis.degree.discipline | Computer Science with specialisation in Programming and Software Development | en_US |
thesis.degree.discipline | Informatika se specializací Programování a vývoj software | cs_CZ |
thesis.degree.program | Computer Science | en_US |
thesis.degree.program | Informatika | cs_CZ |
uk.thesis.type | bakalářská práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Ústav formální a aplikované lingvistiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Institute of Formal and Applied Linguistics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Informatika se specializací Programování a vývoj software | cs_CZ |
uk.degree-discipline.en | Computer Science with specialisation in Programming and Software Development | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Computer Science | en_US |
thesis.grade.cs | Dobře | cs_CZ |
thesis.grade.en | Good | en_US |
uk.abstract.cs | Generovanie príbehov, najmä generovanie dlhších príbehov, je komplexný problém z hľadiska koherencie a opakovania. Aj hierarchicky generované príbehy sa môžu líšiť od osnovy kvôli povahe ľavo-pravého autoregresívneho dekódovania, ktoré poskytuje len slabý signál dohľadu. Alternatívou k dekódovaniu zľava doprava je vypĺňanie textu, ktoré môže dosahovať lepšiu koherenciu pri generovaní textu na základe poskytnutia ľavého a pravého kontextu. Cieľom práce je preskúmať potenciál generovania príbehov vypĺňaním textu. Navrhu- jeme spôsob generovania príbehov rozšírením osnovy dopĺňaním viet medzi jednotlivé body osnovy. Vygenerované príbehy vyhodnocujeme a porovnávame s príbehmi vygenerovanými veľkým jazykovým modelom. Výsledky ukazujú, že príbehy generované dopĺňaním textu sú horšie ako príbehy generované veľkým jazykovým modelom. Aj napriek dosahu dobrej koherencie, príbehy generované vypĺňaním textu sú vyhodnotené ako mätúce a obsahu- júce opakujúce sa sekvencie. 1 | cs_CZ |
uk.abstract.en | Story generation, especially generating longer stories, is a complex problem regarding coherency and repetition. Even hierarchically generated stories may diverge from the outline due to the nature of left-to-right autoregressive decoding, which provides only a weak supervision signal. An alternative to left-to-right decoding is text infilling, which may achieve better coherence in text generation based on providing the left and right context. The goal of the work is to examine the potential of text infilling for generating stories. We propose a method of story generation by expanding the plot by infilling sentences between the plot points. We evaluate the generated stories and compare them to stories generated by prompted large language model. The results show that stories generated by text infilling are worse than stories generated by the large language model. Even though they achieve good coherence, the stories generated by text infilling are deemed confusing and repetitive. 1 | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky | cs_CZ |
thesis.grade.code | 3 | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |