Natural Language Generation system writing football articles
Automatické generování fotbalových zpráv
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/179633Identifiers
Study Information System: 248835
Collections
- Kvalifikační práce [11242]
Author
Advisor
Referee
Holeňa, Martin
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Computer Science
Department
Institute of Formal and Applied Linguistics
Date of defense
7. 2. 2023
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
NLG|čeština|sport|fotbalKeywords (English)
NLG|Czech|sport|footballŽurnalistika se může stát velmi unavující hlavně proto, že její úspěch stojí na velkém množství článků většinou na úkor kvality. Některé články jsou spíše rutinní a jejich existence je podmíněna tím, že většina veřejnosti preferuje text před daty v nezpracované podobě. Myšlenkou je si práci v žurnalistice pojednávající o sportu ulehčit a automaticky generovat z dat články v českém jazyce, které shrnují dění v konkrétním fotbalovém utkání. Tato práce se zabývá analýzou implementace takového lingvistického softwaru a navíc nabízí stručný přehled procesu označovaného Natural Language Generation (zkráceně NLG). Přehled se soustředí především na popis jednotlivých podúloh NLG a rozbor problémů spjetého s nimi. Dále porovnává výhody a nevýhody hlavních možných metod, architektur a přístupů při NLG. 1
Journalism could become a tedious job as its main concern is to create as many articles as possible, usually prioritising quantity over quality. Some articles are quite routine and they need to exist just because most of the population prefers text over raw data. The idea is to ease this job and generate articles, particularly about football in Czech language, automatically from non-linguistic data. This thesis is concerned with analysing implementation of such a linguistic software and moreover offers a brief overview of a Natural Language Generation (NLG) process. The major focus of this overview is on benefits and drawbacks of different approaches to NLG as well as describing NLG tasks and its challenges you need to overcome in order to produce a similar human language (not only Czech) producing program. 1