Analýza klauzí v českém souvětí
Clause analysis in Czech conmplex sentences
diplomová práce (OBHÁJENO)
![Náhled dokumentu](/bitstream/handle/20.500.11956/17250/thumbnail.png?sequence=7&isAllowed=y)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/17250Identifikátory
SIS: 45636
Kolekce
- Kvalifikační práce [11266]
Autor
Vedoucí práce
Oponent práce
Lopatková, Markéta
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Počítačová a formální lingvistika
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
8. 9. 2008
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Velmi dobře
Tato diplomová práce se zabývá problematikou identifikace klauzí v českých morfologicky označkovaných větách a vztahů mezi nimi. Problém pojímá jako úlohu strojového učení. Předkládá se formalismus pro vyznačení klauzí a jejich vztahů v českých textech, dále metoda získání dat s vyznačením klauzí z analytické roviny Funkčního generativního popisu ve formalismu PML. Získaná data jsou použita jako trénovací a testovací pro tvorbu systému automatické identifikace klauzí a jejich vztahů. Je navržen systém vyhodnocení výsledku a představeny softwarové aplikace, které vznikly při práci na systému.
This Master thesis deals with identification of clauses in Czech morphologically annotated sentences and finding the inter-clausal relations. The task is approached as a machine-learning problem. An annotation scheme for clauses in Czech text is presented alongside with a method for deriving clause-annotated data from the analytical layer of Functional Generative Description coded in the Prague Markup Language. The gathered data are used for training and evaluating a system of automated identification of clauses and their relations. A method of evaluation of the result is suggested and separate software applications created during the development are presented.