Segmentační analýza českých vět
Segmentation analysis of Czech sentences
bachelor thesis (DEFENDED)
![Document thumbnail](/bitstream/handle/20.500.11956/15893/thumbnail.png?sequence=7&isAllowed=y)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/15893Identifiers
Study Information System: 45638
Collections
- Kvalifikační práce [11264]
Author
Advisor
Referee
Holan, Tomáš
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Programming
Department
Institute of Formal and Applied Linguistics
Date of defense
24. 6. 2008
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Very good
Cílem této práce je implementace segmentační analýzy českého jazyka včetně vytvoření seznamu separátorů. Kromě toho je zde navržena a implementována metoda rozdělení do klauzí. Implementace využívá český morfologický analyzátor prof. Hajiče. Samotný program je napsán v Pythonu. Metoda byla odladěna na korpusu 62 vět a otestována na korpusu velikosti 80 vět.
Objective of this work is implementing of segmentation analysis method for Czech language including creating list of separators. Also method, how to divide long sentences into clauses, is proposed and implemented. Implementation uses Czech "Free" Morfology by Jan Hajič. Program is written in Python. Method was debugged on 62-sentences and tested on 80-sentences corpus.