Algoritmy dělení slov na slabiky
Algorithms of decomposing words into syllables
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/12972Identifikátory
SIS: 45730
Kolekce
- Kvalifikační práce [11264]
Autor
Vedoucí práce
Oponent práce
Žemlička, Michal
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná informatika
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
10. 9. 2007
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Na kratších a středně dlouhých textech v morfologicky bohatých jazycích se projevila vhodnost komprese na základě slabik. S ohledem na správné dělení je však potřebná relativní variabilita návrhu definic jazyka a algoritmů dělení na slabiky. V této práci představujeme systém SCORP zahrnující jazyk, jeho překladač do podoby pseudokódu a interpret parseru v rámci kompresních algorimů. S jeho pomocí jsme vytvořili český algoritmus dělení na slabiky obsahující znalost jazyka. Jeho výsledky a kompresní poměry slabikových kompresních algoritmů jsou porovnány s odpovídajícími výsledky univerzálních metod dělení.
The syllable-based compression gives good results in small or middle-sized text documents written in the richly morphological languages. The problem of decomposition of the words into syllables requires relative variability of the design of the language denitions and division algorithms. We propose SCORP system for this reason. This system includes program- ming language, compiler and interpret which is incorporated in compression algorithms. In this language we create specic Czech algorithm decomposing words into the syllables. Its result and compression rates are compared with the universal methods of division.