Slabikové PPM
Syllable-based PPM
bakalářská práce (OBHÁJENO)
![Náhled dokumentu](/bitstream/handle/20.500.11956/18569/thumbnail.png?sequence=7&isAllowed=y)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/18569Identifikátory
SIS: 57205
Kolekce
- Kvalifikační práce [11266]
Autor
Vedoucí práce
Oponent práce
Babka, Vlastimil
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná informatika
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
9. 9. 2008
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
PPM je adaptivní metoda pro komprimaci dat využívající kontext. V průběhu PPM komprese se na základě již zkomprimované části souboru staví strom kontextů maximální délky k, pomocí něhož se predikují pravděpodobnosti výskytu dalších znaků s použitím kontextu proměnlivé délky nejvýše řádu k. Jednotlivým znakům jsou přiřazovány kódy na základě takto získaných pravděpodobností. Cílem této bakalářské práce je implementace slabikové verze algoritmu PPM a porovnání jejích výsledků s verzí písmennou a slovní. Práce vychází z implementace slabikového parseru popsaného v [7].
PPM is an adaptive comprimation method which works with the data's context. During PPM compression, a tree of contexts of maximum length k is built based on the already processed part of the file, which is then used to predict the probability of the next character using variablelength context of maximum length k. Codes are then assigned to different characters based on these probabilities. The goal of this work is the implementation of a syllable-based version of a PPM algorithm and comparison of it's results with symbol-based and word-based versions. This work is based on the implementation of a syllable parser as described in [7].