Slabikové PPM
Syllable-based PPM
bachelor thesis (DEFENDED)
![Document thumbnail](/bitstream/handle/20.500.11956/18569/thumbnail.png?sequence=7&isAllowed=y)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/18569Identifiers
Study Information System: 57205
Collections
- Kvalifikační práce [11266]
Author
Advisor
Referee
Babka, Vlastimil
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Computer Science
Department
Department of Software Engineering
Date of defense
9. 9. 2008
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
PPM je adaptivní metoda pro komprimaci dat využívající kontext. V průběhu PPM komprese se na základě již zkomprimované části souboru staví strom kontextů maximální délky k, pomocí něhož se predikují pravděpodobnosti výskytu dalších znaků s použitím kontextu proměnlivé délky nejvýše řádu k. Jednotlivým znakům jsou přiřazovány kódy na základě takto získaných pravděpodobností. Cílem této bakalářské práce je implementace slabikové verze algoritmu PPM a porovnání jejích výsledků s verzí písmennou a slovní. Práce vychází z implementace slabikového parseru popsaného v [7].
PPM is an adaptive comprimation method which works with the data's context. During PPM compression, a tree of contexts of maximum length k is built based on the already processed part of the file, which is then used to predict the probability of the next character using variablelength context of maximum length k. Codes are then assigned to different characters based on these probabilities. The goal of this work is the implementation of a syllable-based version of a PPM algorithm and comparison of it's results with symbol-based and word-based versions. This work is based on the implementation of a syllable parser as described in [7].