Vhodné metody úpravy dat pro víceproudou kompresi
Suitable methods of data prepration for mutistream compression
bachelor thesis (DEFENDED)
data:image/s3,"s3://crabby-images/30b5c/30b5ce9fff2713a91702fa4ec3fb2ba96721e471" alt="Document thumbnail"
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/50283Identifiers
Study Information System: 79190
Collections
- Kvalifikační práce [11267]
Author
Advisor
Referee
Falt, Zbyněk
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Computer Science
Department
Department of Software Engineering
Date of defense
7. 9. 2011
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Very good
Keywords (Czech)
Komprese, víceproudý, slabiky, textKeywords (English)
Compression, multistream, syllables, textPráce se zabývá kompresním algoritmem zvaným víceproudá komprese. Chtěli jsme dosáhnout dostatečného zlepšení algoritmu tak, aby byl konkurenceschopný existujícím kompresním formátům. V kombinaci se známými tranformačními algoritmy jsme zkoušeli, zda se nepodaří na textových dokumentech dosáhnout dostatečně dobrých výsledků. Dále bylo testováno, jak se výsledky změní čtením textu po větších blocích - a to jak pevné délky (dvojice, čtveřice znaků), tak i po blocích proměnlivé délky, jako jsou slabiky, případně slova. Také byly podniknuty jisté pokusy algoritmus víceproudé komprese mírně upravit. Byly testovány i další metody pro kódování uvnitř algoritmu.
This work focuses on compression algorithm called multistream compression. We have tried to improve this algorithm to be competitive with other commonly used compression algorithms. We have also tried to combine it with well-known transformations like BWT or MTF to efficiently handle text files. Another part of the research was compose characters into bigger parts and transform the result by multistream compression. We have tried blocks of constant length like bigrams and blocks of variable length like syllables or words. Last experiments was with small changes of MSC algorithm and compare them with the original algorithm.