Vhodné metody úpravy dat pro víceproudou kompresi
Suitable methods of data prepration for mutistream compression
bakalářská práce (OBHÁJENO)

Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/50283Identifikátory
SIS: 79190
Kolekce
- Kvalifikační práce [11267]
Autor
Vedoucí práce
Oponent práce
Falt, Zbyněk
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná informatika
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
7. 9. 2011
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Velmi dobře
Klíčová slova (česky)
Komprese, víceproudý, slabiky, textKlíčová slova (anglicky)
Compression, multistream, syllables, textPráce se zabývá kompresním algoritmem zvaným víceproudá komprese. Chtěli jsme dosáhnout dostatečného zlepšení algoritmu tak, aby byl konkurenceschopný existujícím kompresním formátům. V kombinaci se známými tranformačními algoritmy jsme zkoušeli, zda se nepodaří na textových dokumentech dosáhnout dostatečně dobrých výsledků. Dále bylo testováno, jak se výsledky změní čtením textu po větších blocích - a to jak pevné délky (dvojice, čtveřice znaků), tak i po blocích proměnlivé délky, jako jsou slabiky, případně slova. Také byly podniknuty jisté pokusy algoritmus víceproudé komprese mírně upravit. Byly testovány i další metody pro kódování uvnitř algoritmu.
This work focuses on compression algorithm called multistream compression. We have tried to improve this algorithm to be competitive with other commonly used compression algorithms. We have also tried to combine it with well-known transformations like BWT or MTF to efficiently handle text files. Another part of the research was compose characters into bigger parts and transform the result by multistream compression. We have tried blocks of constant length like bigrams and blocks of variable length like syllables or words. Last experiments was with small changes of MSC algorithm and compare them with the original algorithm.