Komprese e-mailu
Compression of e-mails
bakalářská práce (OBHÁJENO)
![Náhled dokumentu](/bitstream/handle/20.500.11956/31021/thumbnail.png?sequence=7&isAllowed=y)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/31021Identifikátory
SIS: 46794
Kolekce
- Kvalifikační práce [11264]
Autor
Vedoucí práce
Oponent práce
Holubová, Irena
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Správa počítačových systémů
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
14. 9. 2009
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
E-mail je velmi specifická datová struktura upravená příslušnými normami RFC. Běžná komprese pro textová data použitá na emaily nezohledňuje strukturu emailu, nejvíce je patrná nízká účinnost běžných metod u malých souborů, v nichž velikost hlavičky často převažuje nad délkou vlastního těla zprávy, nebo naopak u emailů s velkými zakódovanými přílohami. Tato bakalářská práce se pokouší navrhnout a implementovat vhodný algoritmus na kompresi tohoto typu dat. Rozdělením e-mailu na hlavičky a vlastní obsah, samostatnou kompresí hlaviček vlastním algoritmem založeném na slovníkové kompresi a kompresí těla a příloh dle MIME typu jednotlivých částí vhodnými existujícími programy a algoritmy se pokouší zvýšit účinnost komprese tohoto typu dat.
E-mail is a very specific data structure described in appropriate RFC standards. Common text-based compression applied to e-mails does not regard e-mail structure. Low compression ratio of common methods is noticeable on small files where header size often exceeds message body length or on e-mails with big encoded attachments. This bachelor thesis tries to suggest and implement a suitable algorithm for this type of data. By separating an e-mail message into headers and content, compressing headers with own dictionary-based algorithm, body and attachments with suitable existing programs or algorithms according to MIME type of the parts, separately, it tries to increase efficiency of compression of this type of data.