dc.contributor.advisor | Žemlička, Michal | |
dc.creator | Matouš, Václav | |
dc.date.accessioned | 2017-04-06T11:31:47Z | |
dc.date.available | 2017-04-06T11:31:47Z | |
dc.date.issued | 2007 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/13254 | |
dc.description.abstract | V rámci této práce byl vytvořen prototyp úložiště html dokumentů. Ukládání celých dokumentů je založeno jak na stávajících kompresních technikách (gzip, bzip2), tak i na novým metodách, kdy se dokument před kompresí vhodným způsobem předzpracuje. Ukládá-li se k jednomu dokumentu více verzí, mohou některé z nich být uloženy v podobě rozdílového souboru - je-li to v daném případě výhodné. Tyto rozdílové soubory mohou být opět komprimovány. V testech se metody z předzpracováním ukázaly jako mírně účinnější než metody původní. Rozdíl mezi účinností testovaných bezeztrátových a ztrátových metod předzpracování je relativně malý. Kombinace výše uvedených technik se v testech ukázala jako vhodná náhrada za kompaktní (solidní) archivy verzí jednotlivých dokumentů, přičemž navíc poskytuje velmi rychlý přístup k poslední (aktuální) verzi dokumentu, o které předpokládáme, že bude tou nejčastji požadovanou. | cs_CZ |
dc.description.abstract | In the presented work a prototype of a storage for html documents is designed and implemented. The storing of complete documents is based on both current compression techniques (gzip, bzip2) and new methods. An input document is modi ed by the new methods and compressed by the current techniques. If there are stored many versions of the same document, some of them can be stored in the form of di erential les { in the case that it is more useful. These di erential les can be compressed as well. The compression methods with preprocessed input are a bit more e ffective than the original methods. The diff erence of efficiency of lossy and lossless compression methods is in this case relatively small. The performed tests showed that a combination of mentioned techniques could be a suitable substitution of compact archives for versioned documents. The implementation guarantees quick access to the actual version what is very important as we suppose that such versions will be the most requested ones. | en_US |
dc.language | Čeština | cs_CZ |
dc.language.iso | cs_CZ | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.title | Efektivní ukládání html stránek | cs_CZ |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2007 | |
dcterms.dateAccepted | 2007-09-18 | |
dc.description.department | Katedra softwarového inženýrství | cs_CZ |
dc.description.department | Department of Software Engineering | en_US |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.identifier.repId | 46228 | |
dc.title.translated | Effective storage for html documents | en_US |
dc.contributor.referee | Lánský, Jan | |
dc.identifier.aleph | 000930993 | |
thesis.degree.name | Mgr. | |
thesis.degree.level | magisterské | cs_CZ |
thesis.degree.discipline | Datové inženýrství | cs_CZ |
thesis.degree.discipline | Data Engineering | en_US |
thesis.degree.program | Informatics | en_US |
thesis.degree.program | Informatika | cs_CZ |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra softwarového inženýrství | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Software Engineering | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Datové inženýrství | cs_CZ |
uk.degree-discipline.en | Data Engineering | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Informatics | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | V rámci této práce byl vytvořen prototyp úložiště html dokumentů. Ukládání celých dokumentů je založeno jak na stávajících kompresních technikách (gzip, bzip2), tak i na novým metodách, kdy se dokument před kompresí vhodným způsobem předzpracuje. Ukládá-li se k jednomu dokumentu více verzí, mohou některé z nich být uloženy v podobě rozdílového souboru - je-li to v daném případě výhodné. Tyto rozdílové soubory mohou být opět komprimovány. V testech se metody z předzpracováním ukázaly jako mírně účinnější než metody původní. Rozdíl mezi účinností testovaných bezeztrátových a ztrátových metod předzpracování je relativně malý. Kombinace výše uvedených technik se v testech ukázala jako vhodná náhrada za kompaktní (solidní) archivy verzí jednotlivých dokumentů, přičemž navíc poskytuje velmi rychlý přístup k poslední (aktuální) verzi dokumentu, o které předpokládáme, že bude tou nejčastji požadovanou. | cs_CZ |
uk.abstract.en | In the presented work a prototype of a storage for html documents is designed and implemented. The storing of complete documents is based on both current compression techniques (gzip, bzip2) and new methods. An input document is modi ed by the new methods and compressed by the current techniques. If there are stored many versions of the same document, some of them can be stored in the form of di erential les { in the case that it is more useful. These di erential les can be compressed as well. The compression methods with preprocessed input are a bit more e ffective than the original methods. The diff erence of efficiency of lossy and lossless compression methods is in this case relatively small. The performed tests showed that a combination of mentioned techniques could be a suitable substitution of compact archives for versioned documents. The implementation guarantees quick access to the actual version what is very important as we suppose that such versions will be the most requested ones. | en_US |
uk.file-availability | V | |
uk.publication.place | Praha | cs_CZ |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrství | cs_CZ |
dc.identifier.lisID | 990009309930106986 | |