Zobrazit minimální záznam

Universal Full-Text Index
dc.contributor.advisorHolub, Martin
dc.creatorŠvantner, Marek
dc.date.accessioned2017-03-31T09:43:28Z
dc.date.available2017-03-31T09:43:28Z
dc.date.issued2007
dc.identifier.urihttp://hdl.handle.net/20.500.11956/8148
dc.description.abstractThis diploma thesis deals with the design and implementation of a highly efficient universal index of textual documents. Universal stands for an opportunity to configure structures of index records and methods of the index data processing (without recompiling an application). Furthermore, it means that the index library can be used even for other purposes, for example to implement a thesaurus, to represent bibliographic relationships or even for generic representation of a specific class of functions in other areas than documentographic systems. The index is implemented using the dynamic inverted file which can be efficiently updated without need of the data structure rebuilding. Specific issue is on-line index compression and failure recovery via the transactional log. It is shown that the amortized complexity of the data structure is linear. This fact is afterwards experimentally verified. Other experiments address the compression methods and the impact of the data structure parameters on its efficiency. The diploma thesis contains the implementation of the universal index in C/C++. It has been tested in the Linux and Windows XP environments.en_US
dc.description.abstractDiplomová práce se zabývá návrhem a implementací vysoce efektivního univerzálního indexu textových dokumentů. Univerzální znamená možnost jednak konfigurovat struktury indexových záznamů a metod zpracování dat (bez nutnosti rekompilace), jednak použít knihovnu indexu i pro jiné účely, například pro tvorbu tezauru, reprezentaci bibliografických vztahů nebo pro reprezentaci určité třídy funkcí v jiných oblastech než jsou dokumentografické systémy. Pro implementaci je navržen dynamický invertovaný soubor, který umožňuje efektivně provádět aktualizační operace bez nutnosti přebudování datové struktury. Specifickými oblastmi práce jsou i on-line komprese indexu a zajištění odolnosti datové struktury proti výpadkům pomocí transakčního zpracování. Je odvozena konstantní amortizovaná složitost struktury, která je poté experimentálně ověřena. Další experimenty se týkají i výkonu kompresních metod a vlivu parametrů datové struktury na její výkon a zabraný prostor. Diplomová práce obsahuje vlastní implementaci univerzálního indexu v C/C++ testovanou v prostředích Linux a Windows XP.cs_CZ
dc.languageČeštinacs_CZ
dc.language.isocs_CZ
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.titleUniverzální index textových dokumentůcs_CZ
dc.typediplomová prácecs_CZ
dcterms.created2007
dcterms.dateAccepted2007-02-05
dc.description.departmentKatedra softwarového inženýrstvícs_CZ
dc.description.departmentDepartment of Software Engineeringen_US
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.identifier.repId41651
dc.title.translatedUniversal Full-Text Indexen_US
dc.contributor.refereeSkopal, Tomáš
dc.identifier.aleph000866030
thesis.degree.nameMgr.
thesis.degree.levelmagisterskécs_CZ
thesis.degree.disciplineDatové inženýrstvícs_CZ
thesis.degree.disciplineData Engineeringen_US
thesis.degree.programInformatikacs_CZ
thesis.degree.programInformaticsen_US
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Katedra softwarového inženýrstvícs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Department of Software Engineeringen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csDatové inženýrstvícs_CZ
uk.degree-discipline.enData Engineeringen_US
uk.degree-program.csInformatikacs_CZ
uk.degree-program.enInformaticsen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csDiplomová práce se zabývá návrhem a implementací vysoce efektivního univerzálního indexu textových dokumentů. Univerzální znamená možnost jednak konfigurovat struktury indexových záznamů a metod zpracování dat (bez nutnosti rekompilace), jednak použít knihovnu indexu i pro jiné účely, například pro tvorbu tezauru, reprezentaci bibliografických vztahů nebo pro reprezentaci určité třídy funkcí v jiných oblastech než jsou dokumentografické systémy. Pro implementaci je navržen dynamický invertovaný soubor, který umožňuje efektivně provádět aktualizační operace bez nutnosti přebudování datové struktury. Specifickými oblastmi práce jsou i on-line komprese indexu a zajištění odolnosti datové struktury proti výpadkům pomocí transakčního zpracování. Je odvozena konstantní amortizovaná složitost struktury, která je poté experimentálně ověřena. Další experimenty se týkají i výkonu kompresních metod a vlivu parametrů datové struktury na její výkon a zabraný prostor. Diplomová práce obsahuje vlastní implementaci univerzálního indexu v C/C++ testovanou v prostředích Linux a Windows XP.cs_CZ
uk.abstract.enThis diploma thesis deals with the design and implementation of a highly efficient universal index of textual documents. Universal stands for an opportunity to configure structures of index records and methods of the index data processing (without recompiling an application). Furthermore, it means that the index library can be used even for other purposes, for example to implement a thesaurus, to represent bibliographic relationships or even for generic representation of a specific class of functions in other areas than documentographic systems. The index is implemented using the dynamic inverted file which can be efficiently updated without need of the data structure rebuilding. Specific issue is on-line index compression and failure recovery via the transactional log. It is shown that the amortized complexity of the data structure is linear. This fact is afterwards experimentally verified. Other experiments address the compression methods and the impact of the data structure parameters on its efficiency. The diploma thesis contains the implementation of the universal index in C/C++. It has been tested in the Linux and Windows XP environments.en_US
uk.file-availabilityV
uk.publication.placePrahacs_CZ
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrstvícs_CZ
dc.identifier.lisID990008660300106986


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV