Eliptic indexing of multidimensional databases
Eliptické indexování vícerozměrných dat
diploma thesis (DEFENDED)
![Document thumbnail](/bitstream/handle/20.500.11956/14850/thumbnail.png?sequence=7&isAllowed=y)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/14850Identifiers
Study Information System: 48594
Collections
- Kvalifikační práce [11264]
Author
Advisor
Referee
Hoksza, David
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software systems
Department
Department of Software Engineering
Date of defense
26. 5. 2008
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
V tejto práci je diskutovaná variácia R-stromu, ktorá k hierarchickému deleniu indexovaného priestoru využíva namiesto bežne používaných minimálne ohraničujúcich obdlžnikov minimálne ohraničujúce ellipsoidy (MVCE). V úvode práce sú zosumarizované hlavné faktory ovplyvňujúce výkon Rstromových štruktúr z dostupných štúdií, čo vedie k niekolkým variantá"eR-stromu" (ellipsoid R-tree). Následne sú rozobrané známe algoritmy konštrukcie ellipsoidov. Výber vhodnej metódy konštrukcie MVCE je jedným z klúčových faktorov ovplyvňujúcich efektivitu indexácie a následného vyhladávania. V závere práce je prezentovaná experimentálna implementácia eRstromu nad frameworkom ATOM. Výhodnost použitia MVCE v R-strome je prezentovaná experimentami jak nad syntetickými datami, tak nad reálnymi.
In this work variation of R-tree, which hierarchically partition indexed space using minimum volume covering ellipsoids (MVCE) instead of usually used minimum bounding rectangles, is presented. Main aspects, which determine R-tree index structure performance, are studied from the available resources at the beginning. Base on this studies "e-Rtree" (ellipsoid R-tree) is designed. Afterward algorithms of MVCE construction are carefully analyzed, as the choice of the algorithm is crucial for the efficiency of indexing and retrieval. At the end of the work, eR-tree implementation over ATOM framework is presented along with experiments done on synthetic and real data sets.