Nativní indexování rozsáhlých XML databází
Nativní indexování rozsáhlých XML databází
rigorózní práce (UZNÁNO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/31679Identifikátory
SIS: 97127
Kolekce
- Kvalifikační práce [11217]
Autor
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
6. 12. 2010
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Uznáno
Klíčová slova (česky)
Indexovanie XML, Rho-Index, indexovanie ciest, XPath dotazyKlíčová slova (anglicky)
Indexing XML, Rho-Index, path-based indexing, XPath queriesV predloženej práci študujeme metódy indexovania pre rozsiahle XML databázy a ich časovú zložitosť pri vyhodnocovaní dotazov na vyhľadávanie ciest. Existuje množstvo spôsobov, ako indexovať XML dáta, ale my sa zameriame na indexovanie ciest od koreňa k listom a ich zhlukovanie na základe podobných kritérii. Štúdium a správna kombinácia existujúcich metód nám slúži ako základ pre vytvorenie nového natívneho indexu iXUPT, ktorý používa značkovanie ciest. Predstavujeme dve variácie indexovania v závislosti od spôsobu zisťovania vzťahu predok-potomok. Prvá možnosť používa číselnú schému, druhá využíva Rho-Index. Správnosť nášho riešenia dokážeme implementáciou prototypu a vyhodnotením niekoľkých XPath dotazov predstavujúcich cesty v grafe. Nakoniec porovnáme jednotlivé varianty a dosiahnuté výsledky s existujúcimi riešeniami.
In the present work we study the indexing methods for large XML databases and their time efficiency when evaluating path queries. There are several ways of indexing XML data but we focus on indexing root- to-leaf paths and grouping them according to the common criteria, path labels. We study the existing methods and combine them in order to create the iXUPT, a novel native indexing concept using path templates, which leverages advantages of current approaches. We provide two variations of our solution depending on the way of handling ancestor-descendant relationships. The first one uses the proposed numbering scheme, while the second one relies on the Rho-Index structure. Furthermore, we prove the feasibility of our concept by the implemented prototype and by evaluating sample regular path expressions represented by XPath queries. We compare the variations between each other and also with other solutions.