dc.creator | Bartoš, Tomáš | |
dc.date.accessioned | 2021-05-19T16:07:06Z | |
dc.date.available | 2021-05-19T16:07:06Z | |
dc.date.issued | 2010 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/31679 | |
dc.description.abstract | In the present work we study the indexing methods for large XML databases and their time efficiency when evaluating path queries. There are several ways of indexing XML data but we focus on indexing root- to-leaf paths and grouping them according to the common criteria, path labels. We study the existing methods and combine them in order to create the iXUPT, a novel native indexing concept using path templates, which leverages advantages of current approaches. We provide two variations of our solution depending on the way of handling ancestor-descendant relationships. The first one uses the proposed numbering scheme, while the second one relies on the Rho-Index structure. Furthermore, we prove the feasibility of our concept by the implemented prototype and by evaluating sample regular path expressions represented by XPath queries. We compare the variations between each other and also with other solutions. | en_US |
dc.description.abstract | V predloženej práci študujeme metódy indexovania pre rozsiahle XML databázy a ich časovú zložitosť pri vyhodnocovaní dotazov na vyhľadávanie ciest. Existuje množstvo spôsobov, ako indexovať XML dáta, ale my sa zameriame na indexovanie ciest od koreňa k listom a ich zhlukovanie na základe podobných kritérii. Štúdium a správna kombinácia existujúcich metód nám slúži ako základ pre vytvorenie nového natívneho indexu iXUPT, ktorý používa značkovanie ciest. Predstavujeme dve variácie indexovania v závislosti od spôsobu zisťovania vzťahu predok-potomok. Prvá možnosť používa číselnú schému, druhá využíva Rho-Index. Správnosť nášho riešenia dokážeme implementáciou prototypu a vyhodnotením niekoľkých XPath dotazov predstavujúcich cesty v grafe. Nakoniec porovnáme jednotlivé varianty a dosiahnuté výsledky s existujúcimi riešeniami. | cs_CZ |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | Indexing XML | en_US |
dc.subject | Rho-Index | en_US |
dc.subject | path-based indexing | en_US |
dc.subject | XPath queries | en_US |
dc.subject | Indexovanie XML | cs_CZ |
dc.subject | Rho-Index | cs_CZ |
dc.subject | indexovanie ciest | cs_CZ |
dc.subject | XPath dotazy | cs_CZ |
dc.title | Nativní indexování rozsáhlých XML databází | en_US |
dc.type | rigorózní práce | cs_CZ |
dcterms.created | 2010 | |
dcterms.dateAccepted | 2010-12-06 | |
dc.description.department | Department of Software Engineering | en_US |
dc.description.department | Katedra softwarového inženýrství | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.identifier.repId | 97127 | |
dc.title.translated | Nativní indexování rozsáhlých XML databází | cs_CZ |
dc.identifier.aleph | 001284889 | |
thesis.degree.name | RNDr. | |
thesis.degree.level | rigorózní řízení | cs_CZ |
thesis.degree.discipline | Software systems | en_US |
thesis.degree.discipline | Softwarové systémy | cs_CZ |
thesis.degree.program | Informatics | en_US |
thesis.degree.program | Informatika | cs_CZ |
uk.thesis.type | rigorózní práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra softwarového inženýrství | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Software Engineering | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Softwarové systémy | cs_CZ |
uk.degree-discipline.en | Software systems | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Informatics | en_US |
thesis.grade.cs | Uznáno | cs_CZ |
thesis.grade.en | Recognized | en_US |
uk.abstract.cs | V predloženej práci študujeme metódy indexovania pre rozsiahle XML databázy a ich časovú zložitosť pri vyhodnocovaní dotazov na vyhľadávanie ciest. Existuje množstvo spôsobov, ako indexovať XML dáta, ale my sa zameriame na indexovanie ciest od koreňa k listom a ich zhlukovanie na základe podobných kritérii. Štúdium a správna kombinácia existujúcich metód nám slúži ako základ pre vytvorenie nového natívneho indexu iXUPT, ktorý používa značkovanie ciest. Predstavujeme dve variácie indexovania v závislosti od spôsobu zisťovania vzťahu predok-potomok. Prvá možnosť používa číselnú schému, druhá využíva Rho-Index. Správnosť nášho riešenia dokážeme implementáciou prototypu a vyhodnotením niekoľkých XPath dotazov predstavujúcich cesty v grafe. Nakoniec porovnáme jednotlivé varianty a dosiahnuté výsledky s existujúcimi riešeniami. | cs_CZ |
uk.abstract.en | In the present work we study the indexing methods for large XML databases and their time efficiency when evaluating path queries. There are several ways of indexing XML data but we focus on indexing root- to-leaf paths and grouping them according to the common criteria, path labels. We study the existing methods and combine them in order to create the iXUPT, a novel native indexing concept using path templates, which leverages advantages of current approaches. We provide two variations of our solution depending on the way of handling ancestor-descendant relationships. The first one uses the proposed numbering scheme, while the second one relies on the Rho-Index structure. Furthermore, we prove the feasibility of our concept by the implemented prototype and by evaluating sample regular path expressions represented by XPath queries. We compare the variations between each other and also with other solutions. | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrství | cs_CZ |
thesis.grade.code | U | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | U | |
dc.identifier.lisID | 990012848890106986 | |