Similarity of XML Data

Wojnar, Aleš

Podobnost XML dat

diplomová práce (OBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (137.4Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/14838

Identifikátory

SIS: 46298

Oponent práce

Nečaský, Martin

Fakulta / součást

Matematicko-fyzikální fakulta

Obor

Datové inženýrství

Katedra / ústav / klinika

Katedra softwarového inženýrství

Datum obhajoby

26. 5. 2008

Nakladatel

Univerzita Karlova, Matematicko-fyzikální fakulta

Jazyk

Angličtina

Známka

Výborně

Jazyk XML se v dnešní době stává stále důležitějším formátem pro uchování a výměnu dat. Porovnávání podobnosti XML dat hraje zásadní roli v efektivním ukládání, zpracovávání a manipulaci s daty. Tato práce se zabývá možnostmi jak zjišt'ovat podobnost mezi DTD. Napřed je navržena vhodná reprezentace DTD stromů. Následně je navržen také algoritmus, který je založený na editační vzdálenosti stromů. Nakonec se zaměřujeme na různé aspekty podobnosti, jako jsou například strukturální a lingvistické informace, a snažíme se je zahrnout do naší metody.

Abstrakt (anglicky)

Currently, XML is still more and more important format for storing and exchanging data. Evaluation of similarity of XML data plays a crucial role in efficient storing, processing and manipulating data. This work deals with possibility to evaluate similarity of DTDs. Firstly, suitable DTD tree representation is designed. Next, the algorithm based on tree edit distance technique is proposed. Finally, we are focusing on various aspects of similarity, such as, e.g., structural and linguistic information, and integrate them into our method.

Citace dokumentu

Metadata

Zobrazit celý záznam