Filtrování informací v XML dokumentech
Information filtering in XML documents
diploma thesis (DEFENDED)

Kopecký, Michal
Faculty of Mathematics and Physics
Department of Software Engineering
6. 2. 2006
Univerzita Karlova, Matematicko-fyzikální fakulta
S rostoucím množstvím informací dostupných pomocí Internetu a dalších technologií vzrůstá i potřeba distribuovat data jednotlivým uživatelům co nejrychleji a to jen taková data, o která mají uživatelé zájem. Publish-subscribe systémy umožňují uživatelům pomocí profilů zadaných pomocí vhodného dotazovacího jazyka tento zájem specifikovat a tím objednat příjem požadovaných informací od veškerých zdrojů publikujících do systému. K publikování drtivé většiny informací na Internetu se v dnešní době používá jazyk XML. Tato práce se zabývá publish-subscribe systémy pracujícími právě nad jazykem XML. Jsou zde popsány metody efektivní filtrace XML dat a obecné techniky využívané v publish-subscribe systémech k doručení vyhovujících dat jednotlivým uživatelům. Dále je navržen a ve formě prototypu naimplementován vlastní systém Xm/Part, jednoduchý publish-subscribe systém pracující nad XML. Pro tento systém je implementováno a na reálných XML datech ověřeno několik konkrétních strategií spojených s doručováním informací. Powered by TCPDF (
With a growing amount of information available on the Internet and by other technologies, there is a growing need to distribute data to individua/ users as fast as possible - and only to those who are interested. Publish-subscribe systems allow users to specify their interes/s using profi/es created with an appropriate query language, thus order receiving required information from all available sources contributing to the syslem. The XML language nowadays belongs to the most important standards used for data exchange. This thesis deals with publish-subscribe systems working with data in XML data forma!. Methods of effective filtration of XML data and general techniques used in publish-subscribe systems for delivery of pertinent data to users are discussed there. Also, a prototype of a simple publish-subscribe syslem working with XML - Xm/Part - is implemented. A couple of techniques connected to information delivery is implemented and tested using this syslem on real data. Powered by TCPDF (