Extraktor sémantických dat

Beňo, Miloslav

Semantic Data Extractor

bakalářská práce (OBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (166.6Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/13010

Identifikátory

SIS: 46780

Oponent práce

Eckhardt, Alan

Fakulta / součást

Matematicko-fyzikální fakulta

Obor

Programování

Katedra / ústav / klinika

Katedra softwarového inženýrství

Datum obhajoby

10. 9. 2007

Nakladatel

Univerzita Karlova, Matematicko-fyzikální fakulta

Jazyk

Čeština

Známka

Výborně

Předmět této práce je implementace systému pro efektivní extrakci velkého množství dat z webových stránek. Výsledný systém je schopen extrahovat, jak z jednoduchých statických stránek, tak i ze složitých webových aplikací. Data, která ze stránek získá, mohou být nejrůznějších typů a mohou být propojeny relacemi o různých kardinalitách. Se systémem se pracuje přes xml dokumenty, do kterých se úloha deklarativně popisuje. Popis úlohy spočívá v použití komponent systému, jejichž propojováním se dosáhne požadované funkčnosti na obecné webové stránce.

Abstrakt (anglicky)

The aim of this work is to implement a system designed to effectively extract big amounts of data from web pages. The system is able to extract data both from simple static pages as well as complicated web applications. Data extracted from the web can have all sorts of types and can be interconnected by relations having various cardinalities. Working with system is based on XML documents, into which the given task is described in a declarative way. The description of a task is based on using system components, which connected together are able to do desired functionality on general web page.

Citace dokumentu

Metadata

Zobrazit celý záznam