Indexing Linked Data
Indexing Linked Data
diploma thesis (DEFENDED)
![Document thumbnail](/bitstream/handle/20.500.11956/40198/thumbnail.png?sequence=7&isAllowed=y)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/40198Identifiers
Study Information System: 90075
Collections
- Kvalifikační práce [11266]
Author
Advisor
Referee
Skopal, Tomáš
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software Systems
Department
Department of Software Engineering
Date of defense
28. 5. 2012
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Very good
Keywords (Czech)
Linked Data, RDF, IndexingKeywords (English)
Linked Data, RDF, IndexingRychlý vývoj Webu nabídl možnost publikovat velké množství propojených dokumentů. Každý takový dokument představuje cennou informaci. Linked Data je pojem používaný k popisu metody odhalování a propojený těchto dokumentů. I když tato metoda je stále ve zkušební fázi, zpracování všech stávajících zdrojů údajů je poměrně náročné a nejzřejmějším řešením je pokusit se je indexovat. Tato studie se zabývá otázkami, jak navrhnout index, který bude schopný pracovat s miliony takových záznamů. Analyzuje stávající projekty a popisuje index, který může splnit požadavky. Prototyp indexu a výsledky testů nabízejí další informace o účinnosti a struktuře indexu.
The fast evolution of the World Wide Web has offered the possibility to publish a huge amount of linked documents. Each such document represents a valuable piece of information. Linked Data is the term used to describe a method of exposing and connecting such documents. Even if this method is still in an experimental phase, it is already hard to process all existing data sources and the most obvious solution is to try and index them. The study addresses questions on how to design an index that will be capable to operate with millions of such entries. It analyses the existing projects and describes an index that may fulfill the requirements. The prototype implementation and the provided test results offer additional information about the index structure and effectiveness.