Analýza a problémy Top-K dotazu nad relační databází
Top-k querying over a relational databases: analysis and problems
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/35985Identifiers
Study Information System: 84216
Collections
- Kvalifikační práce [11264]
Author
Advisor
Referee
Eckhardt, Alan
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software Systems
Department
Department of Software Engineering
Date of defense
30. 5. 2011
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Very good
Keywords (Czech)
Top-k problém, relační databázeKeywords (English)
Top-k problem, relational databaseKvůli zvýšení kapacit úložných zařízení a rychlosti počítačových sítí v posledních letech roste potřeba efektivně třídit a prohledávat data. Výsledky dotazů o tísících záznamech pro uživatele často bývají velmi nepřehledné. Pro uživatele může být v takové situaci mnohem výhodnější přístup, kdy definuje omezení na data (filtr) a ohodnocení záznamů (priorita), přičemž ho zajímá pouze několik nejlepších výsledných záznamů. Tato práce se zabývá problematikou tzv. top-k dotazů, rozšířením relační algebry o nové operátory a jejich implementací v databázovém systému. Zaměřuje se přitom zejména na optimalizaci operací spojení a třídění. Součástí práce je implementace a srovnání některých top-k algoritmů v samostatné .NET knihovně NRank.
Due to increasing capacity of storage devices and speed of computer networks during last years, it is still more required to sort and search data effectively. Query result containing thousands of rows is usually useless and unreadable. In that situation, users may prefer to define constraints and sorting priorities in the query, and see only several top rows from the result. This thesis deals with top-k queries problems, extension of relational algebra by new operators and their implementation in database system. It focuses on optimization of operations join and sort. The thesis includes implementation and comparison of some algorithms in standalone .NET library NRank.