Analýza a problémy Top-K dotazu nad relační databází
Top-k querying over a relational databases: analysis and problems
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/35985Identifikátory
SIS: 84216
Kolekce
- Kvalifikační práce [11264]
Autor
Vedoucí práce
Oponent práce
Eckhardt, Alan
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
30. 5. 2011
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Velmi dobře
Klíčová slova (česky)
Top-k problém, relační databázeKlíčová slova (anglicky)
Top-k problem, relational databaseKvůli zvýšení kapacit úložných zařízení a rychlosti počítačových sítí v posledních letech roste potřeba efektivně třídit a prohledávat data. Výsledky dotazů o tísících záznamech pro uživatele často bývají velmi nepřehledné. Pro uživatele může být v takové situaci mnohem výhodnější přístup, kdy definuje omezení na data (filtr) a ohodnocení záznamů (priorita), přičemž ho zajímá pouze několik nejlepších výsledných záznamů. Tato práce se zabývá problematikou tzv. top-k dotazů, rozšířením relační algebry o nové operátory a jejich implementací v databázovém systému. Zaměřuje se přitom zejména na optimalizaci operací spojení a třídění. Součástí práce je implementace a srovnání některých top-k algoritmů v samostatné .NET knihovně NRank.
Due to increasing capacity of storage devices and speed of computer networks during last years, it is still more required to sort and search data effectively. Query result containing thousands of rows is usually useless and unreadable. In that situation, users may prefer to define constraints and sorting priorities in the query, and see only several top rows from the result. This thesis deals with top-k queries problems, extension of relational algebra by new operators and their implementation in database system. It focuses on optimization of operations join and sort. The thesis includes implementation and comparison of some algorithms in standalone .NET library NRank.