Unified Querying of Multi-Model Data
Unifikované dotazování nad multi-modelovými daty
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/179646Identifikátory
SIS: 245659
Kolekce
- Kvalifikační práce [11241]
Autor
Vedoucí práce
Oponent práce
Pokorný, Jaroslav
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika - Softwarové a datové inženýrství
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
8. 2. 2023
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
multi-model databáze|dotazování|grafová reprezentaceKlíčová slova (anglicky)
multi-model databases|querying|graph representationDrtivá většina současných multi-model dotazovacích řešení vyžaduje, aby uživatel měl rozsáhlé znalosti použitých datových modelů. Existuje jeden přístup pro unifiko- vané multi-model dotazování, ale tento přístup není prakticky použitelný pro většinu uži- vatelů, protože je velmi komplexní. Tato práce představuje MMQL, což je multi-model dotazovací jazyk založený na teorii kategorií, který byl inspirován dotazovacím jazykem SPARQL. Za použití MMQL mohou uživatelé formulovat multi-model, multi-databázové dotazy, aniž by museli vědět o způsobu uložení dat. Dále tato práce představuje návrh na postup implementace MMQL, včetně podpůrných algoritmů. Pro ověření validity tohoto návrhu také obsahuje jeho základní implementaci ve formě nástroje MM-quecat. Tento nástroj byl experimentálně ověřen ve scénáři zahrnujícím PostgreSQL a MongoDB, přičemž obě databáze byly unifikovaně dotazovány pomocí jednoho MMQL dotazu. Je- likož se jedná o jeden z prvních přístupů pro unifikované multi-model dotazování, tato práce dále analyzuje slabiny a omezení navrženého přístupu, což umožní lépe cílit navazu- jící práci v této oblasti. 1
The vast majority of current multi-model querying solutions require the user to have intimate knowledge of the specific models involved. There exists a single approach for truly unified multi-model querying, but this approach is not practically usable for most users due to its complexity. In this thesis we present MMQL, a multi-model query lan- guage based on category theory, which was designed using SPARQL as a basis. Using MMQL, users can formulate multi-model, multi-database queries without needing to know about the way the data is stored. We also present our proposal for the implemen- tation of MMQL, including the required supporting algorithms. To verify the validity of our proposal, we built the proof-of-concept tool MM-quecat, an implementation of basic MMQL concepts. We then evaluated MM-quecat in a scenario involving PostgreSQL and MongoDB, querying both databases with a single MMQL query. As we present one of the first ever approaches for unified multi-model querying, we also analyze the weak- nesses and limitations of the proposed approach, opening the door for future iterations and improvements. 1