Semi-automated data to ontology mapping
Semi-automatické mapování dat do ontologií
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/190684Identifiers
Study Information System: 259898
Collections
- Kvalifikační práce [11264]
Author
Advisor
Referee
Nečaský, Martin
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computer Science - Software and Data Engineering
Department
Department of Software Engineering
Date of defense
11. 6. 2024
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
propojená data|datový katalogKeywords (English)
linked data|data catalogNejhodnotnější publikace dat je formou propojených dat. Tvorba propojených dat zahrnuje zejména transformaci dat do RDF a vhodné použití identifikátorů a ontologií. Celý proces je však dosud náročný i pro experty na propojená data. Proto je hlavním cílem této práce vytvoření semiautomatického řešení pro usnadnění transformace dat do kvalitních propojených dat. Základem navrženého řešení je tvorba modelu dat, který může uživatel interaktivně upravovat manuálně či s pomocí doporučení. Tato doporučení navrhují transformace modelu zejména na základě expertní znalosti domén dat. Řešení bylo implementováno jako proof-of-concept webový editor a je založené na vizuální úpravě schématu uživatelem vložených dat.
The most valuable data publication is in the form of linked data. The creation of linked data includes in particular the transformation of data into RDF and the appropriate use of identifiers and ontologies. However, the entire process is still challenging even for linked data experts. Therefore, the main goal of this thesis is to create a semi-automatic solution to facilitate the transformation of data into high-quality linked data. The basis of the proposed solution is the creation of a data model that the user can interactively edit manually or with the help of recommendations. These recommendations suggest model transformations based primarily on expert knowledge of data domains. The solution was implemented as a proof-of-concept web editor and is based on the visual modification of the schema of user provided data.