Zobrazit minimální záznam

Vyhledávání tříd v ontologii Wikidata
dc.contributor.advisorNečaský, Martin
dc.creatorGora, Martin
dc.date.accessioned2025-03-04T10:05:52Z
dc.date.available2025-03-04T10:05:52Z
dc.date.issued2025
dc.identifier.urihttp://hdl.handle.net/20.500.11956/197453
dc.description.abstractNástroj Dataspecer usnadňuje vytváření a správu abstraktních datových struktur pro reprezentaci a výměnu dat na webu pomocí integrace vstupních ontologií. Nicméně, získat komplexní heterogenní ontologii však zůstává náročným úkolem. Tato studie odvodila on- tologii s 830 tisíci třídami ze znalostního grafu Wikidata a následně analyzovala, navrhla, implementovala a vyhodnotila její integraci do nástroje Dataspecer, s hlavním zaměřením na vyhledávání tříd. Byly vyvinuty metody vyhledávání využívající kombinaci textových modelů, jejich interpolace a strategií řazení v rámci vícekrokového vyhledávacího pro- cesu. Tyto přístupy byly vyhodnoceny na vytvořené testovací kolekci dat a dva optimální přístupy, upřednostňující interpolaci naučených hustých a řídkých vektorů, byly inte- grovány do nástroje. Integrace ontologie byla následně posouzena prostřednictvím dvou uživatelských studií. Výsledky potvrdily rychlost odezvy a relevanci vyhledávání, přičemž nedostatky v kritériích uživatelské přívětivosti naznačily oblasti pro budoucí zlepšení. Vý- sledně, tato práce poskytuje poznatky pro budoucí výzkum vyhledávání tříd a opětovné využití rozsáhlých ontologií, zejména v kontextu Wikidat.cs_CZ
dc.description.abstractThe Dataspecer tool facilitates the creation and management of abstract data struc- tures to represent and exchange data on the Web by leveraging input ontologies. How- ever, acquiring comprehensive heterogeneous ontologies remains challenging. This study derived an ontology of 830 thousand classes from Wikidata and analyzed, designed, imple- mented, and evaluated its integration into the Dataspecer tool, focusing particularly on class search. We devised retrieval methods leveraging a combination of text retrieval mod- els, their interpolation, and re-ranker strategies in a multi-stage retrieval pipeline. The retrieval approaches were evaluated on a developed dataset, and two optimal approaches, favouring interpolation of learned sparse and dense embeddings, were incorporated into the tool. The ontology integration was subsequently assessed through two user studies. The results confirmed the tool's responsiveness and retrieval performance, while deficien- cies in ease-of-use criteria suggested areas for future improvements. Lastly, this work offers insights for future research on class retrieval and the reuse of large-scale ontologies, particularly within the context of Wikidata.en_US
dc.languageEnglishcs_CZ
dc.language.isoen_US
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.subjectwikidata|třídy|vyhledávání|ontologie|concepty|vlastnosti|vektorycs_CZ
dc.subjectwikidata|classes|search|ontologies|retrieval|reuse|concepts|properties|embeddingsen_US
dc.titleSearching classes in the Wikidata ontologyen_US
dc.typediplomová prácecs_CZ
dcterms.created2025
dcterms.dateAccepted2025-02-11
dc.description.departmentDepartment of Software Engineeringen_US
dc.description.departmentKatedra softwarového inženýrstvícs_CZ
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.identifier.repId268694
dc.title.translatedVyhledávání tříd v ontologii Wikidatacs_CZ
dc.contributor.refereeKopecký, Michal
thesis.degree.nameMgr.
thesis.degree.levelnavazující magisterskécs_CZ
thesis.degree.disciplineComputer Science - Software and Data Engineeringen_US
thesis.degree.disciplineInformatika - Softwarové a datové inženýrstvícs_CZ
thesis.degree.programComputer Science - Software and Data Engineeringen_US
thesis.degree.programInformatika - Softwarové a datové inženýrstvícs_CZ
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Katedra softwarového inženýrstvícs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Department of Software Engineeringen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csInformatika - Softwarové a datové inženýrstvícs_CZ
uk.degree-discipline.enComputer Science - Software and Data Engineeringen_US
uk.degree-program.csInformatika - Softwarové a datové inženýrstvícs_CZ
uk.degree-program.enComputer Science - Software and Data Engineeringen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csNástroj Dataspecer usnadňuje vytváření a správu abstraktních datových struktur pro reprezentaci a výměnu dat na webu pomocí integrace vstupních ontologií. Nicméně, získat komplexní heterogenní ontologii však zůstává náročným úkolem. Tato studie odvodila on- tologii s 830 tisíci třídami ze znalostního grafu Wikidata a následně analyzovala, navrhla, implementovala a vyhodnotila její integraci do nástroje Dataspecer, s hlavním zaměřením na vyhledávání tříd. Byly vyvinuty metody vyhledávání využívající kombinaci textových modelů, jejich interpolace a strategií řazení v rámci vícekrokového vyhledávacího pro- cesu. Tyto přístupy byly vyhodnoceny na vytvořené testovací kolekci dat a dva optimální přístupy, upřednostňující interpolaci naučených hustých a řídkých vektorů, byly inte- grovány do nástroje. Integrace ontologie byla následně posouzena prostřednictvím dvou uživatelských studií. Výsledky potvrdily rychlost odezvy a relevanci vyhledávání, přičemž nedostatky v kritériích uživatelské přívětivosti naznačily oblasti pro budoucí zlepšení. Vý- sledně, tato práce poskytuje poznatky pro budoucí výzkum vyhledávání tříd a opětovné využití rozsáhlých ontologií, zejména v kontextu Wikidat.cs_CZ
uk.abstract.enThe Dataspecer tool facilitates the creation and management of abstract data struc- tures to represent and exchange data on the Web by leveraging input ontologies. How- ever, acquiring comprehensive heterogeneous ontologies remains challenging. This study derived an ontology of 830 thousand classes from Wikidata and analyzed, designed, imple- mented, and evaluated its integration into the Dataspecer tool, focusing particularly on class search. We devised retrieval methods leveraging a combination of text retrieval mod- els, their interpolation, and re-ranker strategies in a multi-stage retrieval pipeline. The retrieval approaches were evaluated on a developed dataset, and two optimal approaches, favouring interpolation of learned sparse and dense embeddings, were incorporated into the tool. The ontology integration was subsequently assessed through two user studies. The results confirmed the tool's responsiveness and retrieval performance, while deficien- cies in ease-of-use criteria suggested areas for future improvements. Lastly, this work offers insights for future research on class retrieval and the reuse of large-scale ontologies, particularly within the context of Wikidata.en_US
uk.file-availabilityV
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrstvícs_CZ
thesis.grade.code1
uk.publication-placePrahacs_CZ
uk.thesis.defenceStatusO


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV