Alternativní vyhledávač systému EGOTHOR
Alternative search engine for EGOTHOR system
Alternativní vyhledávač systému EGOTHOR
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/4451Identifikátory
SIS: 43083
Kolekce
- Kvalifikační práce [11242]
Autor
Vedoucí práce
Oponent práce
Galamboš, Leo
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
22. 5. 2006
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Slovenština
Známka
Velmi dobře
V současnosti roste potřeba zpracování velkého množství informací, čemuž se přizpůsobují i aktuální trendy v informatice. Cílem práce je teoretický rozbor a implementace nástroje určeného na zpracování a prohledávání velkých kolekcí nestrukturovaných textů - dokumentografického informačního systému (DIS). Práce navazuje na existující systém Egothor, který je implementací boolského modelu. Kvůli možnosti porovnávat výsledky různých modelů DIS, byl implementovaný systém založený na "konkurenčním" vektorovém modelu. V rámci diplomové práce byl vytvořený i modulární systém umožňující porovnávat a zpracovávat výsledky nezávislých DIS do jednoho uceleného přehledu. Takový systém se nazývá systém optimálního vyhledávání. Uživateli umožňuje najít takovou kombinaci vyhledávacích algoritmů, která je pro něj subjektivně optimální - maximalizují se subjektivně kvalitativní parametry systému, přesnost a úplnost. Systém optimálního vyhledávání byl otestovaný v konfiguraci se dvěma podřízenými DIS, co potvrdilo jeho výhody.
Nowadays, it is necessary to process huge amount of information what is reflected by actual trends in informatics. The objective of the thesis is to give the theoretical analysis and implementation of processing and searching tool which allows the user to go through a huge number of unstructured document collections. Such system is called the information retrieval system. This work is an alternative to already existed system Egothor, which is the implementation of boolean model. Because of the possibility of comparing the results from retrieval system models, the implemented system is established on a competitive vector model. In this work is also created one modular system which allows comparing and processing the results from any independent information retrieval systems to one integrated review. This system is called the optimal retrieval system. The precision and recall - the subjective qualitative parameters of system are growing up. The optimal retrieval system was tested in configuration with two underlying systems what practically approved it's advantages.