Alternativní vyhledávač systému EGOTHOR
Alternative search engine for EGOTHOR system
Alternativní vyhledávač systému EGOTHOR
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/4451Identifiers
Study Information System: 43083
Collections
- Kvalifikační práce [11244]
Author
Advisor
Referee
Galamboš, Leo
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software systems
Department
Department of Software Engineering
Date of defense
22. 5. 2006
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Slovak
Grade
Very good
V současnosti roste potřeba zpracování velkého množství informací, čemuž se přizpůsobují i aktuální trendy v informatice. Cílem práce je teoretický rozbor a implementace nástroje určeného na zpracování a prohledávání velkých kolekcí nestrukturovaných textů - dokumentografického informačního systému (DIS). Práce navazuje na existující systém Egothor, který je implementací boolského modelu. Kvůli možnosti porovnávat výsledky různých modelů DIS, byl implementovaný systém založený na "konkurenčním" vektorovém modelu. V rámci diplomové práce byl vytvořený i modulární systém umožňující porovnávat a zpracovávat výsledky nezávislých DIS do jednoho uceleného přehledu. Takový systém se nazývá systém optimálního vyhledávání. Uživateli umožňuje najít takovou kombinaci vyhledávacích algoritmů, která je pro něj subjektivně optimální - maximalizují se subjektivně kvalitativní parametry systému, přesnost a úplnost. Systém optimálního vyhledávání byl otestovaný v konfiguraci se dvěma podřízenými DIS, co potvrdilo jeho výhody.
Nowadays, it is necessary to process huge amount of information what is reflected by actual trends in informatics. The objective of the thesis is to give the theoretical analysis and implementation of processing and searching tool which allows the user to go through a huge number of unstructured document collections. Such system is called the information retrieval system. This work is an alternative to already existed system Egothor, which is the implementation of boolean model. Because of the possibility of comparing the results from retrieval system models, the implemented system is established on a competitive vector model. In this work is also created one modular system which allows comparing and processing the results from any independent information retrieval systems to one integrated review. This system is called the optimal retrieval system. The precision and recall - the subjective qualitative parameters of system are growing up. The optimal retrieval system was tested in configuration with two underlying systems what practically approved it's advantages.