Redukce duplicitních výsledků
Results list reduction
bachelor thesis (DEFENDED)
![Document thumbnail](/bitstream/handle/20.500.11956/18575/thumbnail.png?sequence=7&isAllowed=y)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/18575Identifiers
Study Information System: 48748
Collections
- Kvalifikační práce [11266]
Author
Advisor
Referee
Malohlava, Michal
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Programming
Department
Department of Software Engineering
Date of defense
9. 9. 2008
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Táto bakalárska práca sa zaoberá implementáciou vhodného algoritmu redukcie duplicitných výsledkov do fulltextového vyhladávacieho stroja Egothor. Práca zahrna analýzu funkcionality systému Egothor a procesov pri vytváraní a spracovávaní indexu. Nasleduje popis existujúcich algoritmov redukcie duplicitných výsledkov a ich následné ohodnotenie a vzájomné porovnanie. Ohodnotenie popísaných algoritmov je primárne zamerané na prostredie webového vyhladávacieho systému Egothor, kde je vybraný ten najvhodnejší k implementácii. V rámci práce bol vybraný algoritmus kompletne naimplementovaný spolu s dalšími funkčnými požiadavkami. Popis výslednej implementácie uzatvára túto bakalársku prácu.
This Bachelor's Diploma Thesis deals with implementation of a suitable algorithm of duplicate results' reduction into the full-text search engine Egothor. The thesis includes the functionality analysis of Egothor engine as well as the processes occurring during the creation and compilation of an index. The main focus is on the description of given algorithms of duplicate results' reduction followed by their evaluation and comparison. The evaluation of described algorithms is based on the web search engine system Egothor environment, where the most suitable one for the implementation is chosen. More speciffically, for the purpose of this thesis a completely implemented algorithm with further functional requirements is used. The conclusion consists of the description of the final implementation.