dc.contributor.advisor | Kopecký, Michal | |
dc.creator | Irikovský, Peter | |
dc.date.accessioned | 2017-04-03T09:58:53Z | |
dc.date.available | 2017-04-03T09:58:53Z | |
dc.date.issued | 2007 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/9322 | |
dc.description.abstract | Tato diplomová práce zkoumá možnosti využití grafových algoritm ů v oblasti information retrieval (vyhledávání informací). Na zač átku je poskytnut p řehled základních pojm ů z oblasti dokumentografických informa čních systém ů a základě teorie graf . Zbytek práce se pak zabývá prů nikem tě chto dvou oblastí. Mezi př íklady z tohoto prů niku patř í např íklad klastrování a kategorizace dokumentů , i hledání komunit. Nejvíc pozornosti je však soust ředě no na algoritmy hodnotící d ůležitost dokument ů s pomocí využití graf ů. Tyto algoritmy vylepšují nejd ůležitě jší vlastnost informa čních systémů , jejich p řesnost. Práce poskytuje přehled rů zných hodnotících algoritmů založených na grafech a uvádí komentář e k jejich praktič nosti, č asovým a paměť ovým nároků m. V práci je taky detailně popsaná implementace algoritmů na poč ítaní PageRanku stránek navržená pro využití ve vyhledáva či Egothor. Popis také obsahuje výsledky m ěření č asové a pam ěťové nároč nosti a uvádí návrhy na další zlepšení. | cs_CZ |
dc.description.abstract | This thesis surveys use of graph theory and algorithms in information retrieval. It provides an introduction to graph and information retrieval theories and an overview of the overlap between these disciplines. We show application of the graph theory in clustering, document classification, finding communities etc. The most stress is, however, put on ranking algorithms as they aim to improve the most critical property of the information retrieval systems, their precision. The paper presents different graphbased ranking algorithms, provides comments to their time and memory requirements and to realistic usage of these rankings. It also contains a description and test results of our implementation of algorithms for computing the PageRank distribution designed for the Egothor search engine. | en_US |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.title | Graph algorithms in text retrieval | en_US |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2007 | |
dcterms.dateAccepted | 2007-05-21 | |
dc.description.department | Department of Software Engineering | en_US |
dc.description.department | Katedra softwarového inženýrství | cs_CZ |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 46208 | |
dc.title.translated | Grafové algoritmy ve vyhledávání textových dokumentů | cs_CZ |
dc.contributor.referee | Galamboš, Leo | |
dc.identifier.aleph | 000839349 | |
thesis.degree.name | Mgr. | |
thesis.degree.level | magisterské | cs_CZ |
thesis.degree.discipline | Softwarové systémy | cs_CZ |
thesis.degree.discipline | Software systems | en_US |
thesis.degree.program | Informatics | en_US |
thesis.degree.program | Informatika | cs_CZ |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra softwarového inženýrství | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Software Engineering | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Softwarové systémy | cs_CZ |
uk.degree-discipline.en | Software systems | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Informatics | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Tato diplomová práce zkoumá možnosti využití grafových algoritm ů v oblasti information retrieval (vyhledávání informací). Na zač átku je poskytnut p řehled základních pojm ů z oblasti dokumentografických informa čních systém ů a základě teorie graf . Zbytek práce se pak zabývá prů nikem tě chto dvou oblastí. Mezi př íklady z tohoto prů niku patř í např íklad klastrování a kategorizace dokumentů , i hledání komunit. Nejvíc pozornosti je však soust ředě no na algoritmy hodnotící d ůležitost dokument ů s pomocí využití graf ů. Tyto algoritmy vylepšují nejd ůležitě jší vlastnost informa čních systémů , jejich p řesnost. Práce poskytuje přehled rů zných hodnotících algoritmů založených na grafech a uvádí komentář e k jejich praktič nosti, č asovým a paměť ovým nároků m. V práci je taky detailně popsaná implementace algoritmů na poč ítaní PageRanku stránek navržená pro využití ve vyhledáva či Egothor. Popis také obsahuje výsledky m ěření č asové a pam ěťové nároč nosti a uvádí návrhy na další zlepšení. | cs_CZ |
uk.abstract.en | This thesis surveys use of graph theory and algorithms in information retrieval. It provides an introduction to graph and information retrieval theories and an overview of the overlap between these disciplines. We show application of the graph theory in clustering, document classification, finding communities etc. The most stress is, however, put on ranking algorithms as they aim to improve the most critical property of the information retrieval systems, their precision. The paper presents different graphbased ranking algorithms, provides comments to their time and memory requirements and to realistic usage of these rankings. It also contains a description and test results of our implementation of algorithms for computing the PageRank distribution designed for the Egothor search engine. | en_US |
uk.file-availability | V | |
uk.publication.place | Praha | cs_CZ |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrství | cs_CZ |
dc.identifier.lisID | 990008393490106986 | |