dc.contributor.advisor | Novák, Jiří | |
dc.creator | Vojt, Ján | |
dc.date.accessioned | 2024-08-06T15:47:09Z | |
dc.date.available | 2024-08-06T15:47:09Z | |
dc.date.issued | 2012 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/44019 | |
dc.description.abstract | Vyhledávání textu v článcích se standartně řeší fulltextovým vyhledáváním. Při použití pokročilejších metod je možné dosáhnout výrazně lepších výsledků. Předmětem této práce je vytvořit univerzální knihovnu na prohledávání rozsáhlých kolekcí, která je přizpůsobena pro český jazyk. Využívá nástroje schopné pracovat s morfologií a zohledňovat důležitost slov. Součástí je experiment se slovnými spojeními, které do vyhledávání zapojují kontext. Míra uspěšnosti experimentu je ověřena na rozsáhlé kolekci dat. Vytvořená knihovna je tak unikátním nástrojem na zpracování rozsáhlých kolekcí českého textu, přičemž je připravena na rozšíření o další jazyky a metody. | cs_CZ |
dc.description.abstract | Searching text in articles is usually implemented with fulltext search. Using more advanced techniques however, it is possible to achieve significantly better results. The subject of this work is to create a universal library for searching extensible collections, specialized in czech language. The library makes use of tools capable of working with morphology while considering importance of words. It also conducts an experiment with word pairs, which adds context into the search process. The success rate of this experiment is tried on an extensible collection of data. Created library is a unique tool for processing extensible collections of czech text, while at the same time it is ready for further extension by new languages and methods. | en_US |
dc.language | Slovenčina | cs_CZ |
dc.language.iso | sk_SK | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | vyhľadávanie informácií | cs_CZ |
dc.subject | tf-idf | cs_CZ |
dc.subject | morfológia | cs_CZ |
dc.subject | stemming | cs_CZ |
dc.subject | information retrieval | en_US |
dc.subject | tf-idf | en_US |
dc.subject | morphology | en_US |
dc.subject | stemming | en_US |
dc.title | Vyhľadávanie relevantných článkov v rozsiahlych kolekciách | sk_SK |
dc.type | bakalářská práce | cs_CZ |
dcterms.created | 2012 | |
dcterms.dateAccepted | 2012-09-06 | |
dc.description.department | Department of Software Engineering | en_US |
dc.description.department | Katedra softwarového inženýrství | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.identifier.repId | 96510 | |
dc.title.translated | Searching relevant articles in extensive collections | en_US |
dc.title.translated | Vyhľadávanie relevantných článkov v rozsiahlych kolekciách | cs_CZ |
dc.contributor.referee | Bartoš, Tomáš | |
thesis.degree.name | Bc. | |
thesis.degree.level | bakalářské | cs_CZ |
thesis.degree.discipline | Správa počítačových systémů | cs_CZ |
thesis.degree.discipline | Administration of Computer Systems | en_US |
thesis.degree.program | Informatika | cs_CZ |
thesis.degree.program | Computer Science | en_US |
uk.thesis.type | bakalářská práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra softwarového inženýrství | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Software Engineering | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Správa počítačových systémů | cs_CZ |
uk.degree-discipline.en | Administration of Computer Systems | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Computer Science | en_US |
thesis.grade.cs | Velmi dobře | cs_CZ |
thesis.grade.en | Very good | en_US |
uk.abstract.cs | Vyhledávání textu v článcích se standartně řeší fulltextovým vyhledáváním. Při použití pokročilejších metod je možné dosáhnout výrazně lepších výsledků. Předmětem této práce je vytvořit univerzální knihovnu na prohledávání rozsáhlých kolekcí, která je přizpůsobena pro český jazyk. Využívá nástroje schopné pracovat s morfologií a zohledňovat důležitost slov. Součástí je experiment se slovnými spojeními, které do vyhledávání zapojují kontext. Míra uspěšnosti experimentu je ověřena na rozsáhlé kolekci dat. Vytvořená knihovna je tak unikátním nástrojem na zpracování rozsáhlých kolekcí českého textu, přičemž je připravena na rozšíření o další jazyky a metody. | cs_CZ |
uk.abstract.en | Searching text in articles is usually implemented with fulltext search. Using more advanced techniques however, it is possible to achieve significantly better results. The subject of this work is to create a universal library for searching extensible collections, specialized in czech language. The library makes use of tools capable of working with morphology while considering importance of words. It also conducts an experiment with word pairs, which adds context into the search process. The success rate of this experiment is tried on an extensible collection of data. Created library is a unique tool for processing extensible collections of czech text, while at the same time it is ready for further extension by new languages and methods. | en_US |
uk.file-availability | P | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrství | cs_CZ |
thesis.grade.code | 2 | |
uk.publication-place | Praha | cs_CZ |
uk.embargo.reason | The annexes of the thesis or its part are inaccessible in accordance with article 18a (7) of The Code of Study and Examination in conjunction with Article 9 of the Rector’s Directive No. 6/2010. | en |
uk.embargo.reason | Přílohy práce nebo její části jsou nepřístupné v souladu s čl. 18a odst. 7 Studijního a zkušebního řádu Univerzity Karlovy v Praze ve spojení s čl. 9 opatření rektora č. 6/2010. | cs |
uk.thesis.defenceStatus | O | |
dc.identifier.lisID | 990014993910106986 | |