dc.contributor.advisor | Galamboš, Leo | |
dc.creator | Dufková, Kateřina | |
dc.date.accessioned | 2017-04-13T09:17:04Z | |
dc.date.available | 2017-04-13T09:17:04Z | |
dc.date.issued | 2009 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/18913 | |
dc.description.abstract | Tato diplomová práce analyzuje možnosti rozšíření postupů používaných internetovými vyhledávači na problém efektivní detekce plagiátů. Práce se zaměřuje na 1:N metody detekce plagiátů v situaci, kdy korpusem je velmi rozsáhlá dynamicky se měnící kolekce dokumentů. K implementaci je zvolena pravděpodobnostní metoda aproximace Jaccardovy míry podobnosti pomocí hešování v kombinaci se šindelováním. Cílem práce je představit implementaci této metody v rámci internetového vyhledávače Egothor 2, popsat vlastnosti a parametry této implementace a nakonec zhodnotit výhody i případná omezení zvoleného řešení. | cs_CZ |
dc.description.abstract | The master thesis analyses the possibilities of web search engine methods application to the problem of e ective plagiarism detection. It focuses on 1:N plagiarism detection methods under the circumstance that the corpus is a very large dynamically changing set of documents. For the implementation the probabilistic aproximation of the Jaccard similarity measure using hashing combined with shingling was chosen. The aim of the thesis is to present an imlementation of this method within the Egothor 2 web search engine, to describe the features and parameters of the implementation and nally to evaluate the advantages and contingent limitations of the approach. | en_US |
dc.language | Čeština | cs_CZ |
dc.language.iso | cs_CZ | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.title | Dynamická detekce plagiátů | cs_CZ |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2009 | |
dcterms.dateAccepted | 2009-02-02 | |
dc.description.department | Department of Software Engineering | en_US |
dc.description.department | Katedra softwarového inženýrství | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.identifier.repId | 48056 | |
dc.title.translated | Detection of Plagiarism | en_US |
dc.contributor.referee | Ondreička, Matúš | |
dc.identifier.aleph | 001107541 | |
thesis.degree.name | Mgr. | |
thesis.degree.level | navazující magisterské | cs_CZ |
thesis.degree.discipline | Software Systems | en_US |
thesis.degree.discipline | Softwarové systémy | cs_CZ |
thesis.degree.program | Computer Science | en_US |
thesis.degree.program | Informatika | cs_CZ |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra softwarového inženýrství | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Software Engineering | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Softwarové systémy | cs_CZ |
uk.degree-discipline.en | Software Systems | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Computer Science | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Tato diplomová práce analyzuje možnosti rozšíření postupů používaných internetovými vyhledávači na problém efektivní detekce plagiátů. Práce se zaměřuje na 1:N metody detekce plagiátů v situaci, kdy korpusem je velmi rozsáhlá dynamicky se měnící kolekce dokumentů. K implementaci je zvolena pravděpodobnostní metoda aproximace Jaccardovy míry podobnosti pomocí hešování v kombinaci se šindelováním. Cílem práce je představit implementaci této metody v rámci internetového vyhledávače Egothor 2, popsat vlastnosti a parametry této implementace a nakonec zhodnotit výhody i případná omezení zvoleného řešení. | cs_CZ |
uk.abstract.en | The master thesis analyses the possibilities of web search engine methods application to the problem of e ective plagiarism detection. It focuses on 1:N plagiarism detection methods under the circumstance that the corpus is a very large dynamically changing set of documents. For the implementation the probabilistic aproximation of the Jaccard similarity measure using hashing combined with shingling was chosen. The aim of the thesis is to present an imlementation of this method within the Egothor 2 web search engine, to describe the features and parameters of the implementation and nally to evaluate the advantages and contingent limitations of the approach. | en_US |
uk.file-availability | V | |
uk.publication.place | Praha | cs_CZ |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrství | cs_CZ |
dc.identifier.lisID | 990011075410106986 | |