Zobrazit minimální záznam

Automatic annotation of English on the tectogrammatical level
dc.contributor.advisorHajič, Jan
dc.creatorToman, Josef
dc.date.accessioned2017-04-18T12:45:14Z
dc.date.available2017-04-18T12:45:14Z
dc.date.issued2009
dc.identifier.urihttp://hdl.handle.net/20.500.11956/21107
dc.description.abstractTektogramatick á rovina je velmi slo žit á a jej í anotace je n aročná a n ákladná. Na rozdí l od jiných korpusů je Prague English Dependency Treebank (pedt) zalo žen na datech, pro které již existuje syntaktick á anotace, byť principi álně odli šná. C ílem pr áce je navrhnout a implementovat metody automatické anotace vyu ží vaj cí dostupná data a vedoucí k minimalizaci usilí vynaloženého na manu ální anotací. Důule žité je kvalitně vyhodnocen , aby bylo mo žnée ověřit pří nos použit ých metod. Vzniklo n ěkolik desí tek modulů, které jsou zam ěřeny na r ůzné aspekty anotace. Anal ýza jejich činnosti je komplikovaná a vyž adala si vytvo řen složitého syst ému, s jehož pomoc í je možné prov ést velmi podrobný rozbor. Dosa žen e výsledky jsou pozitivní a vybí zejí k pokračov aní v započaté pr áci a jej í mu dal ší mu rozšiřov aní .cs_CZ
dc.description.abstractTectogrammatical layer is very complex and its annotation is di cult and expensive. Unlike other corpora, the Prague English Dependency Treebank (pedt) is based on data for which there already exists a syntactic annotation, even though a fundamentally di erent one. The goal of this work is to propose and implement methods of automatic annotation that are using the available data and (preferably) would lead to minimization of the e ort needed for a manual annotation. A high-quality evaluation is important so that the contribution of the used methods can be veri ed. Tens of modules, which focus on various aspects of annotation, were created. The analysis of their activity is complicated and required a complex system to be created. The analyses created with it are very detailed. The outcome is positive and urges to continue the work and extend it further.en_US
dc.languageČeštinacs_CZ
dc.language.isocs_CZ
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.titleAutomatická anotace angličtiny na tektogramatické roviněcs_CZ
dc.typediplomová prácecs_CZ
dcterms.created2009
dcterms.dateAccepted2009-05-11
dc.description.departmentInstitute of Formal and Applied Linguisticsen_US
dc.description.departmentÚstav formální a aplikované lingvistikycs_CZ
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.identifier.repId62188
dc.title.translatedAutomatic annotation of English on the tectogrammatical levelen_US
dc.contributor.refereeŽabokrtský, Zdeněk
dc.identifier.aleph001197658
thesis.degree.nameMgr.
thesis.degree.levelnavazující magisterskécs_CZ
thesis.degree.disciplineMatematická lingvistikacs_CZ
thesis.degree.disciplineComputational Linguisticsen_US
thesis.degree.programInformatikacs_CZ
thesis.degree.programComputer Scienceen_US
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Ústav formální a aplikované lingvistikycs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Institute of Formal and Applied Linguisticsen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csMatematická lingvistikacs_CZ
uk.degree-discipline.enComputational Linguisticsen_US
uk.degree-program.csInformatikacs_CZ
uk.degree-program.enComputer Scienceen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csTektogramatick á rovina je velmi slo žit á a jej í anotace je n aročná a n ákladná. Na rozdí l od jiných korpusů je Prague English Dependency Treebank (pedt) zalo žen na datech, pro které již existuje syntaktick á anotace, byť principi álně odli šná. C ílem pr áce je navrhnout a implementovat metody automatické anotace vyu ží vaj cí dostupná data a vedoucí k minimalizaci usilí vynaloženého na manu ální anotací. Důule žité je kvalitně vyhodnocen , aby bylo mo žnée ověřit pří nos použit ých metod. Vzniklo n ěkolik desí tek modulů, které jsou zam ěřeny na r ůzné aspekty anotace. Anal ýza jejich činnosti je komplikovaná a vyž adala si vytvo řen složitého syst ému, s jehož pomoc í je možné prov ést velmi podrobný rozbor. Dosa žen e výsledky jsou pozitivní a vybí zejí k pokračov aní v započaté pr áci a jej í mu dal ší mu rozšiřov aní .cs_CZ
uk.abstract.enTectogrammatical layer is very complex and its annotation is di cult and expensive. Unlike other corpora, the Prague English Dependency Treebank (pedt) is based on data for which there already exists a syntactic annotation, even though a fundamentally di erent one. The goal of this work is to propose and implement methods of automatic annotation that are using the available data and (preferably) would lead to minimization of the e ort needed for a manual annotation. A high-quality evaluation is important so that the contribution of the used methods can be veri ed. Tens of modules, which focus on various aspects of annotation, were created. The analysis of their activity is complicated and required a complex system to be created. The analyses created with it are very detailed. The outcome is positive and urges to continue the work and extend it further.en_US
uk.file-availabilityV
uk.publication.placePrahacs_CZ
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistikycs_CZ
dc.identifier.lisID990011976580106986


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV