dc.contributor.advisor | Kováříková, Dominika | |
dc.creator | Dittrichová, Anna | |
dc.date.accessioned | 2024-04-08T11:42:25Z | |
dc.date.available | 2024-04-08T11:42:25Z | |
dc.date.issued | 2024 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/188429 | |
dc.description.abstract | This diploma thesis deals with the search, description, classification, and dictionary comparison of idioms based on data provided by GramatiKat application, which can identify nominal lemmas with anomalous word-form distribution. The aim of the diploma thesis is to determine whether grammatical anomalies in nouns (unusually high frequencies of one or more forms within a morphological paradigm) indicate formally anomalous multi-word lexemes (idioms) and how this relationship varies across different cases. Additionally, it explores the types of idioms that most commonly appear in individual cases of the singular. The analysis, utilizing SYN2015 a SYNv11 corpora, revealed that 28 % of analyzed lemmas are part of one or more idioms. The most common case is the accusative (88 %), while the least common is the vocative (5 %). The analysis also identified various groups of idioms with similar characteristics. For instance, verbal idioms were frequently observed in the dative, contact idioms predominated in the vocative, and grammatical idioms were prevalent in the locative. | en_US |
dc.description.abstract | frazémů, a to na základě dat poskytovaných aplikací GramatiKat, která dokáže identifikovat anomální distribucí tvarů. Cílem práce je zjistit, zda gr anomálie substantiv (tedy nezvykle vysoká frekvence jednoho či více tvarů v morfologického paradigmatu) ukazují na formálně anomální víceslovné lexémy (tedy frazémy), případně jak se tato souvislost liší v rámci jednotlivých pádů a jaké typy frazémů se jednotlivých pádech jednotného čísla objevují nejčastěji. Z analýzy, která využívá jazykové SYNv11, vyplynulo, že na jednom či více frazémech se podílí celkem % analyzovaných lemmat, přičemž nejčastěji se jedná o akuzativ (až 88 %), nejméně naopak %). Ve zkoumaných datech jsou zastoupeny skupiny frazémů se stejnými vlastnostmi, například v dativu se často jednalo o verbální frazémy, ve vokativu o | cs_CZ |
dc.language | Čeština | cs_CZ |
dc.language.iso | cs_CZ | |
dc.publisher | Univerzita Karlova, Filozofická fakulta | cs_CZ |
dc.subject | frazémy|anomálie paradigmatu|distribuce tvarů|GramatiKat|substantiva|korpusová analýza | cs_CZ |
dc.subject | idioms|paradigm anomaly|word-form distribution|GramatiKat|nouns|corpus analysis | en_US |
dc.title | Vyhledávání frazémů na základě anomálie v distribuci tvarů | cs_CZ |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2024 | |
dcterms.dateAccepted | 2024-02-05 | |
dc.description.department | Institute of Czech Language and Theory of Communication | en_US |
dc.description.department | Ústav českého jazyka a teorie komunikace | cs_CZ |
dc.description.faculty | Faculty of Arts | en_US |
dc.description.faculty | Filozofická fakulta | cs_CZ |
dc.identifier.repId | 254902 | |
dc.title.translated | Finding idioms based on anomalous word-form distribution | en_US |
dc.contributor.referee | Bozděchová, Ivana | |
thesis.degree.name | Mgr. | |
thesis.degree.level | navazující magisterské | cs_CZ |
thesis.degree.discipline | Empirical and Comparative Linguistics | en_US |
thesis.degree.discipline | Empirická a komparativní lingvistika | cs_CZ |
thesis.degree.program | Empirical and Comparative Linguistics | en_US |
thesis.degree.program | Empirická a komparativní lingvistika | cs_CZ |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Filozofická fakulta::Ústav českého jazyka a teorie komunikace | cs_CZ |
uk.taxonomy.organization-en | Faculty of Arts::Institute of Czech Language and Theory of Communication | en_US |
uk.faculty-name.cs | Filozofická fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Arts | en_US |
uk.faculty-abbr.cs | FF | cs_CZ |
uk.degree-discipline.cs | Empirická a komparativní lingvistika | cs_CZ |
uk.degree-discipline.en | Empirical and Comparative Linguistics | en_US |
uk.degree-program.cs | Empirická a komparativní lingvistika | cs_CZ |
uk.degree-program.en | Empirical and Comparative Linguistics | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | frazémů, a to na základě dat poskytovaných aplikací GramatiKat, která dokáže identifikovat anomální distribucí tvarů. Cílem práce je zjistit, zda gr anomálie substantiv (tedy nezvykle vysoká frekvence jednoho či více tvarů v morfologického paradigmatu) ukazují na formálně anomální víceslovné lexémy (tedy frazémy), případně jak se tato souvislost liší v rámci jednotlivých pádů a jaké typy frazémů se jednotlivých pádech jednotného čísla objevují nejčastěji. Z analýzy, která využívá jazykové SYNv11, vyplynulo, že na jednom či více frazémech se podílí celkem % analyzovaných lemmat, přičemž nejčastěji se jedná o akuzativ (až 88 %), nejméně naopak %). Ve zkoumaných datech jsou zastoupeny skupiny frazémů se stejnými vlastnostmi, například v dativu se často jednalo o verbální frazémy, ve vokativu o | cs_CZ |
uk.abstract.en | This diploma thesis deals with the search, description, classification, and dictionary comparison of idioms based on data provided by GramatiKat application, which can identify nominal lemmas with anomalous word-form distribution. The aim of the diploma thesis is to determine whether grammatical anomalies in nouns (unusually high frequencies of one or more forms within a morphological paradigm) indicate formally anomalous multi-word lexemes (idioms) and how this relationship varies across different cases. Additionally, it explores the types of idioms that most commonly appear in individual cases of the singular. The analysis, utilizing SYN2015 a SYNv11 corpora, revealed that 28 % of analyzed lemmas are part of one or more idioms. The most common case is the accusative (88 %), while the least common is the vocative (5 %). The analysis also identified various groups of idioms with similar characteristics. For instance, verbal idioms were frequently observed in the dative, contact idioms predominated in the vocative, and grammatical idioms were prevalent in the locative. | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Filozofická fakulta, Ústav českého jazyka a teorie komunikace | cs_CZ |
thesis.grade.code | 1 | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |