Typické vzory užívání anglických sloves
Typical Usage Patterns of English Verbs
diplomová práce (OBHÁJENO)
![Náhled dokumentu](/bitstream/handle/20.500.11956/33980/thumbnail.png?sequence=7&isAllowed=y)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/33980Identifikátory
SIS: 79237
Kolekce
- Kvalifikační práce [11264]
Autor
Vedoucí práce
Oponent práce
Lopatková, Markéta
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Matematická lingvistika
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
6. 9. 2010
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Metoda CPA (Corpus Pattern Analysis) je korpusová metoda, která analyzuje typické vzory užívání slov v jazykovém korpusu a popisuje význam sloves pomocí kontextových preferencí definovaných jak syntakticky, tak sémanticky [1]. V současné době pomocí CPA a s využitím Britského národního korpusu (BNC) vzniká Slovník vzorů užívání anglických sloves (PDEV, Pattern Dictionary of English Verbs) [1, 2]. Diplomová práce popisuje současný stav slovníku PDEV, zabývá se podrobnou analýzou dostupných dat o typických vzorech užívání anglických sloves a zkoumá, jak lze využít PDEV pro automatickou analýzu lexikálního významu. Dále diplomová práce obsahuje návrh a implementaci procedur pro podporu dalšího vývoje slovníku PDEV. První z nich je extrakce slovesných argumentů z výstupu syntaktické analýzy angličtiny. Druhá procedura využívá tyto extrahované argumenty k vytváření seznamů lexikálních jednotek realizujících sémantické typy. Poslední navržená procedura automaticky rozpoznává typické vzory užívání sloves za pomoci uvedených seznamů ziskaných předchozí procedurou. Součástí práce je též vyhodnocení mezianotátorské shody, evaluace automatické extrakce slovesných argumentů z anglické věty a experimentální ověření účinnosti navržených procedur pro extrakci lexikálních jednotek realizujících jednotlivé sémantické typy a...
Corpus Pattern Analysis (CPA) is a corpus-based method that explores typical usage patterns of verbs in a text corpus, and describes meaning of verbs by means of contextual preferences defined both syntactically and semantically [1]. CPA in conjuction with the British National Corpus (BNC) is currently used to create The Pattern Dictionary of English Verbs (PDEV) [1, 2]. The thesis describes the current status of the PDEV, presents a thorough analysis of available data on typical usage patterns and explores possible applications of the PDEV for automatic lexical analysis. In this thesis procedures usable in further PDEV development have been designed and implemented. The first of them automatically extracts arguments of verbs from an output of English syntactic analysis. The second one uses the extracted arguments to create lists of lexical units that realize semantic types. The last procedure uses these lists to automatically recognize typical usage patterns of verbs. The thesis also evaluates inter-annotator agreement, automatic extraction of verb arguments in/from English sentence, and effectiveness of the proposed procedures in the extraction of lexical units that realize semantic types and in automatic recognition of typical usage patterns.