Formální analýza morfologie akkadštiny
Formal analysis of Akkadian morphology
diploma thesis (DEFENDED)
![Document thumbnail](/bitstream/handle/20.500.11956/14971/thumbnail.png?sequence=7&isAllowed=y)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/14971Identifiers
Study Information System: 59543
Collections
- Kvalifikační práce [23778]
Author
Advisor
Referee
Vavroušek, Petr
Faculty / Institute
Faculty of Arts
Discipline
Comparative Linguistics
Department
Institute of Comparative Linguistics
Date of defense
27. 5. 2008
Publisher
Univerzita Karlova, Filozofická fakultaLanguage
Czech
Grade
Good
Práce zpracovává návrh formální struktury akkadské morfologie pro účely uplatnění výstupu při tagování korpusu akkadštiny a navrhuje systém tagů (tagset) k tomuto účelu. Navržený systém pak testuje na vzorku šedesáti řádků originálního akkadského textu. Podává stručný přehled jednak akkadské gramatiky a jednak postupů a způsobů, jakými se řeší elektronické zpracování semitských jazyků. Výstup je prezentován formou aplikace v jazyku PHP, která je umístěna v síti internet na adrese http://akkorpus.sachmet.org. Databáze obsahuje označkovaná akkadská slova, včetně jejich základního slovníkového tvaru - lemmatu. Rozhraní umožňuje přidávat záznamy, mazat záznamy, zobrazovat záznamy, vyhledávat podle zadaných kritérií a filtrovat vyhledané výsledky. Systém je variabilní a je možné jej v budoucnu rozšiřovat.
In recent years we can witness tendencies to process electronically not only living languages, but also ancient languages. This trend has also its impact on the sphere of Semitic languages as well. My thesis deals with the situation at Akkadian language. The extent of this thesis does not allow to solve the issue of automatic morphological analysis - however, it is possible to specify the morphological model of the Akkadian language with regard to use of the defined categories and their values in tagging of Akkadian. When processing Akkadian electronically we need to face several important issues. Since Akkadian is a dead language, it is not possible to gather information from native speakers, we have to depend fully on written sources. The first problem is the written text itself - it needs to be transliterated from a cuneiform script, which was not originally mentioned for a Semitic language. Further we need to solve the issue of defining the word boundaries, so that we could proceed to the morphologic analysis and tagging. Last but not least we have to deal with phonetic changes in such cases as assimilation, dissimilation, contraction etc. In the practical part of the thesis I suggested a tagset and used it for tagging of cca 60 lines of the original Akkadian text from the preface to Hammurabi's Code....