Interpreting and Controlling Linguistic Features in Multilingual Language Models
Interpretace a přizpůsobování jazykových jevů ve vícejazyčných modelech
dissertation thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/192821Identifiers
Study Information System: 221829
Collections
- Kvalifikační práce [11216]
Author
Advisor
Consultant
Rosa, Rudolf
Referee
Belinkov, Yonatan
Voita, Lena
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computational linguistics
Department
Institute of Formal and Applied Linguistics
Date of defense
5. 9. 2024
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Pass
Keywords (Czech)
zpracování přirozeného jazyka|jazykové modely|vícejazyčnost|interpretovatelné strojové učeníKeywords (English)
natural language processing|language models|multilinguality|interpretable machine learningNázev práce: Interpretace a přizpůsobování jazykových jevů ve vícejazyčných modelech Autor: Tomasz Limisiewicz Katedra: Ústav formální a aplikované lingvistiky Vedoucí práce: David Mareček, Ústav formální a aplikované lingvistiky Abstrakt: Jazykové modely založené na neuronových sítích se staly základem pro řešení nej- různějších úloh, jejich vnitřní fungování však zůstává nejasné. Tato disertační práce zkoumá, které komponenty jazykových modelů jsou klíčové pro reprezentaci a zpra- cování textových informací. Zaměřujeme se především na vícejazyčné modely, které mohou využívat reprezentaci pro zpracování úloh napříč různými jazyky. Předpo- kládáme, že pochopení toho, jak modely reprezentují jazykové jevy, je nezbytné pro jejich následné přizpůsobování a zmírňování problémů, kterými tyto modely trpí. Za tímto účelem navrhujeme nové techniky pro interpretaci jednotlivých kompo- nent jazykových modelů. Naše metody umožňují lokalizovat reprezentaci různých typů signálů v těchto modelech. Tato lokalizace nám umožňuje omezit naši analýzu na konkrétní komponenty a aplikovat cílené opravy modelů ke zmírnění genderové zaujatosti nebo zlepšení mezijazykového přenosu. Klíčová slova: zpracování přirozeného jazyka, jazykové modely, vícejazyčnost, interpretovatelné strojové učení vii