Interpreting and Controlling Linguistic Features in Multilingual Language Models
Interpretace a přizpůsobování jazykových jevů ve vícejazyčných modelech
dizertační práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/192821Identifikátory
SIS: 221829
Kolekce
- Kvalifikační práce [11214]
Autor
Vedoucí práce
Konzultant práce
Rosa, Rudolf
Oponent práce
Belinkov, Yonatan
Voita, Lena
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Computational linguistics
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
5. 9. 2024
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Prospěl/a
Klíčová slova (česky)
zpracování přirozeného jazyka|jazykové modely|vícejazyčnost|interpretovatelné strojové učeníKlíčová slova (anglicky)
natural language processing|language models|multilinguality|interpretable machine learningNázev práce: Interpretace a přizpůsobování jazykových jevů ve vícejazyčných modelech Autor: Tomasz Limisiewicz Katedra: Ústav formální a aplikované lingvistiky Vedoucí práce: David Mareček, Ústav formální a aplikované lingvistiky Abstrakt: Jazykové modely založené na neuronových sítích se staly základem pro řešení nej- různějších úloh, jejich vnitřní fungování však zůstává nejasné. Tato disertační práce zkoumá, které komponenty jazykových modelů jsou klíčové pro reprezentaci a zpra- cování textových informací. Zaměřujeme se především na vícejazyčné modely, které mohou využívat reprezentaci pro zpracování úloh napříč různými jazyky. Předpo- kládáme, že pochopení toho, jak modely reprezentují jazykové jevy, je nezbytné pro jejich následné přizpůsobování a zmírňování problémů, kterými tyto modely trpí. Za tímto účelem navrhujeme nové techniky pro interpretaci jednotlivých kompo- nent jazykových modelů. Naše metody umožňují lokalizovat reprezentaci různých typů signálů v těchto modelech. Tato lokalizace nám umožňuje omezit naši analýzu na konkrétní komponenty a aplikovat cílené opravy modelů ke zmírnění genderové zaujatosti nebo zlepšení mezijazykového přenosu. Klíčová slova: zpracování přirozeného jazyka, jazykové modely, vícejazyčnost, interpretovatelné strojové učení vii