EM algorithm for truncated Gaussian mixtures
EM algoritmus pro useknuté gaussovské směsi
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/176140Identifiers
Study Information System: 204939
Collections
- Kvalifikační práce [11242]
Author
Advisor
Referee
Nagy, Stanislav
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Probability, mathematical statistics and econometrics
Department
Department of Probability and Mathematical Statistics
Date of defense
12. 9. 2022
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Good
Keywords (Czech)
EM algoritmus, neúplná pozorování, směs rozdělení, mnohorozměrné normální rozděleníKeywords (English)
EM algorithm, truncated observations, mixture distribution, multivariate normal distributionIterativní algoritmus expectation-maximization je často používán pro odhad parametrů při práci s chybějícími informacemi. Taková situace může přirozeně nastat v případě, kdy data pozorujeme na ohraničeném okně. Tato práce se zaměřuje na aplikaci EM algoritmu pro useknuté gaussovské směsi a porovnává navržený algoritmus s přístupem z článku Lee a Scott [2012], který využívá heuristické zjednodušení a není dostatečně matematicky podložen. Chování navrženého algoritmu je také porovnáno s postupem z článku za pomoci simulačních studií a analýzy reálných dat. Práce také poskytuje implementaci EM algoritmu pro useknuté gaussovské směsi v jazyku Python.
The expectation-maximization iterative algorithm is widely used in parameter estimation when dealing with missing information. Such a situation can naturally arise when we observe the data of our interest on a bounded observation window. This thesis focuses on the application of the EM algorithm for truncated Gaussian mixtures and compares the proposed algorithm with the approach in a previously published article, see Lee and Scott [2012], where it uses a heuristic simplification and is not sufficiently supported mathematically. We also compare the behavior of the proposed algorithm with the procedure from the article in a series of simulated experiments, as well as in analyzing a real dataset. We also provide Python implementation of the EM algorithm for truncated Gaussian mixtures.