dc.contributor.advisor | Komárek, Arnošt | |
dc.creator | Vávra, Jan | |
dc.date.accessioned | 2024-01-10T07:28:25Z | |
dc.date.available | 2024-01-10T07:28:25Z | |
dc.date.issued | 2023 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/179843 | |
dc.description.abstract | Modelově založené shlukování vícerozměrných longitudinálních dat smíšeného typu Jan Vávra 3. října 2022 Abstrakt Mnoho dnešních studií sbírá data opakovaně na těch samých jedin- cích po předem vymezenou časovou dobu. Takto vzniklá longitudinální data jsou navíc často tvořena číselnými, čítacími, binárními, ordinálními nebo obecně kategoriálními hodnotami. Je zde navrženo několik variant statistických modelů schopných modelovat takováto často velmi korelo- vaná data sdruženě. Metodologie modelově založeného shlukování je zde použita pro odhalení skryté heterogenity v datech tím, že jedince roztřídí do několika skupin specifických vlastností. Generativní model je zde vy- tvořen za bayesovského přístupu a jsou zde vyvinuty MCMC metody pro jeho odhad. Vlastnosti stvořených odhadů jsou podrobeny simulační stu- dii. Vyvinutá metodologie je aplikovaná na problémy z reálného prostředí, např. data z lékařské studie o pacientech trpících primární biliární cho- langitidou (PBC) či ekonomický dataset o tisících českých domácnostech sledovaných od roku 2005 (databáze EU-SILC). 1 | cs_CZ |
dc.description.abstract | Model-based Clustering of Multivariate Longitudinal Data of a Mixed Type Jan Vávra October 3, 2022 Abstract In many nowadays studies, the data are collected repeatedly on the same units over a certain period of time. Moreover, such longitudinal data are composed of numeric values, count variables, binary indicators, ordered or nominal categories. A few variants of statistical model capa- ble of modelling such often highly correlated data jointly are introduced. On top of that, a methodology of model-based clustering is adapted to such models to discover hidden heterogeneity within the data by dividing units into clusters of specific characteristics. Bayesian approach is taken, generative model is proposed and MCMC methodology is developed for estimation. A simulation study verifying the estimation properties is con- ducted. The methodology is applied to real datasets such as medical data on patients suffering from primary biliary cholangitis (PBC) or econom- ical dataset consisting of thousands of Czech households followed since 2005 (EU-SILC database). 1 | en_US |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | modelově založené shlukování|MCMC|longitudinální data|GLMM|smíšený typ | cs_CZ |
dc.subject | model-based clustering|MCMC|longitudinal data|GLMM|mixed type | en_US |
dc.title | Model-based Clustering of Multivariate Longitudinal Data of a Mixed Type | en_US |
dc.type | dizertační práce | cs_CZ |
dcterms.created | 2023 | |
dcterms.dateAccepted | 2023-01-09 | |
dc.description.department | Department of Probability and Mathematical Statistics | en_US |
dc.description.department | Katedra pravděpodobnosti a matematické statistiky | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.identifier.repId | 201815 | |
dc.title.translated | Modelově založené shlukování vícerozměrných longitudinálních dat smíšeného typu | cs_CZ |
dc.contributor.referee | Frühwirth-Schnatter, Sylvia | |
dc.contributor.referee | Hlávka, Zdeněk | |
thesis.degree.name | Ph.D. | |
thesis.degree.level | doktorské | cs_CZ |
thesis.degree.discipline | Probability and statistics, econometrics and financial mathematics | en_US |
thesis.degree.discipline | Pravděpodobnost a statistika, ekonometrie a finanční matematika | cs_CZ |
thesis.degree.program | Probability and statistics, econometrics and financial mathematics | en_US |
thesis.degree.program | Pravděpodobnost a statistika, ekonometrie a finanční matematika | cs_CZ |
uk.thesis.type | dizertační práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra pravděpodobnosti a matematické statistiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Probability and Mathematical Statistics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Pravděpodobnost a statistika, ekonometrie a finanční matematika | cs_CZ |
uk.degree-discipline.en | Probability and statistics, econometrics and financial mathematics | en_US |
uk.degree-program.cs | Pravděpodobnost a statistika, ekonometrie a finanční matematika | cs_CZ |
uk.degree-program.en | Probability and statistics, econometrics and financial mathematics | en_US |
thesis.grade.cs | Prospěl/a | cs_CZ |
thesis.grade.en | Pass | en_US |
uk.abstract.cs | Modelově založené shlukování vícerozměrných longitudinálních dat smíšeného typu Jan Vávra 3. října 2022 Abstrakt Mnoho dnešních studií sbírá data opakovaně na těch samých jedin- cích po předem vymezenou časovou dobu. Takto vzniklá longitudinální data jsou navíc často tvořena číselnými, čítacími, binárními, ordinálními nebo obecně kategoriálními hodnotami. Je zde navrženo několik variant statistických modelů schopných modelovat takováto často velmi korelo- vaná data sdruženě. Metodologie modelově založeného shlukování je zde použita pro odhalení skryté heterogenity v datech tím, že jedince roztřídí do několika skupin specifických vlastností. Generativní model je zde vy- tvořen za bayesovského přístupu a jsou zde vyvinuty MCMC metody pro jeho odhad. Vlastnosti stvořených odhadů jsou podrobeny simulační stu- dii. Vyvinutá metodologie je aplikovaná na problémy z reálného prostředí, např. data z lékařské studie o pacientech trpících primární biliární cho- langitidou (PBC) či ekonomický dataset o tisících českých domácnostech sledovaných od roku 2005 (databáze EU-SILC). 1 | cs_CZ |
uk.abstract.en | Model-based Clustering of Multivariate Longitudinal Data of a Mixed Type Jan Vávra October 3, 2022 Abstract In many nowadays studies, the data are collected repeatedly on the same units over a certain period of time. Moreover, such longitudinal data are composed of numeric values, count variables, binary indicators, ordered or nominal categories. A few variants of statistical model capa- ble of modelling such often highly correlated data jointly are introduced. On top of that, a methodology of model-based clustering is adapted to such models to discover hidden heterogeneity within the data by dividing units into clusters of specific characteristics. Bayesian approach is taken, generative model is proposed and MCMC methodology is developed for estimation. A simulation study verifying the estimation properties is con- ducted. The methodology is applied to real datasets such as medical data on patients suffering from primary biliary cholangitis (PBC) or econom- ical dataset consisting of thousands of Czech households followed since 2005 (EU-SILC database). 1 | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra pravděpodobnosti a matematické statistiky | cs_CZ |
thesis.grade.code | P | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |
dc.identifier.lisID | 9925787922206986 | |