Úrovňové množiny mnohorozměrné hustoty a jejich odhady
Level Sets of Multivariate Density Functions and their Estimates
diplomová práce (OBHÁJENO)

Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/49435Identifikátory
SIS: 75048
Kolekce
- Kvalifikační práce [11267]
Autor
Vedoucí práce
Oponent práce
Zichová, Jitka
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Finanční a pojistná matematika
Katedra / ústav / klinika
Katedra pravděpodobnosti a matematické statistiky
Datum obhajoby
14. 9. 2011
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
úrovňová množina, odhad plug-in, opěrné vektory, dyadické rozhodovací stromy, MathematicaKlíčová slova (anglicky)
level set, plug-in estimate, support vector machine, dyadic decision trees, MathematicaÚrovňová (vrstevnicová) množina nějaké funkce je oblast, v níž daná funkce překračuje určitou úroveň. Úrovňovou množinu pravděpodobnostní hustoty lze považovat za alternativu k tradičnímu odhadu oblasti spolehlivosti, protože za jistých předpokladů pokrývá úrovňová množina při dané hladině spolehlivosti nejmenší možnou oblast. Výhody úrovňových množin, například ve srovnání s obyčejnými intervalovými odhady oblastí spolehlivosti, vynikají při aplikaci na vícemodální náhodné veličiny či náhodné vektory s výrazně korelovanými složkami. Práce se zabývá metodami odhadů úrovňových množin z dat jednak pomocí tzv. metody plug-in, kdy se nejprve z dat odhaduje jejich hustota rozdělení, z níž se následně úrovňová množina určuje, a jednak pomocí přímých metod založených na teorii opěrných vektorů či dyadických rozhodovacích stromů. Neparametrickým odhadům hustot pravděpodobnosti, tvořícím základ metody plug-in, se věnuje samostatná kapitola, která podrobně popisuje jednoduchý odhad hustoty histogramem, dále jeho zjemnění posouváním a průměrováním, jádrový odhad hustoty a jeho zobecnění. Detailněji se pak popisuje zobecnění upravující jednotlivá jádra, které řeší tzv. hraniční efekt u vícerozměrných dat. V závěrečné části jsou všechny popisované postupy implementovány v softwaru Mathematica a vzájemně srovnány na...
A level set of a function is defined as the region, where the function gets over the specified level. A level set of the probability density function can be considered an alternative to the traditional confidence region because on certain conditions the level set covers the region with minimal volume over all regions with a given confidence level. The benefits of using level sets arise in situations where, for example, the given random variables are multimodal or the given random vectors have strongly correlated components. This thesis describes estimates of the level set by means of a so called plug-in method, which first estimates density from the data set and then specifies the level set from the estimated density. In addition, explicit direct methods are also studied, such as algorithms based on support vectors or dyadic decision trees. Special attention is paid to the nonparametric probability density estimates, which form an essential tool for plug-in estimates. Namely, the second chapter describes histograms, averaged shifted histograms, kernel density estimates and its generalization. A new technique transforming kernel supports is proposed to avoid the so called boundary effect in multidimensional data domains. Ultimately, all methods are implemented in Mathematica and compared on financial data sets.