Úrovňové množiny mnohorozměrné hustoty a jejich odhady

Kubetta, Adam

Level Sets of Multivariate Density Functions and their Estimates

diplomová práce (OBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (55.80Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/49435

Identifikátory

SIS: 75048

Oponent práce

Zichová, Jitka

Fakulta / součást

Matematicko-fyzikální fakulta

Obor

Finanční a pojistná matematika

Katedra / ústav / klinika

Katedra pravděpodobnosti a matematické statistiky

Datum obhajoby

14. 9. 2011

Nakladatel

Univerzita Karlova, Matematicko-fyzikální fakulta

Jazyk

Čeština

Známka

Výborně

Klíčová slova (česky)

úrovňová množina, odhad plug-in, opěrné vektory, dyadické rozhodovací stromy, Mathematica

Klíčová slova (anglicky)

level set, plug-in estimate, support vector machine, dyadic decision trees, Mathematica

Úrovňová (vrstevnicová) množina nějaké funkce je oblast, v níž daná funkce překračuje určitou úroveň. Úrovňovou množinu pravděpodobnostní hustoty lze považovat za alternativu k tradičnímu odhadu oblasti spolehlivosti, protože za jistých předpokladů pokrývá úrovňová množina při dané hladině spolehlivosti nejmenší možnou oblast. Výhody úrovňových množin, například ve srovnání s obyčejnými intervalovými odhady oblastí spolehlivosti, vynikají při aplikaci na vícemodální náhodné veličiny či náhodné vektory s výrazně korelovanými složkami. Práce se zabývá metodami odhadů úrovňových množin z dat jednak pomocí tzv. metody plug-in, kdy se nejprve z dat odhaduje jejich hustota rozdělení, z níž se následně úrovňová množina určuje, a jednak pomocí přímých metod založených na teorii opěrných vektorů či dyadických rozhodovacích stromů. Neparametrickým odhadům hustot pravděpodobnosti, tvořícím základ metody plug-in, se věnuje samostatná kapitola, která podrobně popisuje jednoduchý odhad hustoty histogramem, dále jeho zjemnění posouváním a průměrováním, jádrový odhad hustoty a jeho zobecnění. Detailněji se pak popisuje zobecnění upravující jednotlivá jádra, které řeší tzv. hraniční efekt u vícerozměrných dat. V závěrečné části jsou všechny popisované postupy implementovány v softwaru Mathematica a vzájemně srovnány na...

Abstrakt (anglicky)

A level set of a function is defined as the region, where the function gets over the specified level. A level set of the probability density function can be considered an alternative to the traditional confidence region because on certain conditions the level set covers the region with minimal volume over all regions with a given confidence level. The benefits of using level sets arise in situations where, for example, the given random variables are multimodal or the given random vectors have strongly correlated components. This thesis describes estimates of the level set by means of a so called plug-in method, which first estimates density from the data set and then specifies the level set from the estimated density. In addition, explicit direct methods are also studied, such as algorithms based on support vectors or dyadic decision trees. Special attention is paid to the nonparametric probability density estimates, which form an essential tool for plug-in estimates. Namely, the second chapter describes histograms, averaged shifted histograms, kernel density estimates and its generalization. A new technique transforming kernel supports is proposed to avoid the so called boundary effect in multidimensional data domains. Ultimately, all methods are implemented in Mathematica and compared on financial data sets.

Citace dokumentu

Metadata

Zobrazit celý záznam