Úlohy stochastického dynamického programování: teorie a aplikace

Lendel, Gabriel

Stochastic Dynamic Programming Problems: Theory and Applications.
Úlohy stochastického dynamického programování: teorie a aplikace

dc.contributor.advisor	Sladký, Karel
dc.creator	Lendel, Gabriel
dc.date.accessioned	2017-05-07T22:21:19Z
dc.date.available	2017-05-07T22:21:19Z
dc.date.issued	2012
dc.identifier.uri	http://hdl.handle.net/20.500.11956/46656
dc.description.abstract	Názov práce: Úlohy stochastického dynamického programování: teorie a aplikace Autor: Gabriel Lendel Katedra: Katedra pravděpodobnosti a matematické statistiky Vedúci diplomovej práce: Ing. Karel Sladký CSc. e-mail vedúceho: sladky@utia.cas.cz Abstrakt: V predloženej práci študujeme riadené Markovove ret'azce s ohodnotením, ktoré umožňujú modelovat' dynamické systémy, ktorých správanie je čiastočne ná- hodné a čiastočne pod kontrolou. Zaoberáme sa zostavením iteračných postupov, kto- rých cielom je nájst' riadenie systému tak, aby bolo optimálne alebo skoro optimálne vzhl'adom k zvolenému kritériu. Konkrétne v práci skúmame hlavne úlohu nájdenia riadenia, ktoré je optimálne vzhl'adom k celkovému očakávanému diskontovanému výnosu alebo priemernému očakávanému výnosu, či pre diskrétne alebo spojité sys- témy. Študujeme algoritmy iterujúce riadenie (policy iteration) a aproximatívne algo- ritmy iterujúce hodnotu (value iteration). Pre vybrané postupy uvádzame numerickú analýzu konkrétnych problémov. Kl'účové slová: Stochastické dynamické programovanie, riadené Markovove ret'azce s ohodnotením, policy iteration, value iteration	cs_CZ
dc.description.abstract	Title: Stochastic Dynamic Programming Problems: Theory and Applications Author: Gabriel Lendel Department: Department of Probability and Mathematical Statistics Supervisor: Ing. Karel Sladký CSc. Supervisor's e-mail address: sladky@utia.cas.cz Abstract: In the present work we study Markov decision processes which provide a mathematical framework for modeling decision-making in situations where outcomes are partly random and partly under the control of a decision maker. We study iterative procedures for finding policy that is optimal or nearly optimal with respect to the selec- ted criteria. Specifically, we mainly examine the task of finding a policy that is optimal with respect to the total expected discounted reward or the average expected reward for discrete or continuous systems. In the work we study policy iteration algorithms and aproximative value iteration algorithms. We give numerical analysis of specific problems. Keywords: Stochastic dynamic programming, Markov decision process, policy ite- ration, value iteration	en_US
dc.language	Slovenčina	cs_CZ
dc.language.iso	sk_SK
dc.publisher	Univerzita Karlova, Matematicko-fyzikální fakulta	cs_CZ
dc.subject	stochastické dynamické programovanie	cs_CZ
dc.subject	riadené Markovove reťazce s ohodnotením	cs_CZ
dc.subject	policy iteration	cs_CZ
dc.subject	value iteration	cs_CZ
dc.subject	stochastic dynamic programming	en_US
dc.subject	Markov decision processes	en_US
dc.subject	policy iteration	en_US
dc.subject	value iteration	en_US
dc.title	Úlohy stochastického dynamického programování: teorie a aplikace	sk_SK
dc.type	diplomová práce	cs_CZ
dcterms.created	2012
dcterms.dateAccepted	2012-01-24
dc.description.department	Department of Probability and Mathematical Statistics	en_US
dc.description.department	Katedra pravděpodobnosti a matematické statistiky	cs_CZ
dc.description.faculty	Faculty of Mathematics and Physics	en_US
dc.description.faculty	Matematicko-fyzikální fakulta	cs_CZ
dc.identifier.repId	76880
dc.title.translated	Stochastic Dynamic Programming Problems: Theory and Applications.	en_US
dc.title.translated	Úlohy stochastického dynamického programování: teorie a aplikace	cs_CZ
dc.contributor.referee	Lachout, Petr
dc.identifier.aleph	001427117
thesis.degree.name	Mgr.
thesis.degree.level	navazující magisterské	cs_CZ
thesis.degree.discipline	Probability, mathematical statistics and econometrics	en_US
thesis.degree.discipline	Pravděpodobnost, matematická statistika a ekonometrie	cs_CZ
thesis.degree.program	Mathematics	en_US
thesis.degree.program	Matematika	cs_CZ
uk.thesis.type	diplomová práce	cs_CZ
uk.taxonomy.organization-cs	Matematicko-fyzikální fakulta::Katedra pravděpodobnosti a matematické statistiky	cs_CZ
uk.taxonomy.organization-en	Faculty of Mathematics and Physics::Department of Probability and Mathematical Statistics	en_US
uk.faculty-name.cs	Matematicko-fyzikální fakulta	cs_CZ
uk.faculty-name.en	Faculty of Mathematics and Physics	en_US
uk.faculty-abbr.cs	MFF	cs_CZ
uk.degree-discipline.cs	Pravděpodobnost, matematická statistika a ekonometrie	cs_CZ
uk.degree-discipline.en	Probability, mathematical statistics and econometrics	en_US
uk.degree-program.cs	Matematika	cs_CZ
uk.degree-program.en	Mathematics	en_US
thesis.grade.cs	Výborně	cs_CZ
thesis.grade.en	Excellent	en_US
uk.abstract.cs	Názov práce: Úlohy stochastického dynamického programování: teorie a aplikace Autor: Gabriel Lendel Katedra: Katedra pravděpodobnosti a matematické statistiky Vedúci diplomovej práce: Ing. Karel Sladký CSc. e-mail vedúceho: sladky@utia.cas.cz Abstrakt: V predloženej práci študujeme riadené Markovove ret'azce s ohodnotením, ktoré umožňujú modelovat' dynamické systémy, ktorých správanie je čiastočne ná- hodné a čiastočne pod kontrolou. Zaoberáme sa zostavením iteračných postupov, kto- rých cielom je nájst' riadenie systému tak, aby bolo optimálne alebo skoro optimálne vzhl'adom k zvolenému kritériu. Konkrétne v práci skúmame hlavne úlohu nájdenia riadenia, ktoré je optimálne vzhl'adom k celkovému očakávanému diskontovanému výnosu alebo priemernému očakávanému výnosu, či pre diskrétne alebo spojité sys- témy. Študujeme algoritmy iterujúce riadenie (policy iteration) a aproximatívne algo- ritmy iterujúce hodnotu (value iteration). Pre vybrané postupy uvádzame numerickú analýzu konkrétnych problémov. Kl'účové slová: Stochastické dynamické programovanie, riadené Markovove ret'azce s ohodnotením, policy iteration, value iteration	cs_CZ
uk.abstract.en	Title: Stochastic Dynamic Programming Problems: Theory and Applications Author: Gabriel Lendel Department: Department of Probability and Mathematical Statistics Supervisor: Ing. Karel Sladký CSc. Supervisor's e-mail address: sladky@utia.cas.cz Abstract: In the present work we study Markov decision processes which provide a mathematical framework for modeling decision-making in situations where outcomes are partly random and partly under the control of a decision maker. We study iterative procedures for finding policy that is optimal or nearly optimal with respect to the selec- ted criteria. Specifically, we mainly examine the task of finding a policy that is optimal with respect to the total expected discounted reward or the average expected reward for discrete or continuous systems. In the work we study policy iteration algorithms and aproximative value iteration algorithms. We give numerical analysis of specific problems. Keywords: Stochastic dynamic programming, Markov decision process, policy ite- ration, value iteration	en_US
uk.file-availability	V
uk.publication.place	Praha	cs_CZ
uk.grantor	Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra pravděpodobnosti a matematické statistiky	cs_CZ
dc.identifier.lisID	990014271170106986