Recursive self-tuning control of finite Markov chains

Vivek Borkar

doi:10.4064/am-24-2-169-188

Wydawnictwa / Czasopisma IMPAN / Applicationes Mathematicae / Wszystkie zeszyty

Przeszukaj wydawnictwa IMPAN

Recursive self-tuning control of finite Markov chains

Tom 24 / 1997

Vivek Borkar Applicationes Mathematicae 24 (1997), 169-188 DOI: 10.4064/am-24-2-169-188

Streszczenie

A recursive self-tuning control scheme for finite Markov chains is proposed wherein the unknown parameter is estimated by a stochastic approximation scheme for maximizing the log-likelihood function and the control is obtained via a relative value iteration algorithm. The analysis uses the asymptotic o.d.e.s associated with these.

Autorzy

Vivek Borkar

Pobierz zgodnie z CC-BY

Przeszukaj wydawnictwa IMPAN

Wydawnictwa / Czasopisma IMPAN / Applicationes Mathematicae / Wszystkie zeszyty

Applicationes Mathematicae

Recursive self-tuning control of finite Markov chains

Tom 24 / 1997

Streszczenie

Autorzy

Przeszukaj wydawnictwa IMPAN

Przepisz kod z obrazka