transparent gif

 

Ej inloggad.

Göteborgs universitets publikationer

Generalised entropy MDPs and Minimax Regret

Författare och institution:
Emmanouil Androulakis (Institutionen för matematiska vetenskaper, Chalmers/GU); Christos Dimitrakakis (Institutionen för data- och informationsteknik, Datavetenskap, Algoritmer (Chalmers), Chalmers)
Publicerad i:
NIPS 2014, From bad models to good policies workshop.,
Publikationstyp:
Konferensbidrag, refereegranskat
Publiceringsår:
2014
Språk:
engelska
Fulltextlänk:
Sammanfattning (abstract):
Bayesian methods suffer from the problem of how to specify prior beliefs. One interesting idea is to consider worst-case priors. This requires solving a stochastic zero-sum game. In this paper, we extend well-known results from bandit theory in order to discover minimax-Bayes policies and discuss when they are practical.
Ämne (baseras på Högskoleverkets indelning av forskningsämnen):
NATURVETENSKAP ->
Matematik ->
Sannolikhetsteori och statistik
Chalmers styrkeområden:
Informations- och kommunikationsteknik
Postens nummer:
209984
Posten skapad:
2015-01-07 15:51
Posten ändrad:
2015-09-14 15:35

Visa i Endnote-format

Göteborgs universitet • Tel. 031-786 0000
© Göteborgs universitet 2007