A new policy iteration scheme for Markov decision processes using Schweitzer's formula

J. B. Lasserre

doi:10.2307/3215254

A new policy iteration scheme for Markov decision processes using Schweitzer's formula

Journal of Applied Probability ◽

10.1017/s0021900200107521 ◽

1994 ◽

Vol 31 (01) ◽

pp. 268-273 ◽

Cited By ~ 2

Author(s):

J. B. Lasserre

Keyword(s):

Markov Decision Processes ◽

Exact Formula ◽

Iteration Scheme ◽

Policy Iteration ◽

Decision Processes ◽

Steady State Probability ◽

Markov Decision ◽

One Step ◽

New Criterion ◽

And Storage

Given a family of Markov chains with a single recurrent class, we present a potential application of Schweitzer's exact formula relating the steady-state probability and fundamental matrices of any two chains in the family. We propose a new policy iteration scheme for Markov decision processes where in contrast to policy iteration, the new criterion for selecting an action ensures the maximal one-step average cost improvement. Its computational complexity and storage requirement are analysed.

Download Full-text

Detecting optimal and non-optimal actions in average-cost Markov decision processes

Journal of Applied Probability ◽

10.1017/s0021900200099502 ◽

1994 ◽

Vol 31 (04) ◽

pp. 979-990

Author(s):

Jean B. Lasserre

Keyword(s):

Linear Programming ◽

Markov Decision Processes ◽

Average Cost ◽

Sufficient Conditions ◽

Iteration Scheme ◽

Policy Iteration ◽

Decision Processes ◽

Ergodic Average ◽

Linear Programming Methods ◽

Markov Decision

We present two sufficient conditions for detection of optimal and non-optimal actions in (ergodic) average-cost MDPs. They are easily interpreted and can be implemented as detection tests in both policy iteration and linear programming methods. An efficient implementation of a recent new policy iteration scheme is discussed.

Download Full-text

Detecting optimal and non-optimal actions in average-cost Markov decision processes

Journal of Applied Probability ◽

10.2307/3215322 ◽

1994 ◽

Vol 31 (4) ◽

pp. 979-990 ◽

Cited By ~ 3

Author(s):

Jean B. Lasserre

Keyword(s):

Linear Programming ◽

Markov Decision Processes ◽

Average Cost ◽

Sufficient Conditions ◽

Iteration Scheme ◽

Policy Iteration ◽

Decision Processes ◽

Ergodic Average ◽

Linear Programming Methods ◽

Markov Decision

We present two sufficient conditions for detection of optimal and non-optimal actions in (ergodic) average-cost MDPs. They are easily interpreted and can be implemented as detection tests in both policy iteration and linear programming methods. An efficient implementation of a recent new policy iteration scheme is discussed.

Download Full-text

Policy iteration for parameterized Markov decision processes and its application

2013 9th Asian Control Conference (ASCC) ◽

10.1109/ascc.2013.6606023 ◽

2013 ◽

Cited By ~ 2

Author(s):

Li Xia ◽

Qing-Shan Jia

Keyword(s):

Markov Decision Processes ◽

Policy Iteration ◽

Decision Processes ◽

Markov Decision

Download Full-text

Approximate Policy Iteration for Markov Decision Processes via Quantitative Adaptive Aggregations

Automated Technology for Verification and Analysis - Lecture Notes in Computer Science ◽

10.1007/978-3-319-46520-3_2 ◽

2016 ◽

pp. 13-31 ◽

Cited By ~ 2

Author(s):

Alessandro Abate ◽

Milan Češka ◽

Marta Kwiatkowska

Keyword(s):

Markov Decision Processes ◽

Policy Iteration ◽

Decision Processes ◽

Markov Decision ◽

Approximate Policy Iteration

Download Full-text

Accelerating Procedures of the Value Iteration Algorithm for Discounted Markov Decision Processes, Based on a One-Step Lookahead Analysis

Operations Research ◽

10.1287/opre.42.5.940 ◽

1994 ◽

Vol 42 (5) ◽

pp. 940-946 ◽

Cited By ~ 10

Author(s):

Meir Herzberg ◽

Uri Yechiali

Keyword(s):

Markov Decision Processes ◽

Decision Processes ◽

Iteration Algorithm ◽

Value Iteration ◽

Markov Decision ◽

One Step ◽

Value Iteration Algorithm

Download Full-text

Policy iteration for robust nonstationary Markov decision processes

Optimization Letters ◽

10.1007/s11590-016-1040-6 ◽

2016 ◽

Vol 10 (8) ◽

pp. 1613-1628 ◽

Cited By ~ 3

Author(s):

Saumya Sinha ◽

Archis Ghate

Keyword(s):

Markov Decision Processes ◽

Policy Iteration ◽

Decision Processes ◽

Markov Decision

Download Full-text

The complexity of Policy Iteration is exponential for discounted Markov Decision Processes

2012 IEEE 51st IEEE Conference on Decision and Control (CDC) ◽

10.1109/cdc.2012.6426485 ◽

2012 ◽

Cited By ~ 7

Author(s):

Romain Hollanders ◽

Jean-Charles Delvenne ◽

Raphael M. Jungers

Keyword(s):

Markov Decision Processes ◽

Policy Iteration ◽

Decision Processes ◽

Markov Decision

Download Full-text

Average optimality for continuous-time Markov decision processes with a policy iteration approach

Journal of Mathematical Analysis and Applications ◽

10.1016/j.jmaa.2007.06.071 ◽

2008 ◽

Vol 339 (1) ◽

pp. 691-704 ◽

Cited By ~ 23

Author(s):

Quanxin Zhu

Keyword(s):

Markov Decision Processes ◽

Continuous Time ◽

Policy Iteration ◽

Decision Processes ◽

Markov Decision

Download Full-text

Computational comparison of policy iteration algorithms for discounted markov decision processes

Computers & Operations Research ◽

10.1016/0305-0548(86)90028-6 ◽

1986 ◽

Vol 13 (4) ◽

pp. 411-420 ◽

Cited By ~ 1

Author(s):

R. Hartley ◽

A.C. Lavercombe ◽

L.C. Thomas

Keyword(s):

Markov Decision Processes ◽

Policy Iteration ◽

Decision Processes ◽

Markov Decision ◽

Computational Comparison

Download Full-text