Résumé:
Ce mémoire est inclus dans l’étude des processus stochastique, et plus précisément des
processus de décision semi markovien (semi- makovian decison process SMDP), issu de la
théorie de la décision et de la probabilité.
Parmi les méthode utilisées pour la recherche de politique optimale, nous avons cité deux
algorithmes « value iteration » et «policy iteration » .
Pour résoudre le problème « contrôle optimal d’un système de service stochastique », nous
avons réussi à programmer « value iteration » que nous avons adapté à notre problème.
Malheureusement, le deuxième algorithme « policy iteration » semble plus difficile à
appliquer pour résoudre ce type de problème.
This memory is included in the study of stochastic processes, and more specifically semimarkovian
decision-making
processes
(semi-makovian
decison
process
SMDP),
derived
from
the
theory
of
decision
and
probability.
Among the methods used for optimal policy research, we cited two algorithms "value
iteration" and "policy iteration"
In order to solve the problem of "optimal control of a stochastic service system", we were
able to program "value iteration" which we adapted to our problem.
Unfortunately, the second "policy iteration" algorithm seems more difficult to apply to solve
this type of problem.