25 juin 2003
Artelys participe à la conférence
CAp 2003
Artelys participe à la conférence
d'apprentissage (CAp 2003) qui se tiendra à Laval
du 1er au 4 juillet 2003.
Application de l'apprentissage par renforcement à la
gestion du risque
René Aïd (EDF R&D)
Vincent Grellier (EDF R&D)
Arnaud Renaud (Artelys)
Olivier Teytaud (Artelys)
Résumé :
La programmation dynamique stochastique est un principe de
décomposition classique pour l'optimisation dynamique.
Elle permet l'optimisation de tout critère séparable.
En particulier, l'espérance est un critère séparable.
Par contre, la prise en compte du risque par une mesure de
type Value-At-Risk rend le problème non-séparable;
le traitement par programmation dynamique stochastique standard
est impossible.
Cet article présente une application de techniques
d'apprentissage par renforcement compatibles avec un critère
non-séparable. La mise en oeuvre pratique est faite
dans le cadre de la production électrique par le parc
de production thermo-hydraulique d'EdF. Les courbes de Value-At-Risk
obtenues montrent le succès de l'approche : augmenter
le paramètre "a" du critère "(1-a)
E + a VaR" conduit à des risques plus faibles.
Téléchargement
de l'article.
Retour |