Les Représentations Prédictives des États et des Politiques
2007
Conference Paper
ei
Nous proposons dans cet article une nouvelle approche pour représenter les politiques (stratégies) dans les environnements stochastiques et partiellement observables. Nous nous intéressons plus particulièrement aux systèmes multi-agents, où chaque agent connaît uniquement ses propres politiques, et doit choisir la meilleure parmi elles selon son état de croyance sur les politiques du reste des agents. Notre modèle utilise moins de paramètres que les méthodes de représentation usuelles, telles que les arbres de décision ou les contrôleurs détats finis stochastiques, permettant ainsi une accélération des algorithmes de planification. Nous montrons aussi comment ce modèle peut être utilisé efficacement dans le cas de la planification multiagents coopérative et sans communication, les résultats empiriques sont comparés avec le modèle DEC-POMDP (Decentralized Partially Observable Markov Decision Process).
Author(s): | Boularias, A. and Chaib-Draa, B. |
Book Title: | MFI 2007 |
Journal: | Actes des Quatrièmes Journées Francophones Modèles Formels de l‘Interaction (MFI 2007) |
Pages: | 37-48 |
Year: | 2007 |
Month: | June |
Day: | 0 |
Department(s): | Empirische Inferenz |
Bibtex Type: | Conference Paper (inproceedings) |
Event Name: | Quatrièmes Journées Francophones Modèles Formels de l‘Interaction |
Event Place: | Paris, France |
Digital: | 0 |
Language: | en |
Organization: | Max-Planck-Gesellschaft |
School: | Biologische Kybernetik |
Links: |
PDF
Web |
BibTex @inproceedings{6837, title = {Les Représentations Prédictives des États et des Politiques}, author = {Boularias, A. and Chaib-Draa, B.}, journal = {Actes des Quatrièmes Journées Francophones Modèles Formels de l‘Interaction (MFI 2007)}, booktitle = {MFI 2007}, pages = {37-48}, organization = {Max-Planck-Gesellschaft}, school = {Biologische Kybernetik}, month = jun, year = {2007}, doi = {}, month_numeric = {6} } |