Multiagent Trust Region Policy Optimization-MedSci.cn - 梅斯（MedSci）

Multiagent Trust Region Policy Optimization

Li, HP; He, HB

He, HB (通讯作者)，Univ Rhode Isl, Dept Elect Comp & Biomed Engn, Kingston, RI 02881 USA.

IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2023; ():

Abstract

We extend trust region policy optimization (TRPO) to cooperative multiagent reinforcement learning (MARL) for partially observable Markov games (POMGs......

Full Text Link

Links

期刊讨论 | 中国SCI论文 | 期刊主页 | 投稿经验 | 杂志官网 | 投稿链接 | 作者需知 | PMC链接 | Pubmed全文检索

科室
- - 订阅+
  - 更多科室
工具
服务