您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版) ›› 2010, Vol. 40 ›› Issue (6): 8-11.

• 机器学习与数据挖掘 • 上一篇    下一篇

基于进化算法的多智能体合作学习

王云,王俊,韩伟*   

  1. 南京财经大学信息工程学院, 江苏  南京 210046
  • 收稿日期:2010-02-27 出版日期:2010-12-16 发布日期:2010-02-27
  • 通讯作者: 韩伟(1975-),男,山东济南人,博士,硕士研究生导师,副教授,主要研究方向为多智能体系统.E-mail: dallashw@gamil.com E-mail:dallashw@gamil.com
  • 作者简介:王云(1975-),女,山东临沂人,讲师,主要研究方向为多智能体系统.E-mail: njuewy@126.com
  • 基金资助:

    国家自然科学基金资助项目(70802025)

Multiagent cooperation learning based on an evolutional algorithm

WANG Yun, WANG Jun, HAN Wei*   

  1. School of Information Engineering, Nanjing University of Finance and Economics, Nanjing 210046, China
  • Received:2010-02-27 Online:2010-12-16 Published:2010-02-27

摘要:

强化学习的收敛速度随状态-动作空间的维数呈指数增长,因此在涉及大的状态空间时,强化学习算法的收敛速度非常慢以至不能满足应用需求。在许多应用环境中,若智能体之间存在合作关系,借助多个智能体进行分布式学习可以部分解决这一问题。利用进化算法,设计了智能体繁殖、消亡等操作,使得子代智能体能够继承父代智能体在状态空间的方向信息,从而更快地找到状态-动作空间的有效更新。仿真实验表明:算法比已有的强化学习方法具有更高的搜索效率和收敛速度。

关键词: 多智能体系统, 合作学习, 进化算法

Abstract:

Reinforcement learning is  not applicable concerning large state-actions, since that its convergence speed increases exponentially with the number of dimensions of state-action space. In many situations, this problem partially can be solved  by utilizing a cooperation relationship among agents. An evolutional algorithm was put forward, which could rapidly find the effective updating of state-action pairs by the evolutionary operators such as reproduction as well as die out. Simulations proved that the algorithm performs was better than present multiagent cooperation learning algorithms.

Key words:  multiagent system, cooperation learning, evolutionary algorithm

[1] 张双圣,强静,刘喜坤,刘汉湖,朱雪强. 基于贝叶斯-微分进化算法的污染源识别反问题[J]. 山东大学学报(工学版), 2018, 48(1): 131-136.
[2] 武炎明,王瑞云,王占山. 基于中间变量观测器的多智能体故障检测[J]. 山东大学学报(工学版), 2017, 47(5): 96-102.
[3] 崔阳,张柯,姜斌. 具有切换拓扑结构的多智能体系统故障估计[J]. 山东大学学报(工学版), 2017, 47(5): 263-270.
[4] 杨隆浩, 傅仰耿, 巩晓婷. 置信规则库参数学习的并行差分进化算法[J]. 山东大学学报(工学版), 2015, 45(1): 30-36.
[5] 严宣辉,曾庆盛*,舒才良. 融合免疫机制的协同进化模型[J]. 山东大学学报(工学版), 2012, 42(1): 34-44.
[6] 刘淳安. 基于核分布估计的动态多目标优化进化算法[J]. 山东大学学报(工学版), 2011, 41(1): 167-172.
[7] 刘建华1,2, 黄添强2, 严晓明2. 融合PSO算法思想的进化算法[J]. 山东大学学报(工学版), 2010, 40(5): 34-40.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!