您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版) ›› 2010, Vol. 40 ›› Issue (6): 8-11.

• 机器学习与数据挖掘 • 上一篇    下一篇

基于进化算法的多智能体合作学习

王云,王俊,韩伟*   

  1. 南京财经大学信息工程学院, 江苏  南京 210046
  • 收稿日期:2010-02-27 出版日期:2010-12-16 发布日期:2010-02-27
  • 通讯作者: 韩伟(1975-),男,山东济南人,博士,硕士研究生导师,副教授,主要研究方向为多智能体系统.E-mail: dallashw@gamil.com E-mail:dallashw@gamil.com
  • 作者简介:王云(1975-),女,山东临沂人,讲师,主要研究方向为多智能体系统.E-mail: njuewy@126.com
  • 基金资助:

    国家自然科学基金资助项目(70802025)

Multiagent cooperation learning based on an evolutional algorithm

WANG Yun, WANG Jun, HAN Wei*   

  1. School of Information Engineering, Nanjing University of Finance and Economics, Nanjing 210046, China
  • Received:2010-02-27 Online:2010-12-16 Published:2010-02-27

摘要:

强化学习的收敛速度随状态-动作空间的维数呈指数增长,因此在涉及大的状态空间时,强化学习算法的收敛速度非常慢以至不能满足应用需求。在许多应用环境中,若智能体之间存在合作关系,借助多个智能体进行分布式学习可以部分解决这一问题。利用进化算法,设计了智能体繁殖、消亡等操作,使得子代智能体能够继承父代智能体在状态空间的方向信息,从而更快地找到状态-动作空间的有效更新。仿真实验表明:算法比已有的强化学习方法具有更高的搜索效率和收敛速度。

关键词: 多智能体系统, 合作学习, 进化算法

Abstract:

Reinforcement learning is  not applicable concerning large state-actions, since that its convergence speed increases exponentially with the number of dimensions of state-action space. In many situations, this problem partially can be solved  by utilizing a cooperation relationship among agents. An evolutional algorithm was put forward, which could rapidly find the effective updating of state-action pairs by the evolutionary operators such as reproduction as well as die out. Simulations proved that the algorithm performs was better than present multiagent cooperation learning algorithms.

Key words:  multiagent system, cooperation learning, evolutionary algorithm

[1] 常新功,苏敏惠,周志刚. 基于进化集成的图神经网络解释方法[J]. 山东大学学报 (工学版), 2024, 54(4): 1-12.
[2] 赵云龙, 车仁飞, 陈家辉. 基于差分进化算法的配电网智能换相策略[J]. 山东大学学报 (工学版), 2021, 51(5): 107-113.
[3] 张双圣,强静,刘喜坤,刘汉湖,朱雪强. 基于贝叶斯-微分进化算法的污染源识别反问题[J]. 山东大学学报(工学版), 2018, 48(1): 131-136.
[4] 崔阳,张柯,姜斌. 具有切换拓扑结构的多智能体系统故障估计[J]. 山东大学学报(工学版), 2017, 47(5): 263-270.
[5] 武炎明,王瑞云,王占山. 基于中间变量观测器的多智能体故障检测[J]. 山东大学学报(工学版), 2017, 47(5): 96-102.
[6] 杨隆浩, 傅仰耿, 巩晓婷. 置信规则库参数学习的并行差分进化算法[J]. 山东大学学报(工学版), 2015, 45(1): 30-36.
[7] 严宣辉,曾庆盛*,舒才良. 融合免疫机制的协同进化模型[J]. 山东大学学报(工学版), 2012, 42(1): 34-44.
[8] 刘淳安. 基于核分布估计的动态多目标优化进化算法[J]. 山东大学学报(工学版), 2011, 41(1): 167-172.
[9] 刘建华1,2, 黄添强2, 严晓明2. 融合PSO算法思想的进化算法[J]. 山东大学学报(工学版), 2010, 40(5): 34-40.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 王素玉,艾兴,赵军,李作丽,刘增文 . 高速立铣3Cr2Mo模具钢切削力建模及预测[J]. 山东大学学报(工学版), 2006, 36(1): 1 -5 .
[2] 张永花,王安玲,刘福平 . 低频非均匀电磁波在导电界面的反射相角[J]. 山东大学学报(工学版), 2006, 36(2): 22 -25 .
[3] 李 侃 . 嵌入式相贯线焊接控制系统开发与实现[J]. 山东大学学报(工学版), 2008, 38(4): 37 -41 .
[4] 孔祥臻,刘延俊,王勇,赵秀华 . 气动比例阀的死区补偿与仿真[J]. 山东大学学报(工学版), 2006, 36(1): 99 -102 .
[5] 来翔 . 用胞映射方法讨论一类MKdV方程[J]. 山东大学学报(工学版), 2006, 36(1): 87 -92 .
[6] 余嘉元1 , 田金亭1 , 朱强忠2 . 计算智能在心理学中的应用[J]. 山东大学学报(工学版), 2009, 39(1): 1 -5 .
[7] 陈瑞,李红伟,田靖. 磁极数对径向磁轴承承载力的影响[J]. 山东大学学报(工学版), 2018, 48(2): 81 -85 .
[8] 王波,王宁生 . 机电装配体拆卸序列的自动生成及组合优化[J]. 山东大学学报(工学版), 2006, 36(2): 52 -57 .
[9] 李可,刘常春,李同磊 . 一种改进的最大互信息医学图像配准算法[J]. 山东大学学报(工学版), 2006, 36(2): 107 -110 .
[10] 季涛,高旭,孙同景,薛永端,徐丙垠 . 铁路10 kV自闭/贯通线路故障行波特征分析[J]. 山东大学学报(工学版), 2006, 36(2): 111 -116 .