山东大学学报(工学版) ›› 2010, Vol. 40 ›› Issue (4): 1-7.
• 机器学习与数据挖掘 • 下一篇
沈晶,刘海波,张汝波,吴艳霞,程晓北
SHEN Jing, LIU Hai-bo, ZHANG Ru-bo, WU Yan-xia, CHENG Xiao-bei
摘要:
在多智能体分层强化学习研究成果的基础上,考虑多机器人系统经常面临的通信困难问题(如水下环境),提出一种基于半马尔可夫对策的多机器人分层强化学习方法,通过引入对策论方法解决通信困难情况下多机器人学习问题。仿真实验结果表明了该方法的有效性。
[1] | 吴 皓,田国会,黄 彬 . 未知环境探测的多机器人协作策略研究[J]. 山东大学学报(工学版), 2008, 38(4): 27-31 . |
|