Research status and development trend of autonomous cognition and learning of robot manipulation skills

Wei WANG1(),Feng WU2,Fengyu ZHOU3,*()   

  1. 1. School of Computer Science and Technology, Qilu University of Technology, Jinan 250353, Shandong, China
    2. School of Computer Science and Technology, University of Science and Technology of China, Hefei 230026, Anhui, China
    3. School of Control and Engineering, Shandong University, Jinan 250061, Shandong, China
Autonomous cognition and learning of manipulation skills, being one of the most important skills for robots, has been one of the hot issues in the field of robotics research. Combining with the authors' work in the field of robotics, this paper's focus is placed on giving a comprehensive overview of the mainstream modes, methods, algorithms, as well as advantages and disadvantages of different methods in terms of robots' manipulation skill learning. It concludes the challenges faced by autonomous learning and the key issues that need to be addressed for the individual cloud robots learning manipulation skills in the knowledge sharing mode. At the end, a potential solution for the above issues is given, and that is to integrate individual learning mode and shared learning model for the purpose of enhancing autonomous cognition and learning ability for robots.

Key words: cloud robot, knowledge-sharing robot, manipulation skills, autonomous learning, autonomous cognition

Table 1

Some examples of the representation of robot manipulation skills"

代表项目 年代 国家 技能表示形式 学习方式 基本技能单元 技能单元性质 是否渐进式发展 跨机器人平台 跨工作种类 跨工作环境
Task Transfer 2007 美国 数值表示 发展式学习 数值 离散
Jean 2009 美国 符号表示 发展式学习 模板 离散
QLAP 2009 美国 定性表示 发展式学习 技能选项 离散
RoboEarth 2010 欧盟 符号表示 一次性获取 本体与语义描述 连续
CST 2013 美国 符号表示 从自身经验学习+发展式学习 技能抽象 连续

Table 2

Comparisons among representative projects on sharing manipulation skills and knowledge"

项目名称 年代 研究单位 国家(地区) 技能描述方法 技能自主发展
RoboEarth 2009 TUM 欧盟 本体、语义网络
RoboBrain 2013 加州伯克利分校 美国 常识维基百科
PR2叠毛巾 2015 康奈尔大学、斯坦福大学 美国 Twitter+深度神经网络
万物交流 2016 布朗大学 美国 ROS节点
Google Mind 2016 谷歌公司 美国 指令
C-LEARN 2017 麻省理工学院 美国 具有几何约束的规则数据库

Table 3

Comparisons of the main learning approaches for skill learning and development of robots"

技能学习方法 个体学习 社交学习 特点 主要挑战 主要技术
从演示中学习 支持 支持(非)面对面HRI、面对面的RRI 简单直接无需编程无需专家 缺少大量、高质量的演示数据 监督学习、强化学习、深度强化学习
发展式学习 支持 支持面对面HRI、RRI 模拟婴儿心智发育过程、渐进式技能增长 初始知识的数量和形式、可持续发展的主导程序设计、技能表示形式 强化学习、深度强化学习、DCO、DDCO
类脑学习 支持 不支持 模拟成人大脑、个案学习 视觉感知、与人沟通、大脑思考、自适应能力 基于CNN的深度学习、强化学习、基于生成模型的贝叶斯学习
共享知识学习 不支持 支持非面对面HRI、RRI 海量数据不受时空限制、一次性技能获取 数据的跨平台共享、共享数据的跨平台迁移学习 强化学习、深度强化学习、云计算


The combination of individual learning mode and knowledge-sharing learning mode(SRDL[20], CST's skill abstraction[27])"

Table 4

Four levels of the transfer learning of shared skills"

级别 工作 机器人平台 所需主要技术
第一级 已知 相同 自学迁移学习[53]
第二级 已知 不同 身体对应问题[4, 74]、自学迁移学习
第三级 未知 相同 多任务迁移学习[53]、身体对应问题
第四级 未知 不同 多任务迁移学习、身体对应问题、知识空白填补[75]


The architecture of Fog Robotics[80]"

[1] TIAN Guohui, XU Yaxiong. Cloud robotics: concept, architectures and key technologies [J]. JOURNAL OF SHANDONG UNIVERSITY (ENGINEERING SCIENCE), 2014, 44(6): 47-54.
