您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报 (工学版) ›› 2019, Vol. 49 ›› Issue (6): 1-10.doi: 10.6040/j.issn.1672-3961.0.2019.312

• 编委约稿 •    下一篇

胶囊网络模型综述

杨巨成(),韩书杰,毛磊,代翔子,陈亚瑞   

  1. 天津科技大学人工智能学院,天津 300457
  • 收稿日期:2019-06-13 出版日期:2019-12-20 发布日期:2019-12-17
  • 作者简介:杨巨成(1980—),男,湖北天门人,教授,博士,博士生导师,主要研究方向为人工智能和图像处理. E-mail: jcyang@tust.edu.cn
    杨巨成:博士,教授,博士生导师。天津市特聘教授、天津科技大学“海河学者”特聘教授,天津市“131”创新型人才培养工程第一层次人选,天津市“高校学科骨干创新人才”,天津市五一劳动奖章获得者,天津市创新人才推进计划“青年科技优秀人才”,“计算机科学与技术”学科带头人,校“智能计算与生物识别技术”青年学术团队负责人,教育部博士点基金评审专家,中国博士后工作站评审专家,国家自然科学基金委通讯评审专家。主要从事人工智能、图像处理、机器学习、人脸识别、静脉识别等方面的研究工作。在IEEE Trans. on HMS、Expert Systems With Applications等国际权威期刊以及ICPR等国际顶级会议上发表110余篇论文,其中被SCIEI收录论文80余篇;与欧美学者合著出版Biometrics系列论著6部(章节总下载量突破22万余次),论著章节4篇,教材3部

Review of capsule network

Jucheng YANG(),Shujie HAN,Lei MAO,Xiangzi DAI,Yarui CHEN   

  1. College of Artificial Intelligence, Tianjin University of Science and Technology, Tianjin 300457, China
  • Received:2019-06-13 Online:2019-12-20 Published:2019-12-17

摘要:

基于动态路由规则的胶囊网络模型是近年来新提出的神经网络模型,被认为可能成为下一代重要的神经网络模型。近年来,众多研究表明胶囊网络具备更好地拟合特征的能力,但是由于计算开销巨大,网络模型始终无法适应大数据集的要求。减少计算开销成为了胶囊网络的研究热点。减少胶囊网络的计算开销通常有两种方式,即优化胶囊法和优化路由法。优化胶囊法通常以应用目的为驱动,设计专门针对某种分类任务的网络模型;优化路由法则更具一般性,从算法角度提升胶囊网络的性能。

关键词: 胶囊网络, 神经网络, 动态路由, 优化胶囊, 优化路由

Abstract:

Recently capsule network with dynamic routing was the new neural network model which was considered a significant model in next generation. In recent years, much research evidenced capsule network exceptional ability to fit features. But the high computational overhead made it unable to fit complex and large datasets. Consequently, reducing computational became a research hotspot. There were two methods, including optimized capsule and optimized routing, to solve the issue. Optimized capsule was usually driven by application purpose which was designed as a model of specific classification tasks. And optimized routing was the way to improve the performance of the model from an algorithmic perspective.

Key words: capsule network, neural network, dynamic routing, optimized capsule, optimized routing

中图分类号: 

  • TP301.6

图1

向量胶囊网络结构"

图2

矩阵胶囊网络结构"

图3

输入特征于胶囊子空间的正交分量"

图4

DCNet++网络结构"

图5

PathCapsNet网络结构"

图6

HitNet网络结构"

表1

两种胶囊网络比较"

模型 胶囊类型 路由方法 鲁棒性 参数数量 改良方法 应用
向量胶囊网络 向量 非线性函数 较少 多与卷积神经网络结合改进网络结构 多用于简单数据集
矩阵胶囊网络 矩阵 EM算法 较多 多改进路由算法 可用于复杂数据集

表2

优化方法比较"

优化方法 优化模型 优化对象 模型类型
更高特征 DCNet++[11] 胶囊 向量胶囊网络
PathCapsNet[12] 胶囊 向量胶囊网络
更精胶囊 HitNet[13] 胶囊 向量胶囊网络
CapProNet[10] 胶囊 向量胶囊网络
更少数量 SPARSECAPS[17] 胶囊 向量胶囊网络
SCNet[14] 胶囊 矩阵胶囊网络
VideoCapsuleNet[15] 胶囊 矩阵胶囊网络
S-Capsules[16] 胶囊 矩阵胶囊网络
加速路由 ICRP协议[18] 路由 向量胶囊网络
改变方法 转化为最优化问题[19] 路由 向量胶囊网络
利用KDE方法[20] 路由 矩阵胶囊网络
1 HINTON G E, KRIZHEVSKY A, WANG S D. Transforming auto-encoders[C]//International Conference on Artificial Neural Networks. Berlin, Germany: Springer, 2011: 44-51.
2 SABOUR S, FROSST N, HINTON G E. Dynamic routing between capsules[C]//Neural Information Processing Systems. California, USA: NIPS Proceeding, 2017: 3856-3866.
3 HINTON G E, SABOUR S, FROSST N. Matrix capsules with EM routing[EB/OL].(2018-04)[2019-06-13]. https://openreview.net/pdf?id=HJWLfGWRb.
4 ZHANG L, EDRAKI M, QI G J. CapProNet: deep feature learning via orthogonal projections onto capsule subspaces[C]//Neural Information Processing Systems. Montréal, Canada: NIPS Proceeding, 2018: 5814-5823.
5 PHAYE S S R, SIKKA A, DHALL A, et al. Dense and diverse capsule networks: making the capsules learn better[EB/OL].(2018-05)[2019-06-13]. https://arxiv.org/pdf/1805.04001.pdf.
6 SHAHROUDNEJAD A, AFSHAR P, PLATANIOTIS K N, et al. Improved explainability of capsule networks: Relevance path by agreement[C]//2018 IEEE Global Conference on Signal and Information Processing. California, USA: IEEE, 2018: 549-553.
7 DELIÈKGE A, CIOPPA A, VAN DROOGENBROECK M. HitNet: a neural network with capsules embedded in a Hit-or-Miss layer, extended with hybrid data augmentation and ghost capsules[EB/OL].(2018-06)[2019-06-13]. https://arxiv.org/pdf/1806.06519.pdf.
8 NEILL J O. Siamese capsule networks[EB/OL].(2018-05)[2019-06-13]. https://arxiv.org/pdf/1805.07242.pdf.
9 DUARTE K, RAWAT Y, SHAH M. Videocapsulenet: a simplified network for action detection[C]//Neural Information Processing Systems. Montréal, Canada: NIPS Proceeding, 2018: 7610-7619.
10 BAHADORI M T. Spectral capsule networks[EB/OL].(2018-02)[2019-06-13]. https://openreview.net/pdf?id=HJuMvYPaM.
11 RAWLINSON D, AHMED A, KOWADLO G. Sparse unsupervised capsules generalize better[EB/OL].(2018-04)[2019-06-13]. https://arxiv.org/pdf/1804.06094.pdf.
12 SAHU S K, KUMAR P, SINGH A P. Dynamic routing using inter capsule routing protocol between capsules[C]//2018 UKSim-AMSS 20th International Conference on Computer Modelling and Simulation. Cambridge, UK: IEEE, 2018: 1-5.
13 WANG D, LIU Q. An optimization view on dynamic routing between capsules[EB/OL].(2018-02)[2019-06-13]. https://openreview.net/pdf?id=HJjtFYJDf.
14 ZHANG S, ZHOU Q, WU X. Fast dynamic routing based on weighted kernel density estimation[C]//International Symposium on Artificial Intelligence and Robotics. Nanjing, China: Springer, 2018: 301-309.
15 MOBINY A, VAN NGUYEN H.Fast capsnet for lung cancer screening[C]//International Conference on Medical Image Computing and Computer-Assisted Intervention. Granada, Spain: Springer, 2018: 741-749.
16 KIM Y, WANG P, ZHU Y, et al. A capsule network for traffic speed prediction in complex road networks[C]//2018 Sensor Data Fusion: Trends, Solutions, Applications. Nordrhein-Westfalen, Germany: IEEE, 2018: 1-6.
17 JIMÉINEZ-SÁBNCHEZ A, ALBARQOUNI S, MATEUS D. Capsule networks against medical imaging data challenges[EB/OL]. (2018-07)[2019-06-13]. https://arxiv.org/pdf/1807.07559.pdf.
18 KRIZHEVSKY A, SUTSKEVER I, HINTON G E. Imagenet classification with deep convolutional neural networks[C]// Neural Information Processing Systems. Lake Tahoe, USA: NIPS Proceeding, 2012: 1097-1105.
19 NGUYEN D Q, VU T, NGUYEN T D, et al. A capsule network-based embedding model for knowledge graph completion and search personalization [EB/OL].(2018-04)[2019-06-13]. https://arxiv.org/pdf/1808.04122.pdf.
20 AFSHAR P, MOHAMMADI A, PLATANIOTIS K N. Brain tumor type classification via capsule networks[C]//2018 25th IEEE International Conference on Image Processing. Athens, Greece: IEEE, 2018: 3129-3133.
21 DE JESUS D R, CUEVAS J, RIVERA W, et al. Capsule networks for protein structure classification and prediction[EB/OL].(2018-08)[2019-06-13]. https://arxiv.org/pdf/1808.07475.pdf.
22 DENG F , PU S , CHEN X , et al. Hyperspectral image classification with capsule network using limited training samples[J]. Sensors, 2018, 18 (9): 3153.
doi: 10.3390/s18093153
23 UPADHYAY Y, SCHRATER P. Generative adversarial network architectures for image synthesis using capsule networks[EB/OL].(2018-06)[2019-06-13]. https://arxiv.org/pdf/1806.03796.pdf.
24 JAISWAL A, ABDALMAGEED W, WU Y, et al. Capsulegan: generative adversarial capsule network[C]//European Conference on Computer Vision. Munich, Germany: Springer, 2018: 526-535.
25 ZHAO W, YE J, YANG M, et al. Investigating capsule networks with dynamic routing for text classification[EB/OL].(2018-05)[2019-06-13]. https://arxiv.org/pdf/1804.00538.pdf.
[1] 黄芳,王欣,高国海,沈玲珍,付勋,方宇. 融合主客观评价的图数据Top-k频繁模式挖掘[J]. 山东大学学报 (工学版), 2025, 55(6): 1-12.
[2] 邵孟伟,袁世飞,周宏志,王乃华. 基于BP神经网络和遗传算法的翅片管结构优化[J]. 山东大学学报 (工学版), 2025, 55(6): 76-82.
[3] 邓彬, 张宗包, 赵文猛, 罗新航, 吴秋伟. 基于云边协同和图神经网络的电动汽车充电站负荷预测方法[J]. 山东大学学报 (工学版), 2025, 55(5): 62-69.
[4] 董明书,陈俐企,马川义,张珠皓,孙仁娟,管延华,庄培芝. 沥青路面内部裂缝雷达图像智能判识算法研究[J]. 山东大学学报 (工学版), 2025, 55(3): 72-79.
[5] 贾轩,许吉凯,任艺婧,刘德才,许强,张利. 基于样本扩容和数据驱动的台区理论线损计算方法[J]. 山东大学学报 (工学版), 2025, 55(3): 158-164.
[6] 祝明,石承龙,吕潘,刘现荣,孙驰,陈建城,范宏运. 基于优化长短时记忆网络的深基坑变形预测方法及其工程应用[J]. 山东大学学报 (工学版), 2025, 55(3): 141-148.
[7] 李伟豪,王苹苹,许万博,魏本征. 结构先验引导的多模态腰椎MRI图像分割算法[J]. 山东大学学报 (工学版), 2025, 55(1): 66-76.
[8] 孙尚渠,张恭禄,蒋志斌,李朝阳. 盾构滚刀磨损的影响因素敏感性分析及预测[J]. 山东大学学报 (工学版), 2025, 55(1): 86-96.
[9] 林振宇,邵蓥侠. 基于盖根堡多项式最佳平方近似的谱图网络[J]. 山东大学学报 (工学版), 2024, 54(5): 93-100.
[10] 常新功,苏敏惠,周志刚. 基于进化集成的图神经网络解释方法[J]. 山东大学学报 (工学版), 2024, 54(4): 1-12.
[11] 马翔悦,徐金东,倪梦莹. 基于多尺度特征模糊卷积神经网络的遥感图像分割[J]. 山东大学学报 (工学版), 2024, 54(3): 44-54.
[12] 赵涛,张宁,王小超,马川义,田源,张圣涛,杨梓梁. 基于图神经网络轨迹预测的合流区交通冲突预测方法[J]. 山东大学学报 (工学版), 2024, 54(2): 36-46.
[13] 李璐,张志军,范钰敏,王星,袁卫华. 面向冷启动用户的元学习与图转移学习序列推荐[J]. 山东大学学报 (工学版), 2024, 54(2): 69-79.
[14] 范黎林,刘士豪,李源,毛文涛,陈宗涛. 基于课程正则化的物理信息神经网络渐进式训练策略[J]. 山东大学学报 (工学版), 2024, 54(1): 11-24.
[15] 孙园,曾惠权,欧阳苏建,高佳倩,王绮楠,林智勇. 基于粒子群算法的模糊大脑情感学习非线性系统辨识[J]. 山东大学学报 (工学版), 2024, 54(1): 25-32.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 关小军,韩振强,申孝民,麻晓飞,刘运腾 . 09CuPTiRE钢动态再结晶的热模拟实验与有限元模拟[J]. 山东大学学报(工学版), 2006, 36(5): 17 -20 .
[2] 梁京芸,王明刚,柴家前,刘永庆 . 1.6-二-(N5-取代苯基-N1-二胍)己烷盐酸盐的合成和体外抗菌活性[J]. 山东大学学报(工学版), 2008, 38(3): 104 -107 .
[3] 王伟,毛华永,李国祥,潘世艳,巩厅房,晋世强,郝胜兵 . 一种车用燃油加热器燃烧器的流场数值分析[J]. 山东大学学报(工学版), 2008, 38(3): 64 -68 .
[4] 陈朋 胡文容 裴海燕. 一株反硝化细菌LZ-14的筛选及其脱氮特性[J]. 山东大学学报(工学版), 2009, 39(5): 133 -138 .
[5] 李新平 代翼飞 胡静. 某岩溶隧道围岩稳定性及涌水量预测的流固耦合分析[J]. 山东大学学报(工学版), 2009, 39(4): 1 -6 .
[6] 张宁 李术才 李明田 杨磊. 新型岩石相似材料的研制[J]. 山东大学学报(工学版), 2009, 39(4): 149 -154 .
[7] 张宏博,苗海涛,宋修广. 长期交通荷载作用下粉砂土累积变形本构模型构建及数值积分格式[J]. 山东大学学报(工学版), 2010, 40(2): 59 -65 .
[8] 张辉 王孟夏 韩学山. 电力系统的超前热定值及其应用探讨[J]. 山东大学学报(工学版), 2008, 38(6): 25 -29 .
[9] 王恩东 . 箱梁桥桥面铺装受力特性研究[J]. 山东大学学报(工学版), 2008, 38(2): 71 -76 .
[10] 张承慧,裴荣辉,石庆升,马永庆 . 城市变频调速给水泵站的优化配置[J]. 山东大学学报(工学版), 2007, 37(2): 97 -102 .