您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报 (工学版) ›› 2019, Vol. 49 ›› Issue (6): 1-10.doi: 10.6040/j.issn.1672-3961.0.2019.312

• 编委约稿 •    下一篇

胶囊网络模型综述

杨巨成(),韩书杰,毛磊,代翔子,陈亚瑞   

  1. 天津科技大学人工智能学院,天津 300457
  • 收稿日期:2019-06-13 出版日期:2019-12-20 发布日期:2019-12-17
  • 作者简介:杨巨成(1980—),男,湖北天门人,教授,博士,博士生导师,主要研究方向为人工智能和图像处理. E-mail: jcyang@tust.edu.cn
    杨巨成:博士,教授,博士生导师。天津市特聘教授、天津科技大学“海河学者”特聘教授,天津市“131”创新型人才培养工程第一层次人选,天津市“高校学科骨干创新人才”,天津市五一劳动奖章获得者,天津市创新人才推进计划“青年科技优秀人才”,“计算机科学与技术”学科带头人,校“智能计算与生物识别技术”青年学术团队负责人,教育部博士点基金评审专家,中国博士后工作站评审专家,国家自然科学基金委通讯评审专家。主要从事人工智能、图像处理、机器学习、人脸识别、静脉识别等方面的研究工作。在IEEE Trans. on HMS、Expert Systems With Applications等国际权威期刊以及ICPR等国际顶级会议上发表110余篇论文,其中被SCIEI收录论文80余篇;与欧美学者合著出版Biometrics系列论著6部(章节总下载量突破22万余次),论著章节4篇,教材3部

Review of capsule network

Jucheng YANG(),Shujie HAN,Lei MAO,Xiangzi DAI,Yarui CHEN   

  1. College of Artificial Intelligence, Tianjin University of Science and Technology, Tianjin 300457, China
  • Received:2019-06-13 Online:2019-12-20 Published:2019-12-17

摘要:

基于动态路由规则的胶囊网络模型是近年来新提出的神经网络模型,被认为可能成为下一代重要的神经网络模型。近年来,众多研究表明胶囊网络具备更好地拟合特征的能力,但是由于计算开销巨大,网络模型始终无法适应大数据集的要求。减少计算开销成为了胶囊网络的研究热点。减少胶囊网络的计算开销通常有两种方式,即优化胶囊法和优化路由法。优化胶囊法通常以应用目的为驱动,设计专门针对某种分类任务的网络模型;优化路由法则更具一般性,从算法角度提升胶囊网络的性能。

关键词: 胶囊网络, 神经网络, 动态路由, 优化胶囊, 优化路由

Abstract:

Recently capsule network with dynamic routing was the new neural network model which was considered a significant model in next generation. In recent years, much research evidenced capsule network exceptional ability to fit features. But the high computational overhead made it unable to fit complex and large datasets. Consequently, reducing computational became a research hotspot. There were two methods, including optimized capsule and optimized routing, to solve the issue. Optimized capsule was usually driven by application purpose which was designed as a model of specific classification tasks. And optimized routing was the way to improve the performance of the model from an algorithmic perspective.

Key words: capsule network, neural network, dynamic routing, optimized capsule, optimized routing

中图分类号: 

  • TP301.6

图1

向量胶囊网络结构"

图2

矩阵胶囊网络结构"

图3

输入特征于胶囊子空间的正交分量"

图4

DCNet++网络结构"

图5

PathCapsNet网络结构"

图6

HitNet网络结构"

表1

两种胶囊网络比较"

模型 胶囊类型 路由方法 鲁棒性 参数数量 改良方法 应用
向量胶囊网络 向量 非线性函数 较少 多与卷积神经网络结合改进网络结构 多用于简单数据集
矩阵胶囊网络 矩阵 EM算法 较多 多改进路由算法 可用于复杂数据集

表2

优化方法比较"

优化方法 优化模型 优化对象 模型类型
更高特征 DCNet++[11] 胶囊 向量胶囊网络
PathCapsNet[12] 胶囊 向量胶囊网络
更精胶囊 HitNet[13] 胶囊 向量胶囊网络
CapProNet[10] 胶囊 向量胶囊网络
更少数量 SPARSECAPS[17] 胶囊 向量胶囊网络
SCNet[14] 胶囊 矩阵胶囊网络
VideoCapsuleNet[15] 胶囊 矩阵胶囊网络
S-Capsules[16] 胶囊 矩阵胶囊网络
加速路由 ICRP协议[18] 路由 向量胶囊网络
改变方法 转化为最优化问题[19] 路由 向量胶囊网络
利用KDE方法[20] 路由 矩阵胶囊网络
1 HINTON G E, KRIZHEVSKY A, WANG S D. Transforming auto-encoders[C]//International Conference on Artificial Neural Networks. Berlin, Germany: Springer, 2011: 44-51.
2 SABOUR S, FROSST N, HINTON G E. Dynamic routing between capsules[C]//Neural Information Processing Systems. California, USA: NIPS Proceeding, 2017: 3856-3866.
3 HINTON G E, SABOUR S, FROSST N. Matrix capsules with EM routing[EB/OL].(2018-04)[2019-06-13]. https://openreview.net/pdf?id=HJWLfGWRb.
4 ZHANG L, EDRAKI M, QI G J. CapProNet: deep feature learning via orthogonal projections onto capsule subspaces[C]//Neural Information Processing Systems. Montréal, Canada: NIPS Proceeding, 2018: 5814-5823.
5 PHAYE S S R, SIKKA A, DHALL A, et al. Dense and diverse capsule networks: making the capsules learn better[EB/OL].(2018-05)[2019-06-13]. https://arxiv.org/pdf/1805.04001.pdf.
6 SHAHROUDNEJAD A, AFSHAR P, PLATANIOTIS K N, et al. Improved explainability of capsule networks: Relevance path by agreement[C]//2018 IEEE Global Conference on Signal and Information Processing. California, USA: IEEE, 2018: 549-553.
7 DELIÈKGE A, CIOPPA A, VAN DROOGENBROECK M. HitNet: a neural network with capsules embedded in a Hit-or-Miss layer, extended with hybrid data augmentation and ghost capsules[EB/OL].(2018-06)[2019-06-13]. https://arxiv.org/pdf/1806.06519.pdf.
8 NEILL J O. Siamese capsule networks[EB/OL].(2018-05)[2019-06-13]. https://arxiv.org/pdf/1805.07242.pdf.
9 DUARTE K, RAWAT Y, SHAH M. Videocapsulenet: a simplified network for action detection[C]//Neural Information Processing Systems. Montréal, Canada: NIPS Proceeding, 2018: 7610-7619.
10 BAHADORI M T. Spectral capsule networks[EB/OL].(2018-02)[2019-06-13]. https://openreview.net/pdf?id=HJuMvYPaM.
11 RAWLINSON D, AHMED A, KOWADLO G. Sparse unsupervised capsules generalize better[EB/OL].(2018-04)[2019-06-13]. https://arxiv.org/pdf/1804.06094.pdf.
12 SAHU S K, KUMAR P, SINGH A P. Dynamic routing using inter capsule routing protocol between capsules[C]//2018 UKSim-AMSS 20th International Conference on Computer Modelling and Simulation. Cambridge, UK: IEEE, 2018: 1-5.
13 WANG D, LIU Q. An optimization view on dynamic routing between capsules[EB/OL].(2018-02)[2019-06-13]. https://openreview.net/pdf?id=HJjtFYJDf.
14 ZHANG S, ZHOU Q, WU X. Fast dynamic routing based on weighted kernel density estimation[C]//International Symposium on Artificial Intelligence and Robotics. Nanjing, China: Springer, 2018: 301-309.
15 MOBINY A, VAN NGUYEN H.Fast capsnet for lung cancer screening[C]//International Conference on Medical Image Computing and Computer-Assisted Intervention. Granada, Spain: Springer, 2018: 741-749.
16 KIM Y, WANG P, ZHU Y, et al. A capsule network for traffic speed prediction in complex road networks[C]//2018 Sensor Data Fusion: Trends, Solutions, Applications. Nordrhein-Westfalen, Germany: IEEE, 2018: 1-6.
17 JIMÉINEZ-SÁBNCHEZ A, ALBARQOUNI S, MATEUS D. Capsule networks against medical imaging data challenges[EB/OL]. (2018-07)[2019-06-13]. https://arxiv.org/pdf/1807.07559.pdf.
18 KRIZHEVSKY A, SUTSKEVER I, HINTON G E. Imagenet classification with deep convolutional neural networks[C]// Neural Information Processing Systems. Lake Tahoe, USA: NIPS Proceeding, 2012: 1097-1105.
19 NGUYEN D Q, VU T, NGUYEN T D, et al. A capsule network-based embedding model for knowledge graph completion and search personalization [EB/OL].(2018-04)[2019-06-13]. https://arxiv.org/pdf/1808.04122.pdf.
20 AFSHAR P, MOHAMMADI A, PLATANIOTIS K N. Brain tumor type classification via capsule networks[C]//2018 25th IEEE International Conference on Image Processing. Athens, Greece: IEEE, 2018: 3129-3133.
21 DE JESUS D R, CUEVAS J, RIVERA W, et al. Capsule networks for protein structure classification and prediction[EB/OL].(2018-08)[2019-06-13]. https://arxiv.org/pdf/1808.07475.pdf.
22 DENG F , PU S , CHEN X , et al. Hyperspectral image classification with capsule network using limited training samples[J]. Sensors, 2018, 18 (9): 3153.
doi: 10.3390/s18093153
23 UPADHYAY Y, SCHRATER P. Generative adversarial network architectures for image synthesis using capsule networks[EB/OL].(2018-06)[2019-06-13]. https://arxiv.org/pdf/1806.03796.pdf.
24 JAISWAL A, ABDALMAGEED W, WU Y, et al. Capsulegan: generative adversarial capsule network[C]//European Conference on Computer Vision. Munich, Germany: Springer, 2018: 526-535.
25 ZHAO W, YE J, YANG M, et al. Investigating capsule networks with dynamic routing for text classification[EB/OL].(2018-05)[2019-06-13]. https://arxiv.org/pdf/1804.00538.pdf.
[1] 马川,刘彦呈,刘厶源,张勤进. 考虑未知死区非线性的自适应模糊神经UUV航迹跟踪控制[J]. 山东大学学报 (工学版), 2019, 49(3): 47-56.
[2] 郑店坤,许同乐,尹召杰,孟庆民. 改进PSO-BP神经网络对尾矿坝地下水位的预测方法[J]. 山东大学学报 (工学版), 2019, 49(3): 108-113.
[3] 何奕江,杜军平,寇菲菲,梁美玉,王巍,罗盎. 基于深度卷积神经网络的图像自编码算法[J]. 山东大学学报 (工学版), 2019, 49(2): 61-66.
[4] 侯霄雄,许新征,朱炯,郭燕燕. 基于AlexNet和集成分类器的乳腺癌计算机辅助诊断方法[J]. 山东大学学报 (工学版), 2019, 49(2): 74-79.
[5] 郭芳,陈蕾,杨子文. 基于MGU的大规模IP骨干网络实时流量预测[J]. 山东大学学报 (工学版), 2019, 49(2): 88-95.
[6] 杨亚楠,夏斌,谢楠,袁文浩. 基于BP神经网络和多元Taylor级数的混合定位算法[J]. 山东大学学报 (工学版), 2019, 49(1): 36-40.
[7] 权稳稳,林明星. CNN特征与BOF相融合的水下目标识别算法[J]. 山东大学学报 (工学版), 2019, 49(1): 107-113.
[8] 刘振丙,方旭升,杨辉华,蓝如师. 基于多尺度残差神经网络的阿尔茨海默病诊断分类[J]. 山东大学学报 (工学版), 2018, 48(6): 1-7, 18.
[9] 宋琦悦,穆学文,程欢. 改进滴水算法的黏连字符分割方法[J]. 山东大学学报 (工学版), 2018, 48(6): 89-94, 108.
[10] 沈冬冬,周风余,栗梦媛,王淑倩,郭仁和. 基于集成深度神经网络的室内无线定位[J]. 山东大学学报 (工学版), 2018, 48(5): 95-102.
[11] 张璞,刘畅,王永. 基于特征融合和集成学习的建议语句分类模型[J]. 山东大学学报 (工学版), 2018, 48(5): 47-54.
[12] 梁蒙蒙,周涛,夏勇,张飞飞,杨健. 基于PSO-ConvK卷积神经网络的肺部肿瘤图像识别[J]. 山东大学学报 (工学版), 2018, 48(5): 77-84.
[13] 张宪红,张春蕊. 基于六维前馈神经网络模型的图像增强算法[J]. 山东大学学报(工学版), 2018, 48(4): 10-19.
[14] 赵彦霞, 王熙照. 基于SVD和DCNN的彩色图像多功能零水印算法[J]. 山东大学学报(工学版), 2018, 48(3): 25-33.
[15] 曹雅,邓赵红,王士同. 基于单调约束的径向基函数神经网络模型[J]. 山东大学学报(工学版), 2018, 48(3): 127-133.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] Yue Khing Toh1 , XIAO Wendong2 , XIE Lihua1 . 基于无线传感器网络的分散目标跟踪:实际测试平台的开发应用(英文)[J]. 山东大学学报(工学版), 2009, 39(1): 50 -56 .
[2] 徐丽丽,季忠,夏继梅 . 同规格货物装箱问题的优化计算[J]. 山东大学学报(工学版), 2008, 38(3): 14 -17 .
[3] 潘多涛,刘桂萍,刘长风 . 生物絮凝剂产生菌的筛选及培养条件优化[J]. 山东大学学报(工学版), 2008, 38(3): 99 -103 .
[4] 张恭孝,杨荣华 . 水杨醛缩甲基氨基硫脲Schiff碱配合物的合成与表征[J]. 山东大学学报(工学版), 2008, 38(3): 108 -111 .
[5] 徐晓丹, 段正杰, 陈中育. 基于扩展情感词典及特征加权的情感挖掘方法[J]. 山东大学学报(工学版), 2014, 44(6): 15 -18 .
[6] 孙向勇 . 不含四圈,三圈不重点的平面图全染色的一个结论[J]. 山东大学学报(工学版), 2007, 37(3): 118 -121 .
[7] 李利平,李术才,徐帮树,丁万涛,蔚立元 . 海底隧道施工设计及其数值优化研究[J]. 山东大学学报(工学版), 2008, 38(4): 63 -68 .
[8] 高宇 杜爱玲 杨艳玲. 磷化液中ZnO对AZ61镁合金磷化膜的影响[J]. 山东大学学报(工学版), 2009, 39(3): 77 -80 .
[9] 高明 史月涛 王妮妮 孙奉仲 平亚明. 侧风环境下自然通风湿式冷却塔周向进风变化规律[J]. 山东大学学报(工学版), 2009, 39(3): 154 -158 .
[10] 李春晓 岳钦艳 卢磊 高宝玉 杨忠莲 司晓慧 倪寿清 王元芳. 疏水缔合阳离子聚丙烯酰胺的合成与应用[J]. 山东大学学报(工学版), 2008, 38(6): 99 -104 .