Please wait a minute...
您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》
扫一扫,加关注

当期目录

    2019年 第49卷 第2期 刊出日期:2019-04-20
      
    机器学习与数据挖掘
    快速四点一致性点云粗配准算法
    刘世光,王海荣,刘锦
    2019, 49(2):  1-7.  doi:10.6040/j.issn.1672-3961.0.2018.244
    摘要 ( 2390 )   HTML ( 147 )   PDF (6934KB) ( 786 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    为了解决四点全等集合(4-points congruent sets, 4PCS)在两片点云重叠率较低的情况下算法耗时长且配准容易失败的问题,提出快速四点一致性集合(fast 4-points congruent sets, F-4PCS)解决点云配准问题。给出一种新的选择四点基的方法,给定源点云和目标点云,分别提取出它们的边界,将边界扩展为边界特征带,在边界特征带中选取具有一致性的四点基集合,从而避免一些不必要的迭代。通过对四点基的特征限制,去除无效的四点基,减少算法的验证时间,提高计算效率。在相关数据集上的试验表明,在点云重叠率较低等情况下F-4PCS方法比4PCS方法更加高效且配准成功率较高。

    基于极端梯度提升树算法的图像属性标注
    张红斌,邱蝶蝶,邬任重,朱涛,滑瑾,姬东鸿
    2019, 49(2):  8-16.  doi:10.6040/j.issn.1672-3961.0.2018.271
    摘要 ( 966 )   HTML ( 8 )   PDF (4657KB) ( 337 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    提出基于极端梯度提升树(eXtreme gradient boosting,XGBoost)算法的图像属性标注模型,以改善标注性能:提取图像局部二值模式(local binary patterns,LBP)、灰度纹理空间包络特征(Gist)、尺度不变特征变换(scale invariant feature transform,SIFT)、视觉几何组(visual geometry group,VGG)等特征,以准确刻画图像视觉内容;基于图像特征,采用XGBoost算法集成弱分类器为强分类器,完成图像属性标注;深入挖掘图像属性蕴含的深层语义,构建全新的、层次化的属性表示体系,以贴近人类客观认知;设计迁移学习策略并合理组合分类模型,进一步改善标注性能。试验表明:Gist特征能真实刻画图像视觉内容;执行基础迁移学习后,标注精准度比迁移学习前最优指标提升8.69%;执行混合型迁移学习后,合理组合分类模型,标注精准度比基础迁移学习的最优指标提升17.55%。模型有效地改善图像属性标注精度。

    基于深度学习的车身网络KWP2000协议漏洞挖掘
    张成彬,赵慧,曹宗钰
    2019, 49(2):  17-22.  doi:10.6040/j.issn.1672-3961.0.2018.340
    摘要 ( 1034 )   HTML ( 18 )   PDF (1273KB) ( 361 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    为实现无需协议的任何结构知识进行网络安全漏洞检测,基于深度学习生成对抗式神经网络(generative adversarial nets, GAN),提出对车身网络关键字协议2000 (keyword protocol 2000, KWP2000)漏洞挖掘的方法。选用前向反馈网络作为生成模型,支持向量机作为判别模型。利用神经网络模型训练生成KWP2000协议数据的测试用例数据,再利用这些测试用例数据对KWP2000进行模糊测试。通过试验发现目标协议KWP2000的超长错误、编码错误等漏洞。试验研究表明,该模糊测试方法提高了效率和安全性。

    自主驾驶的人机交互控制
    邹启杰,李昊宇,张汝波,裴腾达,刘艳
    2019, 49(2):  23-33.  doi:10.6040/j.issn.1672-3961.0.2017.503
    摘要 ( 1154 )   HTML ( 10 )   PDF (1268KB) ( 628 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    本研究对自主驾驶的人机交互中机器学习方法进行综述。通过介绍自主驾驶中人机交互研究的价值和意义,明确了人机交互问题定义以及与机器学习之间的关系,构建了自主驾驶中人机交互团队的架构。围绕提出的人机交互的系统架构和研究方法展开讨论,提出了人机交互问题解决的通用架构。并且,重点针对自主系统和驾驶员两部分介绍了相关机器学习算法,对自主驾驶中人机交互控制的未来研究进行展望,并对本研究进行总结。

    基于word2vec词模型的中文短文本分类方法
    高明霞,李经纬
    2019, 49(2):  34-41.  doi:10.6040/j.issn.1672-3961.0.2018.197
    摘要 ( 2344 )   HTML ( 50 )   PDF (2868KB) ( 326 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对受字数限定影响的文本特征表达能力弱成为短文本分类中制约效果的主要问题,提出基于word2vec维基百科词模型的中文短文本分类方法(chinese short text classification method based on embedding trained by word2vec from wikipedia, CSTC-EWW),并针对新浪爱问4个主题的短文本集进行相关试验。首先训练维基百科语料库并获取word2vec词模型,然后建立基于此模型的短文本特征,通过SVM、贝叶斯等经典分类器对短文本进行分类。试验结果表明:本研究提出的方法可以有效进行短文本分类,最好情况下的F-度量值可达到81.8%;和词袋(bag-of-words, BOW)模型结合词频-逆文件频率(term frequency-inverse document frequency, TF-IDF)加权表达特征的短文本分类方法以及同样引入外来维基百科语料扩充特征的短文本分类方法相比,本研究分类效果更好,最好情况下的F-度量提高45.2%。

    基于信任网络重构的推荐算法
    胡云,张舒,李慧,佘侃侃,施珺
    2019, 49(2):  42-46.  doi:10.6040/j.issn.1672-3961.0.2018.346
    摘要 ( 732 )   HTML ( 6 )   PDF (1715KB) ( 324 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    基于信任网络的重构问题,提出一种新颖的推荐算法。将用户相似值与信任关系相结合构建初始信任网络,对用户未评分项进行初始预测;利用一种基于可靠性度量方法评价预测评分的质量,对于未评分项目根据新组建的用户信任网络进行最终评分预测。在两个真实数据集Epinions和Flixster上进行了性能验证,试验结果表明,信任网络的重构可以有效解决推荐系统中的数据稀疏问题,在查全率和查准率上优于传统的推荐算法。

    基于正态分布和自适应变异算子的ε截断算法
    李进,李二超
    2019, 49(2):  47-53.  doi:10.6040/j.issn.1672-3961.0.2018.194
    摘要 ( 738 )   HTML ( 9 )   PDF (1260KB) ( 397 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对约束优化算法不能很好协调收敛性及分布性的问题,提出一种基于正态分布和自适应变异算子的ε截断算法。将正态分布引入模拟二进制交叉算子中,使算法可搜索的空间范围更广,更易跳出局部最优;利用自适应变异算子,将种群个体当前信息与变异算子结合起来,引导种群向真实的Pareto前沿进行进化;结合自适应的ε截断策略,保留Pareto最优解和一定数量的不可行解,同时利用不可行解的信息,加大对搜索空间的探索力度,从而提高种群多样性。采用3种标准测试函数对算法进行测试,试验结果表明:本研究所求解集能够很好的跟踪真实的Pareto解集。该方法可以有效地协调算法的收敛性及分布性。

    基于多重多元回归的人脸年龄估计
    向润,陈素芬,曾雪强
    2019, 49(2):  54-60.  doi:10.6040/j.issn.1672-3961.0.2017.420
    摘要 ( 796 )   HTML ( 13 )   PDF (1956KB) ( 271 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    基于标记分布学习的人脸年龄估计方法利用相近年龄的人脸变化较为缓慢的特点,采用年龄标记分布向量表示附近年龄描述目标年龄的程度,将学习任务从单值的目标年龄预测转变为年龄标记分布向量的估计,较为有效的解决了人脸年龄估计任务中训练数据不足的问题。但是,现有的标记分布学习方法存在不能构建统一的标记分布预测模型(基于最大熵模型的方法)或容易过拟合的问题(基于神经网络的方法)。为了解决这些问题,将基于标记分布学习的年龄估计转换为同时对多因变量进行预测的多重多元回归分析问题,并采用多因变量偏最小二乘回归方法进行求解。多因变量偏最小二乘回归模型对数据分布没有前提假定,在自变量存在较大的相关性的情况下仍可建立有效的多因变量预测模型。在FG-NET人脸数据库上的大量对比试验结果表明,本研究提出的基于多重多元回归的人脸年龄估计方法在大幅度提高模型训练效率的同时,具有更高的年龄估计准确度。

    基于深度卷积神经网络的图像自编码算法
    何奕江,杜军平,寇菲菲,梁美玉,王巍,罗盎
    2019, 49(2):  61-66.  doi:10.6040/j.issn.1672-3961.0.2017.432
    摘要 ( 1678 )   HTML ( 35 )   PDF (1646KB) ( 530 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对目前图像编码的研究工作更加重视信息无损性,而没有体现出社交网络图像区分度的问题,本研究提出一种新颖的基于深度卷积神经网络的社交网络图像自编码算法,将深度卷积神经网络提取特征的能力与社交网络中图像的特点相结合,得到性能良好的图像自编码。结合社交网络图片的特性与聚类算法,先将图片进行聚类得到距离信息,再利用深度卷积神经网络学习图片的距离信息,提取深度卷积神经网络中的全连接层作为编码,重复以上步骤,并得到最终的图像编码。试验结果表明,本研究提出的算法在图像搜索中的效果好于其他算法,更利于在社交网络图像搜索中使用。

    飞行蝙蝠标记自动提取与追踪算法
    杨煦,陈辉,林游思,屠长河
    2019, 49(2):  67-73.  doi:10.6040/j.issn.1672-3961.0.2018.155
    摘要 ( 818 )   HTML ( 10 )   PDF (2680KB) ( 362 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    蝙蝠对仿生扑翼飞行器研究具有重要启发价值。通过计算机视觉方法分析蝙蝠运动需要大量特征标记,因此准确提取、追踪标记是蝙蝠飞行研究的关键。常用的底层特征提取方法将局部极值作为特征点容易导致较高的标记错检率。提出一种基于图像分割的标记提取方法。通过帧间差分获取初始蝙蝠区域,对伪装区域进行补偿,利用LoG算子进行标记增强,并通过阈值分割得到标记,计算标记质心作为特征点。提出一种基于迭代最近点的标记追踪方法,将蝙蝠划分为不同区域并对区域内标记点进行点集粗配准,通过最近邻搜索完成匹配。试验结果表明,算法的标记识别率能够达到96%并实现无遮挡情况的标记追踪,优于SIFT、BRISK等特征匹配方法以及光流追踪方法。

    基于AlexNet和集成分类器的乳腺癌计算机辅助诊断方法
    侯霄雄,许新征,朱炯,郭燕燕
    2019, 49(2):  74-79.  doi:10.6040/j.issn.1672-3961.0.2018.273
    摘要 ( 774 )   HTML ( 12 )   PDF (1350KB) ( 241 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    为解决在计算机辅助诊断(computer aided diagnosis, CAD)中采用人工提取医学影像特征的弊端,在ImageNet数据集上预训练深度神经网络模型Alexnet,通过迁移学习再训练后的Alexnet模型对医学影像进行特征提取,利用集成学习方法训练分类器进行分类。试验结果表明,基于Alexnet和随机森林方法的分类器正确率达到了0.87±0.03,集成分类器的分类性能优于单一分类器。

    轴承故障诊断中特征选取技术
    汪嘉晨,唐向红,陆见光
    2019, 49(2):  80-87, 95.  doi:10.6040/j.issn.1672-3961.0.2018.268
    摘要 ( 1108 )   HTML ( 88 )   PDF (3981KB) ( 320 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对轴承故障诊断建模中如何通过筛选有效特征提高模型诊断准确率的问题,提出一种新的特征选取方法。在计算所得特征集合中,利用诊断模型直接对特征进行判断,将高于阈值的诊断准确率对应的特征(组合)选取为显著特征,以显著特征导向选取方式,找到候选特征集合中维度低、诊断准确率高的特征。试验结果表明,本研究提出的方法可筛选出有效特征,降低模型参数、减少样本需求量、提高模型准确率,提升了故障诊断的效率。

    基于MGU的大规模IP骨干网络实时流量预测
    郭芳,陈蕾,杨子文
    2019, 49(2):  88-95.  doi:10.6040/j.issn.1672-3961.0.2018.342
    摘要 ( 996 )   HTML ( 12 )   PDF (4768KB) ( 387 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    为克服长短时记忆网络(long short-term memory, LSTM)计算成本相当大的弊端,提出基于最小门控单元(minimal gated unit, MGU)的大规模IP骨干网络实时流量预测方法。试验结果表明,与基于LSTM的流量预测方法相比,该方法以较少的模型训练时间获得了相当甚至略优的流量预测性能,在流量预测精度和实时性方面也优于已有的前馈神经网络(feed forward neural network, FFNN)和门控循环单元神经网络(gated recurrent unit, GRU)方法。

    基于多方法融合的非监督彩色图像分割
    董新宇,陈瀚阅,李家国,孟庆岩,邢世和,张黎明
    2019, 49(2):  96-101.  doi:10.6040/j.issn.1672-3961.0.2018.242
    摘要 ( 793 )   HTML ( 7 )   PDF (6833KB) ( 344 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对传统K-means聚类彩色图像分割方法需要人为设定初始分割类别数目、易受噪声干扰等缺陷,提出一种多方法融合非监督彩色图像分割算法。该算法对原始图像进行光谱信息增强处理以提高图像信息提取效率,对K-means聚类引入戴维森堡丁指数(Davies-Bouldin index, DBI)自动化确定最佳分割类别数目,通过图像聚类分析并进行像素标签标记,并结合高斯马尔科夫随机场(Gauss-Markov random field, GMRF)理论对标记图像进行分割,最后使用形态学算子进行后处理完成分割操作。试验结果表明。本研究方法具有一定的鲁棒性,且分割效果更接近真实性。通过对分割结果进行量化评价,进一步说明本研究方法在分割精度和准确性方面更具优势。

    基于C-GRU的微博谣言事件检测方法
    李力钊,蔡国永,潘角
    2019, 49(2):  102-106, 115.  doi:10.6040/j.issn.1672-3961.0.2018.189
    摘要 ( 1643 )   HTML ( 39 )   PDF (1249KB) ( 548 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    提出基于卷积-门控循环单元(convolution-gated recurrent unit, C-GRU)的微博谣言事件检测模型。结合卷积神经网络(convolutional neural networks, CNN)和门控循环单元(gated recurrent unit, GRU)的优点,将微博事件博文句向量化,通过CNN中的卷积层学习微博窗口的特征表示,将微博窗口特征按时间顺序拼接成窗口特征序列,将窗口特征序列输入GRU中学习序列特征表示进行谣言事件检测。在真实数据集上的试验结果表明,相比基于传统机器学习方法、CNN和GRU的谣言检测模型,该模型有更好的谣言识别能力。

    多代表点自约束的模糊迁移聚类
    秦军,张远鹏,蒋亦樟,杭文龙
    2019, 49(2):  107-115.  doi:10.6040/j.issn.1672-3961.0.2018.458
    摘要 ( 721 )   HTML ( 6 )   PDF (1725KB) ( 204 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    以往建立在模糊C均值(fuzzyC-means, FCM)框架下利用源域虚拟簇中心作为迁移知识的迁移聚类算法容易受到离群点和噪声的干扰,且单个簇中心不足以描述簇结构。针对此问题,提出多代表点自约束的模糊迁移聚类算法,该算法引入样本代表权重机制为簇中每个样本分配代表权重来刻画簇结构,这种机制能更好的刻画簇结构,对离群点和噪声有较好的抑制作用;同时利用源域样本,重构目标域簇结构,并以此作为迁移知识进行目标域样本聚类,相对于利用单中心作为迁移知识来说,整体重构后的目标域簇结构所包含的迁移知识量更为丰富。试验结果表明。在人工数据集和真实数据集上,所提出的聚类算法相比对比算法, NMI和ARI最高提升了0.674 5和0.608 4。说明在迁移环境下,以代表点自约束作为知识迁移规则,所提出的聚类算法具有一定的聚类效果。

    基于视频统计特征的差错敏感度模型
    李童,马然,郑鸿鹤,安平,胡翔宇
    2019, 49(2):  116-121.  doi:10.6040/j.issn.1672-3961.0.2018.243
    摘要 ( 765 )   HTML ( 5 )   PDF (2311KB) ( 276 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对传统的丢包对视频质量影响研究的局限性,提出一种差错敏感度模型。对每个受损块提取周围块的丢失情况、纹理复杂度、运动矢量和梯度等可用的统计特征;对丢包视频进行差错隐藏,计算出差错敏感度;利用机器学习技术,建立统计特征和差错敏感度的关系模型。试验结果表明,相比于现有评价方法,该模型可以比较准确地预测视频帧局部差异性对不同丢包情况的敏感程度,尤其对于运动缓慢的视频序列,预测精度明显优于其他方法。

    基于多目标协同进化遗传算法的规则提取方法
    张中伟,梅红岩,周军,贾慧萍
    2019, 49(2):  122-130.  doi:10.6040/j.issn.1672-3961.0.2018.211
    摘要 ( 636 )   HTML ( 8 )   PDF (1309KB) ( 197 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对事务数据库中连续型数值属性难以划分且规则提取效率较低的问题,提出一种交叉、变异种群协同进化的量化关联规则提取方法。利用帕累托原理的非支配排序对种群个体进行优化。利用个体相似度的基因型、表现型控制交叉种群中个体的配对,对变异种群采用水平集概念进行分割,并针对个体优劣分别采取单点突变和多点突变两种突变方式增强个体多样性。利用精英种群保存交叉种群与变异种群中的优秀个体并对其求取帕累托最优解集。在不同数据集上的仿真结果表明,该算法获得规则在性能和数量上达到较好的均衡,且能够有效覆盖数据集,验证了算法的有效性和可行性。