Please wait a minute...
您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》
扫一扫,加关注

当期目录

    2020年 第50卷 第2期 刊出日期:2020-04-20
      
    机器学习与数据挖掘
    基于异质集成学习的虚假评论检测
    张大鹏,刘雅军,张伟,沈芬,杨建盛
    2020, 50(2):  1-9.  doi:10.6040/j.issn.1672-3961.0.2019.402
    摘要 ( 1370 )   HTML ( 29 )   PDF (2118KB) ( 460 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    为了防止卖家的恶性竞争、保证电商平台能够公平交易、保护消费者的权益不受侵犯,针对虚假评论检测领域中数据集小、标注不准确等问题,基于亚马逊最新发布的虚假评论数据集对相关算法进行改进。考虑到Word2vec模型无法识别英语中的词对,提出了Bigram-Word2vec模型;提出“二分类加权硬投票法”以解决异质集成学习中分类器投票数相等的情况;针对异质集成学习中分类器权重设置问题提出“加权软投票法”。试验结果表明,文中对相关算法的改进取得了较为理想的结果。

    一种使用并行交错采样进行超分辨的方法
    朱安,徐初
    2020, 50(2):  10-16,26.  doi:10.6040/j.issn.1672-3961.0.2019.318
    摘要 ( 1112 )   HTML ( 13 )   PDF (5209KB) ( 260 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    目前基于互联网各类图像以及人工智能应用对图像数据质量较为敏感,但由于采集设备以及传输方式限制,导致图像质量受到非常严重影响,为了弥补图像数据质量损失和增强图像效果,提出一种并行交错上下采样网络(parallel interlaced up and down sampling network, PSUDN)作为一个解决该问题的更好的方案,利用并行的高分辨特征(high resolution feature, HR_Feature)和低分辨特征(low resolution feature, LR_Feature),交错进行采样生成高级特征图,通过构建并行的高分辨率特征模块和低分辨率特征模块提升输出的高分辨率图片的质量。通过并行的上采样和下采样,构建的模型可以重建8倍的高分辨率图片,并达到当前较好的效果。

    基于校正神经网络的视频追踪算法
    陈宁宁,赵建伟,周正华
    2020, 50(2):  17-26.  doi:10.6040/j.issn.1672-3961.0.2019.418
    摘要 ( 956 )   HTML ( 20 )   PDF (3959KB) ( 423 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对现有基于深度学习的视频追踪算法关注深层特征而忽略浅层特征以及追踪网络没有对每帧追踪结果进行检测的问题,提出基于校正神经网络的视频追踪算法。该算法包含追踪网络和校正网络。在追踪网络中,考虑到深层特征和浅层边缘特征的融合,设计一个多输入的残差网络,学习目标和对应的高斯响应图之间的关系,从而获得目标对象的位置信息。在校正网络中,设计浅层链式判别网络,将两个网络的追踪结果进行比较,根据比较结果对追踪网络进行在线更新。本算法既考虑了深层特征,又避免了细节信息的丢失;同时,对追踪结果进行评判,防止网络更新中延续错误信息。对比试验说明本研究所提的追踪算法比现有的一些追踪方法取得更好的追踪结果。

    基于改进YOLOv3的复杂场景车辆分类与跟踪
    宋士奇,朴燕,蒋泽新
    2020, 50(2):  27-33.  doi:10.6040/j.issn.1672-3961.0.2019.412
    摘要 ( 1496 )   HTML ( 18 )   PDF (5481KB) ( 449 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对天气条件和车辆间相互遮挡对车辆分类与跟踪准确性和稳定性的影响,提出一种基于改进YOLOv3与匹配跟踪的混合模型。改进的YOLOv3网络参照密集连接卷积网络的设计思想,将网络中的残差层替换为密集卷积块并改变网络的设计结构,利用Softmax分类器将密集卷积块与卷积层中融合的特征进行分类。根据单帧图像的检测结果,设计目标匹配函数解决视频序列中车辆的跟踪问题。在KITTI数据集的测试中,改进算法的平均准确率为93.01%,帧率达到48.98帧/s,在自建的数据集中平均识别率为95.79%。试验结果表明,本研究方法在复杂场景中能够有效的区分车辆种类且准确性更高,车辆跟踪的算法具有较高准确性和鲁棒性。

    基于混合决策的改进鸟群算法
    闫威,张达敏,张绘娟,辛梓芸,陈忠云
    2020, 50(2):  34-43.  doi:10.6040/j.issn.1672-3961.0.2019.294
    摘要 ( 1518 )   HTML ( 12 )   PDF (1356KB) ( 663 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对鸟群算法(bird swarm algorithms, BSA)在求解复杂函数问题时存在的精度低、易陷入局部最优等问题,在保留BSA简单性的同时,提出一种基于混合决策的改进鸟群算法(improved bird swarm algorithms based on mixed decision making, IBSA)。应用重心反向学习机制初始化鸟群,维持鸟群较好的空间解分布。为了有效平衡算法在寻优过程中全局探索能力和局部发觉能力,动态调整鸟群飞往另外区域的周期。引入自适应余弦函数权重策略和加权平均思想对生产者觅食公式进行改进,增加算法在陷入局部最优后的脱困能力。在9个测试函数的基础上通过仿真试验对比基于IBSA、BSA、粒子群算法(particle swarm optimization, PSO)性能。结果表明,改进算法在单峰函数和多峰函数的测试中,寻优精度和寻优速度得到了较大程度上的提升。

    一种基于深度神经网络的句法要素识别方法
    陈艳平,冯丽,秦永彬,黄瑞章
    2020, 50(2):  44-49.  doi:10.6040/j.issn.1672-3961.0.2019.313
    摘要 ( 1284 )   HTML ( 8 )   PDF (1711KB) ( 379 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    为改进传统特征方法很难获取中文句子中结构信息的问题,提出一种基于深度神经网络的句法要素识别模型。采用Bi-LSTM网络从原始数据中自动抽取句子中的结构信息和语义信息,利用Attention机制自动计算抽象语义特征的分类权重,通过CRF层对输出标签进行约束,输出最优的标注序列。经过对比验证,该模型能有效识别句子中的句法要素,在标注数据集上F1达到84.85%。

    基于多维相似度和情感词扩充的相同产品特征识别
    胡龙茂,胡学钢
    2020, 50(2):  50-59.  doi:10.6040/j.issn.1672-3961.0.2019.403
    摘要 ( 1216 )   HTML ( 8 )   PDF (1624KB) ( 682 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对现有相同产品特征识别方法受限于词典覆盖率或语料规模的不足,提出一种基于多维相似度和情感词扩充的识别方法。通过双向长短时记忆条件随机场(bi-directional long short-term memory and conditional random field, Bi-LSTM-CRF)模型抽取产品特征的扩充情感词,综合特征词的语素相似度、同义词林相似度和TF-IDF(term frequency-inverse document frequency)余弦相似度,采用K-medoids聚类算法,识别相同的产品特征。试验结果表明,在手机和笔记本数据集上,该方法的最大调整兰德指数分别达到0.579和0.595 9,而最小熵值分别达到0.782 6和0.745 7,均优于结合语素的调整Jaccard相似度、Word2Vec相似度和基于二分K-means的Word2Vec相似度三种基线试验方法。

    符号序列的LDA主题特征表示方法
    冯超,徐鲲鹏,陈黎飞
    2020, 50(2):  60-65.  doi:10.6040/j.issn.1672-3961.0.2019.760
    摘要 ( 1443 )   HTML ( 6 )   PDF (1403KB) ( 523 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对现有序列挖掘算法特征维度高、学习算法时间复杂度高等方面的不足,提出一种主题特征表示法,将符号序列转换为一组表示多个主题呈现度的概率向量。基于文本挖掘中常用的隐含狄利克雷分配(latent Dirichlet allocation, LDA)主题模型,视短序列元组为序列的浅层特征(词),利用LDA模型学习算法提取主题及其概率分布,作为序列的深层特征。在6个实际序列数据集上进行试验,并与基于元组、Markov模型的现有方法作对比,结果表明,新方法在降低特征维度的同时提高了表示模型的学习效率,在符号序列分类应用中可以取得较理想的分类精度。

    基于元图归一化相似性度量的实体推荐
    张文凯,禹可,吴晓非
    2020, 50(2):  66-75.  doi:10.6040/j.issn.1672-3961.0.2019.304
    摘要 ( 1165 )   HTML ( 10 )   PDF (2102KB) ( 393 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    基于异构信息网络(heterogeneous information networks, HIN)中元图的良好表征特性,提出一种结合隐式反馈和PathSim(meta path-based similarity)的归一化相似性度量(normalized similarity measure of meta graph, NSMG),以解决对异构信息网络中高度可见实体的偏好问题。针对Yelp和Amazon数据集构建Yelp-HIN(heterogeneous information networks in Yelp)和Amazon-HIN(heterogeneous information networks in Amazon),定义不同类型的元图及归一化相似度量,使用矩阵分解和因子分解机来组合计算不同元图上的相似性。试验结果表明,基于NSMG的方法在非常稀疏的数据集上性能表现优于常用的HIN实体推荐方法。

    基于Laplacian支持向量机和序列信息的microRNA-结合残基预测
    马昕,王雪
    2020, 50(2):  76-82.  doi:10.6040/j.issn.1672-3961.0.2019.292
    摘要 ( 957 )   HTML ( 7 )   PDF (1012KB) ( 399 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    提出一种半监督学习算法预测蛋白质序列中microRNA-结合残基的新式的方法。通过Laplacian支持向量机(Laplacian support vector machine,LapSVM)算法结合新提出的混合特征构建预测模型。混合特征是由三类信息组合获得:二级结构信息、HKM特征和新提出的氨基酸理化特性和进化信息结合的特征。比较各种特征的预测性能,新提出的这一特征对预测性能的提高贡献最大。结果表明,通过特征选择,本研究构建的预测模型准确性达到88.72%,敏感性达到54.18%,特异性达到91.15%,明显优于其他方法。

    基于三维剪切波变换和BM4D的图像去噪方法
    张胜男,王雷,常春红,郝本利
    2020, 50(2):  83-90.  doi:10.6040/j.issn.1672-3961.0.2019.262
    摘要 ( 2279 )   HTML ( 24 )   PDF (12734KB) ( 477 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对传统的块匹配去噪方法只能处理二维图像的缺点,提出一种基于三维剪切波变换和改进的三维块匹配过滤(block-matching and 4D filtering, BM4D)算法的图像去噪方法。利用三维剪切波变换得到变换域系数,通过硬阈值和维纳滤波,在变换域中实现联合过滤。经过多尺度分解和方向剖分两个滤波阶段,确保三维剪切波变换是局部的;进行硬阈值和维纳滤波,分别包括分组、协同过滤和聚合3个步骤,利用堆积成四维组的体素立方体,在该组的四维变换同时利用每个立方体中体素之间存在的局部相关性和不同立方体中相应体素之间的非局部相关性。通过三维剪切波逆变换,得到每个分组立方体的估计值,在它们的原始位置进行自适应聚合。以峰值信噪比和结构相似度作为评价标准,试验结果表明:该方法不仅能够有效去除高噪声环境下的图像噪声,而且还能够有效地改善图像的视觉效果,具有较高的准确性。

    基于预测数据特征的空气质量预测方法
    高铭壑,张莹,张蓉蓉,黄子豪,黄琳焱,李繁菀,张昕,王彦浩
    2020, 50(2):  91-99.  doi:10.6040/j.issn.1672-3961.0.2019.404
    摘要 ( 1993 )   HTML ( 25 )   PDF (4733KB) ( 968 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    采用LightGBM预测模型对空气质量预测问题进行研究,提出并设计一种基于预测性特征的空气质量预测方法,有效地预测北京市区内未来24 h核心表征空气质量的PM2.5质量浓度。在构建预测方案过程中,分析训练数据集特性开展数据清洗,利用随机森林与线性插值相结合的方法,解决数据大量缺失以及噪声干扰问题;提出使用预测性数据特征方法,同时设计相关统计特征,提高预测结果的准确性;采用滑窗机制挖掘高维时间特征,增加数据特征数量级;对预测模型的工作性能和结果进行详细分析,并结合基线模型进行对比评价。试验结果表明,基于预测性特征结合采用LightGBM预测模型的方案具有更高的预测精度。

    基于轻型卷积神经网络的火焰检测方法
    严云洋,杜晨锡,刘以安,高尚兵
    2020, 50(2):  100-107.  doi:10.6040/j.issn.1672-3961.0.2019.424
    摘要 ( 1468 )   HTML ( 10 )   PDF (4400KB) ( 427 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    提出一种基于MobileNet的轻型火焰检测方法,基于深度分离卷积和膨胀卷积的膨胀卷积模块(dilated convolution block, DCB)扩增特征的感受野,加强特征语义信息,提高了视频火焰目标的检测率;优化SSD(Single Shot Multibox Detector)检测框架,提出了一种轻型的检测模型DMSSD(Dilated MobileNet-SSD)。在PASCAL VOC数据集和Bilkent大学VisiFire数据集上进行火焰检测试验,试验结果表明火焰检测的平均精度均值分别提升了1.7%和3.8%,火焰检测速度也可达80帧/s,具有较强的鲁棒性和实用性。

    基于深度学习的洗衣机异常音检测
    李春阳,李楠,冯涛,王朱贺,马靖凯
    2020, 50(2):  108-117.  doi:10.6040/j.issn.1672-3961.0.2019.419
    摘要 ( 1563 )   HTML ( 24 )   PDF (5582KB) ( 876 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    基于卷积神经网络框架,提出一种洗衣机异音识别模型,根据卷积神经网络显著特征提取能力和平移不变性,学习洗衣机的异音特征,实现生产线洗衣机的异音自动智能识别。给出完整的过程解决训练数据集的建立、数据样本不平衡等问题。提出一种用于数据增强的网络模型——音频深度卷积生成对抗网络解决训练样本的稀缺性问题。该模型对传统的深度卷积生成对抗网络进行改进,以更好地适应工业音频的生成。利用该模型能够对原始数据进行扩展,生成洗衣机异音增强数据集,在该数据集的基础上进行卷积神经网络训练,经测试准确率达到0.999。利用添加背景噪声信号的数据集测试洗衣机异音识别模型的泛化能力,正确识别率达到0.902,表明该网络在识别洗衣机异音方面具有良好的鲁棒性。

    语义分析及向量化大数据跨站脚本攻击智检
    张海军,陈映辉
    2020, 50(2):  118-128.  doi:10.6040/j.issn.1672-3961.0.2019.043
    摘要 ( 1281 )   HTML ( 11 )   PDF (2001KB) ( 363 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    基于语义情景分析及向量化对访问流量语料库大数据进行词向量化处理,实现面向大数据跨站脚本攻击智能检测。利用自然语言处理方法进行数据获取、数据清洗、数据抽样、特征提取等数据预处理。设计基于神经网络的词向量化算法,实现词向量化得到词向量大数据;通过理论分析和推导,实现多种不同深度的长短时记忆网络智能检测算法。设计不同的超参数并进行反复试验,分别得到最大识别率为0.999 5、最低识别率为0.264 3、识别率均值为99.88%、方差为0、标准差为0.000 4的识别率变化过程曲线图、损失误差变化过程曲线图、词向量样本余弦距离变化曲线图和平均绝对误差变化过程曲线图等。研究结果表明该算法有高识别率、稳定性强、总体性能优良等优点。