Please wait a minute...
您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》
扫一扫,加关注

当期目录

    2022年 第52卷 第2期 刊出日期:2022-04-20
      
    机器学习与数据挖掘
    任务粒度视角下的学生成绩预测研究综述
    聂秀山,马玉玲,乔慧妍,郭杰,崔超然,于志云,刘兴波,尹义龙
    2022, 52(2):  1-14.  doi:10.6040/j.issn.1672-3961.0.2021.489
    摘要 ( 1084 )   HTML ( 36 )   PDF (1393KB) ( 429 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    学生成绩预测作为教育数据挖掘领域重要的研究分支之一, 学者们已开展了大批卓有成效的研究工作, 但对现有文献进行调查、梳理的综述性研究仍相对缺乏。立足于不同的应用场景, 以学生成绩预测研究的任务粒度为视角, 从答题表现预测、课程成绩预测、综合学习表现预测等3个方面, 详细介绍学生成绩预测研究所采用的技术和方法, 并介绍目前学生成绩预测研究在真实教学场景中的应用情况, 从而为科研和教育管理工作者提供更有针对性的参考信息。

    基于旋转损失函数RCIoU的SAR图像舰船目标检测方法
    郑子阳, 张婷, 刘兆英, 李玉鑑, SUN Changming
    2022, 52(2):  15-22.  doi:10.6040/j.issn.1672-3961.0.2021.356
    摘要 ( 1032 )   PDF (10647KB) ( 260 )   收藏
    参考文献 | 相关文章 | 多维度评价
    提出一种合成孔径雷达(synthetic aperture radar, SAR)图像旋转舰船检测方法,以提高SAR图像中旋转舰船的检测精度。从先验框设计和边界框回归公式对YOLOv4-CSP目标检测网络进行改进,加入旋转角度使其适用于基于旋转框的检测场景;提出一种基于旋转边界框外接圆和交并比的损失函数,该函数不仅考虑预测框和真实框的中心点的距离,而且考虑旋转框各个参数之间的相关性,具有很好的效果;为进一步提升SAR图像中的舰船检测精度,引入转移注意力模块,使得网络能够充分学习有效特征,提高检测精度。试验结果证明,改进后的模型结合提出的损失函数能够有效提升旋转舰船的检测精度,在图像分辨率为416像素×416像素情况下,平均精度均值(mean average precision, mAP)达到95.79%;加入注意力模块后,在图像分辨率为416像素×416像素情况下,mAP达到96.40%,在图像分辨率为800像素×800像素情况下,mAP达到96.98%。本研究不仅可以为海洋监测等应用提供重要的技术支持,还具有重要的理论价值和应用价值。
    基于时间感知注意力机制的混合编码网络方法
    宁春梅,孙博,肖敬先,陈廷伟
    2022, 52(2):  23-30.  doi:10.6040/j.issn.1672-3961.0.2021.287
    摘要 ( 837 )   PDF (3891KB) ( 209 )   收藏
    参考文献 | 相关文章 | 多维度评价
    传统的混合编码网络在小样本数据训练情况下,捕捉用户意图与语义分析方面存在局限性,很难应用到新领域进行迁移训练。时间感知注意混合编码网络(time-aware attention hybrid code networks,TAA-HCN)通过构建时间感知的注意力机制和用户意图集成(user intent integration,UII)的门控机制建模用户意图与动作措施的关系,捕捉用户意图随时间动态变化,结合元学习的思想进行模型梯度自适应,以便模型快速收敛。TAA-HCN模型在WOZ数据集与BABI数据集上进行试验与分析,当目标域数据为总数据的5%时,F1与BLEU指标几乎全收敛,且准确率为69.3%,这表明了本研究的模型具有仅需很少的目标数据即可实现良好性能的能力。
    基于TOPSIS的异质网络影响力最大化
    郭茂林,包崇明,周丽华,丁涛,孔兵
    2022, 52(2):  31-40.  doi:10.6040/j.issn.1672-3961.0.2021.279
    摘要 ( 609 )   PDF (5104KB) ( 88 )   收藏
    参考文献 | 相关文章 | 多维度评价
    为了解决异质网络影响力最大化问题,提出一种通过计算不同元路径的信息熵将异质网络影响力最大化建模为一个多标准决策问题,再使用逼近理想解排序法(technique for order preference by similarity to an ideal solution,TOPSIS)进行求解。为了评估异质网络中的信息扩散,使用线性阈值模型来进行种子集的扩散数量验证。在3个真实世界网络上进行试验,试验结果表明所提算法的扩散数量高于其他算法结果几十到几百个节点不等,运行时间也是线性时常,表明所提算法是确实有效。
    基于轻量型卷积神经网络的海面红外显著性目标检测方法
    张学思,张婷,刘兆英,江天鹏
    2022, 52(2):  41-49.  doi:10.6040/j.issn.1672-3961.0.2021.352
    摘要 ( 876 )   PDF (3644KB) ( 205 )   收藏
    参考文献 | 相关文章 | 多维度评价
    为提高红外舰船图像显著性检测精度,同时降低参数量,提出一种轻量型红外舰船显著性检测模型。该模型针对红外图像缺乏颜色、纹理等细节特征的特点,从以下三个方面进行轻量化设计:在骨干网络设计方面,将视觉几何组网络(visual geometry group, VGG)各层的通道数减少一半作为骨干网络,以减少冗余的特征;为了进一步减少模型参数量,在前两个低层卷积模块中引入一种轻量型的线性瓶颈模块(linear bottleneck, LB)替换传统卷积模块;提出一种新的提取全局特征能力更强的轻量型的高层线性瓶颈模块(high-level linear bottleneck, HLLB)替换后3个高层传统卷积模块,并且使用自适应平均池化提取高层特征作为全局特征以得到更丰富的上下文信息。针对红外数据集缺少的问题,构建一个红外舰船数据集IRShip,包括1002幅图像。试验结果表明:该算法能够有效实现红外舰船目标的显著性检测,并且通过与其他7种常用的显著性检测模型对比,本研究提出的模型可以在大幅减少参数量的情况下有效提升红外舰船显著性目标检测的性能。
    用于亲属关系鉴别的成对约束组合度量学习
    刘笑,陈家炜,胡峻林
    2022, 52(2):  50-56.  doi:10.6040/j.issn.1672-3961.0.2021.282
    摘要 ( 577 )   PDF (2846KB) ( 114 )   收藏
    参考文献 | 相关文章 | 多维度评价
    针对现有的度量学习方法存在训练参数多,容易导致过拟合和鲁棒性差的问题,提出一种成对约束组合度量学习方法(pairwise constrained compositional metric learning, PCCML),利用数据集中生成的局部判别度量,学习各组份度量的最优权重组合。在大边距框架下,PCCML通过约束正样本对马氏距离小于较小的阈值,负样本对马氏距离大于较大的阈值,有效提高了鉴别精度。在KinFaceW-I和KinFaceW-II基准数据集上的试验结果表明了所提出的PCCML方法对鉴别亲属关系问题的有效性。
    自适应图正则的单步子空间聚类
    程业超,刘惊雷
    2022, 52(2):  57-66.  doi:10.6040/j.issn.1672-3961.0.2021.317
    摘要 ( 551 )   PDF (4722KB) ( 146 )   收藏
    参考文献 | 相关文章 | 多维度评价
    针对子空间聚类算法中相似性学习和谱聚类相互分离的问题,提出自适应图正则的单步子空间聚类(one-step subspace clustering with adaptive graph regularization, OSCAGR)算法。利用Frobenius范数鼓励分组效应,根据局部连通性为每个数据点分配自适应的最优邻域学习系数矩阵;考虑全局结构和局部结构,保证数据空间中相近的点拥有较大的表示系数;通过量化范数将子空间聚类两个独立的阶段整合到一个统一的优化框架中。试验结果表明,OSCAGR算法在UCI数据集和3个图像数据集上比其他对比方法的精度高1%~7%,OSCAGR算法的聚类正确率和归一化互信息优于其他对比方法。
    基于知识图谱的查询显示系统的设计与实现
    田轶群,林荣恒
    2022, 52(2):  67-73.  doi:10.6040/j.issn.1672-3961.0.2021.362
    摘要 ( 818 )   PDF (4966KB) ( 171 )   收藏
    参考文献 | 相关文章 | 多维度评价
    为解决电网客服领域人力成本过高、业务处理受到时空限制的问题,探究基于行业知识图谱的智能客服查询显示系统。根据电网客服领域的业务需求和数据特点,采用半自动化的方式对源数据进行语义标注与关系抽取,建立行业知识图谱。在实现自动问答系统的语义解析环节,提出一种多模式匹配和相似度度量融合的实体识别算法,提高实体识别模块的性能。通过设计100道问题对构建好的智能客服自动问答系统进行测试,最终有93道问题被正确处理。该系统的实现过程为构建基于行业知识图谱的智能问答系统提供参考。
    一个具有多稳定流的广义Hamiltonian保守混沌系统
    贾红艳,陈忠告,石文欣,韩晓光
    2022, 52(2):  74-79.  doi:10.6040/j.issn.1672-3961.0.2021.388
    摘要 ( 698 )   PDF (7385KB) ( 140 )   收藏
    参考文献 | 相关文章 | 多维度评价
    通过分析一个三维保守混沌系统的力学和能量特性,发现当参数a=b时,该三维保守系统实际上是一个新的四维广义Hamiltonian保守系统的三维子系统。通过对新的广义Hamiltonian保守系统进行数值分析,如李雅普诺夫指数、分岔图、相轨迹等,发现其具有非常丰富的动力学行为:混沌特性、周期特性、拟周期特性。通过分析该广义Hamiltonian保守系统平衡点特性,发现其动力学行为呈现隐藏特性。同时,在系统参数不变的情况下,通过改变初值,发现该广义Hamiltonian保守系统具有多稳定性。利用现场可编程逻辑门阵列(field programmable gate array, FPGA)实现了该广义Hamiltonian保守系统,试验结果和数值分析结果是一致的。分别从数值分析和物理特性上验证了该广义Hamiltonian保守系统隐藏混沌特性和多稳定性的存在,为应用提供了新的模型。
    一种面向多标签分类的在线主动学习算法
    龚楷伦,翟婷婷,唐鸿成
    2022, 52(2):  80-88.  doi:10.6040/j.issn.1672-3961.0.2021.316
    摘要 ( 936 )   PDF (7617KB) ( 167 )   收藏
    参考文献 | 相关文章 | 多维度评价
    针对现有算法多标签分类器收敛效率低和标签查询策略未考虑特征辨别能力的弊端,提出一种基于判别采样和镜像梯度下降规则的多标签在线主动学习算法(multi-label active mirror descent by discrimination sampling,MLAMD_D)。MLAMD_D算法采用二元关联策略将包含C个标签的多标签分类问题分解成C个相互独立的二分类问题,算法使用镜像梯度下降规则更新其二分类器,并采用基于判别的采样策略。将MLAMD_D算法与现有算法以及基于随机采样和镜像梯度下降规则的多标签在线主动学习算法(multi-label active mirror descent by random sampling,MLAMD_R)在6个多标签分类数据集上进行对比试验。试验结果表明,MLAMD_D算法的多标签分类性能优于其他多标签在线主动学习算法。因此,MLAMD_D算法在处理多标签在线主动学习的任务中具有可行性和有效性。
    深度语义分割MRF模型的海洋筏式养殖信息提取
    王心哲,邓棋文,王际潮,范剑超
    2022, 52(2):  89-98.  doi:10.6040/j.issn.1672-3961.0.2021.300
    摘要 ( 844 )   PDF (9273KB) ( 332 )   收藏
    参考文献 | 相关文章 | 多维度评价
    采用无监督方法与深度学习模型结合,解决筏式养殖边缘信息精确提取问题,提出深度语义分割(semantic segmentation, SegNet)-马尔科夫随机场(Markov random field, MRF)模型,该模型提取目标空间细节信息和深度判别特征信息。通过SegNet编码器的卷积和最大池化提取筏式养殖的特征信息和扩大感受野,抑制噪声、误判等现象的产生,模型后端接入MRF模型,计算像素空间领域内的特征信息进行聚类分析来获取目标低水平的空间细节信息,在深度特征信息的基础上较大程度的保留空间特征信息,完善边缘信息并抑制连通区域的产生。试验结果表明,该模型极大减少了特征信息丢失和因海水背景而产生的误判,其分类精度高于95%,明显优于经典无监督算法和单一的深度学习模型。
    基于弱监督和半监督学习的红外舰船分割方法
    尹旭,刘兆英,张婷,李玉鑑
    2022, 52(2):  99-106.  doi:10.6040/j.issn.1672-3961.0.2021.329
    摘要 ( 669 )   PDF (5446KB) ( 171 )   收藏
    参考文献 | 相关文章 | 多维度评价
    为降低获取像素级标签的成本,提出一种基于弱监督和半监督学习的红外舰船分割方法,在残差网络(residual network, ResNet)的基础上,设计一个自适应定位模块,并使用相似损失、前景损失和背景损失训练自适应定位模块,生成舰船定位图;利用少量像素级标签数据和大量定位图数据交替训练显著性网络生成显著图;用条件随机场优化显著图,并结合图像级标签生成伪标签图像,使用伪标签图像训练分割网络,得到红外舰船的分割结果。在红外舰船数据集上的平均交并比为71.18%,与当前其他先进方法进行对比,平均交并比提高了9.47%,试验结果表明自适应定位模块能够有效定位红外舰船,交替训练方法可以使红外舰船的边缘更准确。
    基于索引列表的增量高效用模式挖掘算法
    张妮,韩萌,王乐,李小娟,程浩东
    2022, 52(2):  107-117.  doi:10.6040/j.issn.1672-3961.0.2021.290
    摘要 ( 683 )   PDF (4689KB) ( 78 )   收藏
    参考文献 | 相关文章 | 多维度评价
    基于效用列表的高效用模式挖掘算法主要局限性在于创建和维护效用列表非常耗时,原因是建立了大量的列表,且列表之间连接操作成本较高。为了解决这个问题,提出一种索引列表结构,可以依据索引值快速访问并更新存储在列表中的信息,并提出一种基于索引列表的增量高效用模式挖掘算法,在挖掘过程中加快挖掘速度并减少内存消耗。试验结果表明,所提出算法在增量式挖掘过程中能有效减少时空性能消耗,且索引列表结构表现出比普通列表更优异的性能。在多种数据集中,运行时间平均提高43%,内存平均减少20%,且在不同的数据插入率条件下具有稳定的性能。
    一种基于动态局部密度和聚类结构的聚类算法
    卢建云,张蔚,李林
    2022, 52(2):  118-127.  doi:10.6040/j.issn.1672-3961.0.2021.310
    摘要 ( 694 )   PDF (13287KB) ( 79 )   收藏
    参考文献 | 相关文章 | 多维度评价
    为提高逆k最近邻在度量局部密度时的区分度,提出动态逆k最近邻概念利用泊松概率密度函数拟合逆k最近邻分布,并计算累积动态逆k最近邻局部密度;基于动态局部密度对数据对象进行排序,利用逆k最近邻域扩展算法生成聚类结构;依据动态局部密度和欧式距离设计聚类决策图,根据决策图找出聚类结构中的类间间断点,利用间断点将聚类结构直接划分成独立的类簇将本研究提出的聚类结构划分聚类(cluster structure partition clustering,CSPC)算法与DBSCAN、DPC和RNN-DBSCAN算法在人工和真实数据集上进行试验对比,CSCP在人工和真实数据集上的评价指标F1平均分别提高8.8%和8.2%,评价指标标准互信息平均分别提高11.6%和7.3%。试验结果表明CSPC算法取得了更好的聚类结果。
    时空众包下复合选择的长期激励算法
    张琦,王莹洁
    2022, 52(2):  128-134.  doi:10.6040/j.issn.1672-3961.0.2021.548
    摘要 ( 532 )   PDF (4684KB) ( 84 )   收藏
    参考文献 | 相关文章 | 多维度评价
    采用长期激励模型应对时空众包下的工人激励问题,提出一种基于博弈论的长期激励算法(multi-stage compound selection, MSCS)。工人的激励模型考虑用户对任务的兴趣、任务奖励和对长期参与的参与度3部分内容,利用激励模型对工人进行长期激励。通过计算用户参与众包过程的最佳次数,制定对用户的个性化激励策略。采用用户的数量和最大平均参与度与其他长期激励算法以及基线算法进行对比分析。试验结果证明,MSCS算法在相同预算下能够激励更多的用户参与众包过程,在预算不足的情况下也能吸引用户更长时间的参与众包过程。MSCS算法具有更好的长期激励效果。