山东大学学报 (工学版)

null

王熙照,白丽杰*,花强,刘玉超

2011, 41(4): 1-6.

摘要 ( 756 )

PDF (736KB) ( 1476 )

相关文章 | 多维度评价

null

基于信息熵的半监督领域实体关系抽取研究

郭剑毅1,2,雷春雅1,余正涛1,2,苏磊1,2,赵君1,田维1

2011, 41(4): 7-12.

摘要 ( 773 )

PDF (676KB) ( 1919 )

相关文章 | 多维度评价

针对监督机器学习方法抽取实体关系受限于标注语料的规模问题,提出采用信息熵方法来不断扩展小规模训练数据的半监督领域实体关系抽取。结合领域词汇选取小规模训练数据,构建了一定准确率的初始最大熵分类器,用来从未标记数据中预测出候选新实例。采用信息熵方法,通过设定不同熵值,多次循环以选取可信度较高的新实例来扩展训练数据。使用扩展后的训练数据重新迭代训练分类器,分类器性能趋于稳定迭代终止,实现了半监督学习的领域实体关系抽取。实验表明,和已有方法相比,本文提出的半监督领域实体关系抽取通过结合信息熵方法,在小规模标注样本环境中取得了较好的学习效果。

基于双向运动矢量的数字视频篡改鉴定

黄添强1,2,陈智文1

2011, 41(4): 13-19.

摘要 ( 789 )

PDF (1414KB) ( 1580 )

相关文章 | 多维度评价

随着数字视频编辑处理软件的广泛使用,数字视频的篡改检测技术变得越来越重要。本文基于帧间内容连续性,提出一种基于双向运动矢量的视频篡改检测方法。首先对视频双向预测帧(B帧)进行解码,提取双向运动矢量,然后将运动矢量序列中每一个数据对象与左右k近邻最大差值的平均值作为该点的峰值,通过计算峰值序列的均值和标准偏差自适应地设定阈值,对峰值进行检测,从而判断出篡改点。实验结果表明,使用这种篡改检测方法能有效地检测出运动背景下视频帧的删除和插入篡改。

一种快速A P聚类算法

刘晓勇1,2,3,付辉2

2011, 41(4): 20-23.

摘要 ( 959 )

PDF (960KB) ( 4281 )

相关文章 | 多维度评价

Affinity propagation(AP)聚类算法中的一个重要参数-收敛系数(damping factor)对算法的运行效率有较大影响,而传统的AP算法中收敛系数常作为固定参数在算法运行中保持不变,因此AP算法的收敛性能对收敛系数初始值的选择比较敏感,针对这一问题提出了一种新的AP聚类算法:F-AP,该算法在传统AP聚类算法基础上引入收缩因子调节收敛系数,使其值能够随算法进程动态调整,以加速AP算法的收敛过程。在3个不同容量模拟数据集上进行了实验,结果表明,新算法能够有效加速收敛过程,并且能够保证与原算法相同的聚类结果;在标准数据集Iris上的聚类结果也表明了新算法具有较好的收敛性能。

基于划分子集的属性约简算法

翟俊海,高原原,王熙照,陈俊芬

2011, 41(4): 24-28.

摘要 ( 747 )

PDF (353KB) ( 1201 )

相关文章 | 多维度评价

Pawlak提出的基于属性重要度的约简算法是常用的算法之一,它通过计算等价关系对论域划分的粒度来度量属性的重要度。但用该算法计算每一个属性的重要度时,都要计算不同等价关系对整个论域的划分,计算复杂度非常高。受决策树划分子集思想的启发,对基于属性重要度的属性约简算法进行了改进,提出了一种基于划分子集的属性约简算法。在核属性集形成划分的基础上,通过在核属性中添加非核属性从而形成更细的划分,如此反复。在保持正域不变的框架下,形成最细化分的属性集就是一个约简。理论分析显示该算法减少了求属性约简的计算时间复杂度,提高了求属性约简的效率。

基于机器学习的视频指纹识别

何雪英1,2, 秦伟1, 尹义龙1*, 赵联征1,乔昊3

2011, 41(4): 29-33.

摘要 ( 791 )

PDF (712KB) ( 1337 )

相关文章 | 多维度评价

把视频应用于指纹识别,定义指纹视频的内部相似性(inside similarity,S^I)和一对待匹配指纹视频的外部相似性(outside similarity,S^O),计算两个视频的匹配分数来表示它们的相似性,大大提高了自动指纹识别系统的识别率。为寻求更好的识别效果,提出把一次匹配结果作为一个样本,将S^I和S^O作为一个样本的两个特征的新思路,把判断一次匹配是同源匹配还是异源匹配问题转化为对具有二维特征(S^I,S^O)的样本进行分类的问题。在样本集上应用常见的机器学习算法,对每次的匹配结果进行分类。在两组样本集上的实验结果为:应用机器学习算法得到的最低错误率分别为0.1704％和0.1106％,而使用阈值得到的最低错误率分别为0.2229％和0.1700％。结果表明,相比使用阈值来区分指纹同、异源的方法,应用机器学习算法不仅提高了识别率,而且省去了计算两个视频的匹配分数时对参数和阈值的复杂选取过程。

基于距离的不确定数据异常点检测研究

杨金伟,王丽珍*,陈红梅,赵丽红

2011, 41(4): 34-37.

摘要 ( 668 )

PDF (657KB) ( 2603 )

相关文章 | 多维度评价

针对实际数据存在不确定性的问题,提出了新的异常点检测方法。首先,定义了基于距离的不确定数据异常点检测概念；其次,设计了相应的不确定数据的异常点检测算法；再次,为降低算法时间复杂度,设计了剪枝策略；最后,实验分析说明了算法对不确定异常点检测的可行性与效率。

自适应信息素更新蚁群算法求解QoS组播路由

李永胜,曲良东,李熹

2011, 41(4): 38-43.

摘要 ( 672 )

PDF (764KB) ( 1624 )

相关文章 | 多维度评价

针对基本蚁群算法在求解QoS组播路由问题中存在的容易陷入局部最优和收敛速度慢的缺陷,提出一种自适应信息素更新蚁群算法对该问题进行求解。该算法在节点选择中引入混沌扰动,在算法前期依据各链路信息素浓度动态调整信息素的挥发因子,提高了全局搜索能力,后期根据解的优劣自适应更新信息素,使收敛性能得到显著提高。仿真实验表明,同等实验条件下,基本蚁群算法在第12次迭代收敛到局部最优费用值87;融合量子粒子群算法思想的多行为蚁群算法第7次迭代收敛到局部最优费用值66,而本研究算法则在第10次迭代收敛到全局最优费用值62,本研究算法比前两种算法更优。

一种挖掘概念漂移数据流的模糊积分集成分类方法

琚春华1,2,陈之奇1*

2011, 41(4): 44-48.

摘要 ( 658 )

PDF (1105KB) ( 1398 )

相关文章 | 多维度评价

针对隐含概念漂移和噪声的数据流,提出一种基于模糊积分融合的数据流分类方法(fuzzy integral ensemble classifiers for mining data streams, FI-MDS)。将模糊积分融合方法与集成综合技术有效结合起来,首先通过基分类器对识别样例进行分类得到决策剖面,然后再用模糊积分融合方法得到最终的分类结果,同时引入动态权值更新以提高算法的适应性。实验结果表明,与传统的数据流分类算法相比,该方法提高了概念漂移的检测精度,有效地解决了数据流中复杂分类问题,具有良好的分类性和健壮性。

基于动态裁剪频繁模式树的频繁项集并发挖掘算法

宋威,刘文博,李晋宏

2011, 41(4): 49-55.

摘要 ( 875 )

PDF (1442KB) ( 1486 )

相关文章 | 多维度评价

为解决FP(frequent pattern)-growth算法中构造频繁模式树(FP-树)所带来的存储和遍历开销较大的问题,提出了一种基于动态裁剪FP-树的频繁项集并发算法Dynamicprune。一方面,通过记录FP树构造过程中频繁项目计数的变化,实现了FP树的动态剪枝;另一方面,使用并发策略达到了边构造FP-树,边挖掘频繁项集的效果。与FPgrowth算法相比,Dynamic-prune无需先构造整棵FP-树再挖掘频繁项集,节省了FP-树的存储开销。实验结果表明Dynamic-prune在运行效率和可扩展性上均优于FPgrowth算法。

几何集成的改进——特征边界点快速计算

李玉鑑,孟东霞*,桂智明

2011, 41(4): 56-60.

摘要 ( 875 )

PDF (757KB) ( 1341 )

相关文章 | 多维度评价

针对优化几何集成方法(optimized geometric ensembles, OGE)在计算特征边界点集合的过程中包含大量冗余运算且效率较低的缺陷,分别利用Gabriel近邻规则及其启发式搜索法加速特征边界点的选取过程,提出了两种改进的几何集成方法——Gabriel OGE和启发式OGE,并与OGE进行比较实验。实验结果表明,虽然Gabriel OGE中计算特征边界点的时间复杂度与OGE一样,但是因为减少了大量数学运算,计算速度明显提高;而启发式OGE不仅将平均时间复杂度降低为O(dM²),而且在处理大数据集时,计算效率最高。Gabriel OGE和启发式OGE在保证分类结果的同时有效提高了特征边界点集合的计算速度,大幅度减少时间消耗。

基于模糊理论和三段论推理的电影情感分类

林新棋,严晓明,郑之

2011, 41(4): 61-67.

摘要 ( 756 )

PDF (1783KB) ( 1862 )

相关文章 | 多维度评价

人类情感反应具有模糊属性,针对直接应用视频底层特征识别情感类型难以提高精确度的问题,本研究在情感关联底层特征的基础上引入了模糊隶属函数,采用最大隶属度模糊化原则对底层特征进行处理,最终得到一种蕴含情感信息的特征来描述视频片段,为随后采用三段论推理实现电影情感分类提供了合适的特征,这种特征能缩短情感鸿沟。三类基本情感的分类精确度都超过84％,与现有方法相比,分类精确度平均提高了9.33％。因此本研究所提出的算法能有效地提高电影情感分类的精确度。

基于Agent的银行业务排队系统仿真研究

张琦琮1,杨公平2*

2011, 41(4): 68-72.

摘要 ( 941 )

PDF (1110KB) ( 1555 )

相关文章 | 多维度评价

为解决目前办理银行业务顾客等候时间过长的问题,构建了基于Agent的排队系统仿真模型。通过将顾客、排队机、服务台和自动柜员机等抽象为不同的Agent以及不同Agent之间的交互仿真了银行业务排队系统的运行。模型中给出了一种服务队列动态调整的算法,在netlogo平台上进行了模型建立和算法实现。实验数据和分析显示,此模型真实地模拟了银行排队系统运行,合理利用了现有资源,减少了顾客平均等待时间,提升了顾客满意度。

时间序列早期分类的多分类器集成方法

李小斌1, 李世银2

2011, 41(4): 73-78.

摘要 ( 728 )

PDF (826KB) ( 2288 )

相关文章 | 多维度评价

为解决时间序列的早期分类问题,提出一种顺序子空间堆叠泛化(sequential subspace stacked generation， SSSG)的多分类器集成方法。该方法利用滑动窗口将时间序列划分成顺序子空间,采用多个一级分类器在顺序子空间上进行学习,输出各个子空间可能类别的概率,利用二级学习算法在这些概率结果上进行训练得到第二级的分类器。通过两级分类器可以判断已经出现部分特征的时间序列的类别,理论分析了影响分类性能的几个因素,仿真实验证明了本文算法的有效性。

基于通信系统的决策树构造算法

张小峰,张志旺,逄珊

2011, 41(4): 79-84.

摘要 ( 680 )

PDF (602KB) ( 1288 )

相关文章 | 多维度评价

决策树构造过程中的属性选择标准一直是数据挖掘领域的研究热点。本研究在分析ID3算法和C4.5算法属性选择策略的基础上,基于通信系统中的平均自信息与平均互信息提出了两种决策树的构造算法。研究过程中从理论证明了所提出的两种算法与ID3算法以及C4.5算法是等价的,即,信息增益等价于通信系统中的平均互信息,而信息增益率等价于通信系统中平均互信息与平均自信息的比值。在AllElectronics数据集进行的实验表明:与信息增益和信息增益率相比,本研究提出的属性选择标准具有计算方便、且容易理解的特点。

基于视觉原理的密度聚类算法的改进

蒋盛益1,罗方伦1,余雯2

2011, 41(4): 85-90.

摘要 ( 738 )

PDF (807KB) ( 1427 )

相关文章 | 多维度评价

结合基于视觉原理的密度聚类算法对初始化参数不敏感、能发现任意形状的聚类、能够找出最优聚类及一趟聚类算法快速高效的特点,研究可以处理混合属性的高效聚类算法.首先简单改进基于视觉原理的密度聚类算法,使之可以处理含分类属性的数据,进而提出一种两阶段聚类算法。第一阶段使用一趟聚类算法对数据集进行初始划分,第二阶段利用基于视觉原理的密度聚类算法归并初始划分而得到最终聚类。在真实数据集和人造数据集上的实验结果表明,提出的两阶段聚类算法是有效可行的。

基于AdaBoost的欠抽样集成学习算法

孙晓燕1,2,张化祥1,2*,计华1,2

2011, 41(4): 91-94.

摘要 ( 758 )

PDF (332KB) ( 2268 )

相关文章 | 多维度评价

不平衡数据集分类中,采用欠抽样方法容易忽略多数类中部分有用信息,为此提出一种基于AdaBoost的欠抽样集成学习算法U-Ensemble。该方法首先使用AdaBoost算法对数据集预处理,得到各样例权重。训练基分类器时,针对多数类数据不再采用bootstrap抽样方法,而是分别随机选择部分权重较大的样例与部分权重较小的样例,使两部分样例个数与少数类样例个数相同,并组成Bagging成员分类器的训练数据。实验结果证明了算法的有效性。

一种基于图像处理的舌象采集自动调焦算法

韦玉科1, 李江平2, 段仰广1, 卢博生1

2011, 41(4): 95-100.

摘要 ( 877 )

PDF (1093KB) ( 1680 )

相关文章 | 多维度评价

为快速准确地采集到清晰的舌图像,必需智能调整并控制摄像镜头与舌体的位置。提出了影响图像质量的因素,如清晰度、反光比、对中性、阴影比、光照条件、焦距等,以及在调整镜物位置时用到的调焦的方法,并与调焦技术相结合,建立了适合图像质量与镜物距离之间关系的数学模型。自动对焦的过程就是运用爬山搜索算法求取对焦评价函数最大值的过程。传统的爬山搜索算法会受到对焦评价函数局部极值的干扰而不能准确对焦,本研究对每一帧图像先进行预处理,然后采用先粗后精两步法,有效地排除了这种干扰。用VC++6.0编程实现了自动调整采集设备获取质量最佳图片的过程。试验结果表明此方法具有快速、抗干扰强、精确等特性。

一种基于核主成分分析的图像超分辨率算法

颜子夜,陆耀,李建武,马跃

2011, 41(4): 101-105.

摘要 ( 654 )

PDF (708KB) ( 1675 )

相关文章 | 多维度评价

测试样本和训练样本集的匹配是基于学习的超分辨率算法中关键问题之一。本文方法通过将低分辨率的观察样本映射到高维的核空间中,实现测试样本和训练样本集的准确匹配,避免了基于学习的超分辨率算法中错误匹配问题,提高生成图像的质量。该算法包括:测试样本对训练样本集进行核主成分分析(kernel principal components analysis, KPCA); 利用距离约束算法得到在输入空间中的原像;最后将新生成的图像块进行重组,得到高分辨率的图像。在USPS数据集上进行的实验验证和对比分析表明：基于KPCA的图像超分辨率方法能够取得较好的超分辨率效果。

基于语义信息的虚拟环境路径规划

陈明志1,许春耀2,陈健2,余轮2

2011, 41(4): 106-112.

摘要 ( 734 )

PDF (1440KB) ( 2260 )

相关文章 | 多维度评价

为了降低虚拟环境下路径规划的计算复杂度,体现路径的合理性与增强算法的适应性,提出一种基于语义信息的层次型路径规划算法。针对目前虚拟人与环境地图建模时只考虑基本的几何信息,提出加入语义信息的建模方法；并在路径搜索算法中加入语义约束，使规划出的路径更符合人体的行为习惯；最后从路径长度、计算时间与扩展结点数三个指标验证算法的有效性,实验结果表明随场景规模的增大算法的计算时间呈线性增长态势。

基于有限脊波变换的边缘检测算法

祝瑞玲1,王欣2,韩国栋3

2011, 41(4): 113-118.

摘要 ( 677 )

PDF (1354KB) ( 1486 )

相关文章 | 多维度评价

拉普拉斯(Laplace)边缘检测算子对噪声非常敏感。为了解决这个问题,在有限脊波变换(finite ridgelet transform,FRIT)域提出了一种边缘检测算法。首先用拉普拉斯分布模型分析FRIT系数,给出了FRIT系数的最大后验概率(maximum a posteriori,MAP)估计,同时结合边缘检测模型,得到了用于边缘检测的最优阈值,实现了图像的边缘检测。该算法抑制了噪声对图像边缘的影响,同时保护了图像的边缘。实验结果表明,在抑制噪声和边缘定位之间该方法能够达到更好的平衡,得到良好的边缘检测效果。

基于小波神经网络的水文时间序列预测

朱跃龙,李士进,范青松,万定生

2011, 41(4): 119-124.

摘要 ( 840 )

PDF (559KB) ( 1579 )

相关文章 | 多维度评价

复杂时间序列预测是时间序列分析的主要研究内容之一,已成为一个具有重要理论和实际应用价值的热点研究领域。基于小波和神经网络组合模型,提出一种多因子小波预测模型以提高水文时间序列的预测精度。并根据不同小波函数对水文时间序列数据的适应性,提出了一种基于加权相关系数的小波函数选择准则。以国家重要水文站淮河王家坝站汛期的日流量时间序列预测为例,对各种常用小波函数进行了实验。结果发现选择得到的Haar小波和B3 spline小波函数预测精度较高,从而验证了小波函数选取准则的有效性;通过和传统单序列小波神经网络模型比较,发现提出的多因子小波神经网络模型的预测合格率在不同预见期均提高了10％以上,并且对洪水高流量方向预测合格率提高了15％。

k-means聚类问题的改进近似算法

王守强1,朱大铭2,史士英1

2011, 41(4): 125-132.

摘要 ( 697 )

PDF (405KB) ( 1551 )

相关文章 | 多维度评价

大型地下洞室群施工期快速反馈分析实用方法

王刚1,2,蒋宇静2,李术才3

2011, 41(4): 133-136.

摘要 ( 869 )

PDF (409KB) ( 1265 )

相关文章 | 多维度评价

工程岩体是一个高度复杂的灰色系统,按理论方法或实测途径均难以完全确定岩石的基本参数。地下工程快速反馈分析方法是工程现场完善设计、优化施工的可靠方法。通过深入分析施工期围岩参数正反演过程,发现影响反演效果的关键因素为输入数据的真实性,计算模型的适应性和计算结果的可靠性。结合工程地质和监控量测特征,提出了用正交试验设计优化反演方案设计的方法;采用区间分析和分层优化的思想建立了不确定性力学参数的区间反分析优化方法,并给出了目标函数和技术路线。研究地下工程施工过程中多点位移计的布置原则和监测数据变化规律,指出了快速反馈分析方法在大型地下洞室群施工参数反演实践中的特点。通过针对性的反演分析可得到最优围岩参数值,用以优化工程设计和施工。

一种基于Bayesian网络的网页推荐算法

王爱国,李廉*,杨静,陈桂林

2011, 41(4): 137-142.

摘要 ( 637 )

PDF (787KB) ( 2103 )

相关文章 | 多维度评价

为改善用户的Web页面访问行为、提高访问效率, 设计了一种基于贝叶斯网络的网页推荐模型及推荐算法。通过收集和分析服务器中的描述文件和日志文件,利用Bayesian网络分析页面间的依赖关系,构建了基于贝叶斯网络的网页推荐模型并产生推荐集。通过在Microsoft公司提供的网络日志数据集上做的实验,可以获得超过80％的准确率和覆盖率。理论分析和实验结果表明,算法能够在线实时向用户做出个性化的推荐,与已有的推荐算法相比,算法能较快地给出推荐集,并且可以获得更高的准确率和覆盖率。

当期目录