您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版) ›› 2011, Vol. 41 ›› Issue (4): 44-48.

• 论文 • 上一篇    下一篇

一种挖掘概念漂移数据流的模糊积分集成分类方法

琚春华1,2,陈之奇1*   

  1. 浙江工商大学 1.计算机与信息工程学院;  2. 浙江工商大学现代商贸研究中心, 浙江 杭州 310018
  • 收稿日期:2011-02-14 出版日期:2011-08-16 发布日期:2011-02-14
  • 通讯作者: 陈之奇(1984- ),男,浙江杭州人,硕士研究生,主要研究方向为信息系统与智能信息处理. E-mail:zhiqich@163.com E-mail:zhiqich@163.com
  • 作者简介:琚春华(1962- ), 男,浙江常山人,教授,博士,博士生导师, 主要研究方向为人工智能、智能信息处理、电子商务. E-mail:jch@mail.zjgsu.edu.cn
  • 基金资助:

    国家自然科学基金资助项目(71071141);浙江省自然科学基金重点资助项目(Z1091224);浙江省教育厅资助项目(Y201016434)

A method of fuzzy integral ensemble classifiers for handling concept-drifting data streams

JU Chun-hua1,2, CHEN Zhi-qi1*   

  1. 1. School of Computer Science & Information Engineering;
    2.Center for Studies of Modern Business, Zhejiang Gongshang University, Hangzhou 310018, China
  • Received:2011-02-14 Online:2011-08-16 Published:2011-02-14

摘要:

针对隐含概念漂移和噪声的数据流,提出一种基于模糊积分融合的数据流分类方法(fuzzy integral ensemble classifiers for mining data streams, FI-MDS)。将模糊积分融合方法与集成综合技术有效结合起来,首先通过基分类器对识别样例进行分类得到决策剖面,然后再用模糊积分融合方法得到最终的分类结果,同时引入动态权值更新以提高算法的适应性。实验结果表明,与传统的数据流分类算法相比,该方法提高了概念漂移的检测精度,有效地解决了数据流中复杂分类问题,具有良好的分类性和健壮性。

关键词: 数据挖掘, 数据流, 概念漂移, 模糊积分

Abstract:

A new classification algorithm FI-MDS based on fuzzy integral fusion was proposed, which aimed at mining data steams with concept drifts and noise and  combined fuzzy integral fusion and ensemble multi-classifiers technology. First, the decision-making profile could  be obtained by training samples through base classifiers, and then  the final classification result could be obtained via fuzzy integral fusion. Meanwhile, a dynamic weight update was  also introduced to improve the adaptability of this algorithm. The experiment results indicated that this method could  enhance the detection accuracy of the concept drifts. Complex classification problems in data streams could  be solved and the algorithm has higher classification performance, effectiveness and robustness.

Key words: data mining, data streams, concept drift, fuzzy integral

[1] 周彦冰,马士伦,文益民. 基于图结构的概念漂移检测[J]. 山东大学学报 (工学版), 2025, 55(2): 88-96.
[2] 王梅,宋凯文,刘勇,王志宝,万达. DMKK-means——一种深度多核K-means聚类算法[J]. 山东大学学报 (工学版), 2024, 54(6): 1-7.
[3] 张喜龙,韩萌,陈志强,武红鑫,李慕航. 动态集成选择的不平衡漂移数据流Boosting分类算法[J]. 山东大学学报 (工学版), 2023, 53(4): 83-92.
[4] 张妮,韩萌,王乐,李小娟,程浩东. 基于索引列表的增量高效用模式挖掘算法[J]. 山东大学学报 (工学版), 2022, 52(2): 107-117.
[5] 聂秀山,马玉玲,乔慧妍,郭杰,崔超然,于志云,刘兴波,尹义龙. 任务粒度视角下的学生成绩预测研究综述[J]. 山东大学学报 (工学版), 2022, 52(2): 1-14.
[6] 杨思, 李思童, 张进东, 白羽. 高速光通信激光器带宽模型改进与并行计算优化[J]. 山东大学学报 (工学版), 2019, 49(1): 17-22.
[7] 李尧, 王志海, 孙艳歌, 张伟. 一种基于深度属性加权的数据流自适应集成分类算法[J]. 山东大学学报 (工学版), 2018, 48(6): 44-55.
[8] 陈嘉杰,王金凤. 基于蚁群算法求解Choquet模糊积分模型[J]. 山东大学学报(工学版), 2018, 48(3): 81-87.
[9] 庞人铭,王波,叶昊,张海峰,李明亮. 基于PCA相似度和谱聚类相结合的高炉历史数据聚类[J]. 山东大学学报(工学版), 2017, 47(5): 143-149.
[10] 周哲, 商琳. 一种基于动态词典和三支决策的情感分析方法[J]. 山东大学学报(工学版), 2015, 45(1): 19-23.
[11] 朱全银1,严云洋1,周培1,谷天峰2. 一种线性插补与自适应滑动窗口价格预测模型[J]. 山东大学学报(工学版), 2012, 42(5): 53-58.
[12] 郭躬德1,2,李南1,2,陈黎飞1,2. 一种适应概念漂移数据流的分类算法[J]. 山东大学学报(工学版), 2012, 42(4): 1-7.
[13] 王爱国,李廉*,杨静,陈桂林. 一种基于Bayesian网络的网页推荐算法[J]. 山东大学学报(工学版), 2011, 41(4): 137-142.
[14] 宋威,刘文博,李晋宏. 基于动态裁剪频繁模式树的频繁项集并发挖掘算法[J]. 山东大学学报(工学版), 2011, 41(4): 49-55.
[15] 张新猛,蒋盛益. 一种基于相似度概率的不确定分类数据聚类算法[J]. 山东大学学报(工学版), 2011, 41(3): 12-16.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 张永花,王安玲,刘福平 . 低频非均匀电磁波在导电界面的反射相角[J]. 山东大学学报(工学版), 2006, 36(2): 22 -25 .
[2] 李可,刘常春,李同磊 . 一种改进的最大互信息医学图像配准算法[J]. 山东大学学报(工学版), 2006, 36(2): 107 -110 .
[3] Yue Khing Toh1 , XIAO Wendong2 , XIE Lihua1 . 基于无线传感器网络的分散目标跟踪:实际测试平台的开发应用(英文)[J]. 山东大学学报(工学版), 2009, 39(1): 50 -56 .
[4] 程代展,李志强. 非线性系统线性化综述(英文)[J]. 山东大学学报(工学版), 2009, 39(2): 26 -36 .
[5] 夏 斌,张连俊 . DS-CDMA UWB系统中基于能量比较的TOA估计算法[J]. 山东大学学报(工学版), 2007, 37(1): 70 -73 .
[6] 胡天亮,李鹏,张承瑞,左毅 . 基于VHDL的正交编码脉冲电路解码计数器设计[J]. 山东大学学报(工学版), 2008, 38(3): 10 -13 .
[7] 李善评,赵玉晓,乔鹏,冯正志 . 好氧颗粒污泥的培养及基质降解和污泥生长动力学分析[J]. 山东大学学报(工学版), 2008, 38(3): 95 -98 .
[8] 薛强,艾兴,赵军,周咏辉,袁训亮 . 纳米TiC对Si3N4基复合陶瓷材料性能和微观结构的影响[J]. 山东大学学报(工学版), 2008, 38(3): 69 -72 .
[9] 张 黎,李庆民,李清泉 . FACTS设备的电磁兼容问题展望[J]. 山东大学学报(工学版), 2007, 37(2): 52 -57 .
[10] 孔宪明 鞠培军. 一类中立型不确定变时滞系统的稳定性新判据[J]. 山东大学学报(工学版), 2009, 39(5): 48 -51 .