您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版) ›› 2011, Vol. 41 ›› Issue (4): 44-48.

• 论文 • 上一篇    下一篇

一种挖掘概念漂移数据流的模糊积分集成分类方法

琚春华1,2,陈之奇1*   

  1. 浙江工商大学 1.计算机与信息工程学院;  2. 浙江工商大学现代商贸研究中心, 浙江 杭州 310018
  • 收稿日期:2011-02-14 出版日期:2011-08-16 发布日期:2011-02-14
  • 通讯作者: 陈之奇(1984- ),男,浙江杭州人,硕士研究生,主要研究方向为信息系统与智能信息处理. E-mail:zhiqich@163.com E-mail:zhiqich@163.com
  • 作者简介:琚春华(1962- ), 男,浙江常山人,教授,博士,博士生导师, 主要研究方向为人工智能、智能信息处理、电子商务. E-mail:jch@mail.zjgsu.edu.cn
  • 基金资助:

    国家自然科学基金资助项目(71071141);浙江省自然科学基金重点资助项目(Z1091224);浙江省教育厅资助项目(Y201016434)

A method of fuzzy integral ensemble classifiers for handling concept-drifting data streams

JU Chun-hua1,2, CHEN Zhi-qi1*   

  1. 1. School of Computer Science & Information Engineering;
    2.Center for Studies of Modern Business, Zhejiang Gongshang University, Hangzhou 310018, China
  • Received:2011-02-14 Online:2011-08-16 Published:2011-02-14

摘要:

针对隐含概念漂移和噪声的数据流,提出一种基于模糊积分融合的数据流分类方法(fuzzy integral ensemble classifiers for mining data streams, FI-MDS)。将模糊积分融合方法与集成综合技术有效结合起来,首先通过基分类器对识别样例进行分类得到决策剖面,然后再用模糊积分融合方法得到最终的分类结果,同时引入动态权值更新以提高算法的适应性。实验结果表明,与传统的数据流分类算法相比,该方法提高了概念漂移的检测精度,有效地解决了数据流中复杂分类问题,具有良好的分类性和健壮性。

关键词: 数据挖掘, 数据流, 概念漂移, 模糊积分

Abstract:

A new classification algorithm FI-MDS based on fuzzy integral fusion was proposed, which aimed at mining data steams with concept drifts and noise and  combined fuzzy integral fusion and ensemble multi-classifiers technology. First, the decision-making profile could  be obtained by training samples through base classifiers, and then  the final classification result could be obtained via fuzzy integral fusion. Meanwhile, a dynamic weight update was  also introduced to improve the adaptability of this algorithm. The experiment results indicated that this method could  enhance the detection accuracy of the concept drifts. Complex classification problems in data streams could  be solved and the algorithm has higher classification performance, effectiveness and robustness.

Key words: data mining, data streams, concept drift, fuzzy integral

[1] 陈嘉杰,王金凤. 基于蚁群算法求解Choquet模糊积分模型[J]. 山东大学学报(工学版), 2018, 48(3): 81-87.
[2] 庞人铭,王波,叶昊,张海峰,李明亮. 基于PCA相似度和谱聚类相结合的高炉历史数据聚类[J]. 山东大学学报(工学版), 2017, 47(5): 143-149.
[3] 周哲, 商琳. 一种基于动态词典和三支决策的情感分析方法[J]. 山东大学学报(工学版), 2015, 45(1): 19-23.
[4] 朱全银1,严云洋1,周培1,谷天峰2. 一种线性插补与自适应滑动窗口价格预测模型[J]. 山东大学学报(工学版), 2012, 42(5): 53-58.
[5] 郭躬德1,2,李南1,2,陈黎飞1,2. 一种适应概念漂移数据流的分类算法[J]. 山东大学学报(工学版), 2012, 42(4): 1-7.
[6] 宋威,刘文博,李晋宏. 基于动态裁剪频繁模式树的频繁项集并发挖掘算法[J]. 山东大学学报(工学版), 2011, 41(4): 49-55.
[7] 王爱国,李廉*,杨静,陈桂林. 一种基于Bayesian网络的网页推荐算法[J]. 山东大学学报(工学版), 2011, 41(4): 137-142.
[8] 张新猛,蒋盛益. 一种基于相似度概率的不确定分类数据聚类算法[J]. 山东大学学报(工学版), 2011, 41(3): 12-16.
[9] 孙静宇,余雪丽,陈俊杰, 李鲜花. 采样特异性因子及异常检测[J]. 山东大学学报(工学版), 2010, 40(5): 56-59.
[10] 董乃鹏 赵合计 SCHOMMER Christoph. 作者写作特征提取引擎[J]. 山东大学学报(工学版), 2009, 39(5): 27-31.
[11] 孙宇清,赵锐,姚青,史斌,刘佳 . 一种基于网格的障碍约束下空间聚类算法[J]. 山东大学学报(工学版), 2006, 36(3): 86-90 .
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!