山东大学学报(工学版) ›› 2012, Vol. 42 ›› Issue (4): 1-7.
• 机器学习与数据挖掘 • 下一篇
郭躬德1,2,李南1,2,陈黎飞1,2
GUO Gong-de1,2, LI Nan1,2, CHEN Li-fei1,2
摘要:
针对带有概念漂移的数据流的分类问题,提出一种新颖的能够识别并且适应概念漂移数据流的分类算法。该算法将原始数据流沿着时间轴划分为若干数据块后,选择第一块中有代表性的数据作为样本训练模型,从而减轻了噪声和边界对分类精度的影响,使得漂移检测能较为全面且对离群点不过于敏感;此后对随后的数据块进行分类,并依据分类结果动态修正当前分类模型。实验结果表明:该方法能够根据数据流的当前状况自动调整分类模型,快速适应数据流概念漂移的情况,并得到较好的分类效果。
[1] | 琚春华1,2,陈之奇1*. 一种挖掘概念漂移数据流的模糊积分集成分类方法[J]. 山东大学学报(工学版), 2011, 41(4): 44-48. |
|