山东大学学报(工学版) ›› 2011, Vol. 41 ›› Issue (4): 91-94.
孙晓燕1,2,张化祥1,2*,计华1,2
SUN Xiao-yan1,2, ZHANG Hua-xiang1,2*, JI Hua1,2
摘要:
不平衡数据集分类中,采用欠抽样方法容易忽略多数类中部分有用信息,为此提出一种基于AdaBoost的欠抽样集成学习算法U-Ensemble。该方法首先使用AdaBoost算法对数据集预处理,得到各样例权重。训练基分类器时,针对多数类数据不再采用bootstrap抽样方法,而是分别随机选择部分权重较大的样例与部分权重较小的样例,使两部分样例个数与少数类样例个数相同,并组成Bagging成员分类器的训练数据。实验结果证明了算法的有效性。
No related articles found! |
|