您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版) ›› 2013, Vol. 43 ›› Issue (4): 18-25.

• 机器学习与数据挖掘 • 上一篇    下一篇

嵌入误分类代价和拒识代价的极限学习机基因表达数据分类

安春霖1,陆慧娟1,2*,郑恩辉3,王明怡1,陆羿4   

  1. 1.中国计量学院信息工程学院, 浙江 杭州 310018; 2.中国矿业大学信息与电气工程学院, 江苏 徐州 221008;
    3.中国计量学院机电工程学院, 浙江 杭州 310018; 4.美国德克萨斯农工大学计算机系, 德克萨斯州 77446
  • 出版日期:2013-08-20
  • 通讯作者: 陆慧娟(1962- ),女,浙江金华人,博士,教授,主要研究方向为机器学习、模式识别和生物信息学等. E-mail:hjlu@cjlu.edu.cn
  • 作者简介:安春霖(1988- ),女,山东淄博人,硕士研究生,主要研究方向为机器学习、数据挖掘. E-mail:anchunlin0809@126.com
  • 基金资助:

    国家自然科学基金资助项目(61272315, 60842009, 60905034);浙江省自然科学基金资助项目(NO.Y1110342, NO.Y1080950)

Gene expression data classification of the extreme learning machine with misclassification cost and rejection cost

AN Chun-lin1, LU Hui-juan1,2*, ZHENG En-hui3, WANG Ming-yi1, LU Yi4   

  1. 1. College of Information Engineering, China Jiliang University, Hangzhou 310018, China;
    2. College of Information and Electrical Engineering, China University of Mining and  Technology, Xuzhou 221008, China;
    3. College of Mechanical and Electrical Engineering, China Jiliang University, Hangzhou 310018, China;
    4. Department of Computer Science, Prairie View A&M University, Prairie View 77446, U.S.A
  • Online:2013-08-20

摘要:

为了实现代价敏感分类过程中的最小平均误分类代价的目的,本研究通过在分类过程中引入概率估计以及误分类代价重新构造分类结果,提出了基于极限学习机(extreme learning machine, ELM)的代价敏感算法CSELM并在上述算法基础上,引入“拒识代价”,进一步减小了平均误分类代价。算法被运用到基因表达数据集上并与极限学习机、代价敏感决策树、代价敏感BP神经网络和代价敏感支持向量机做对比,可以得出,嵌入拒识的CSELM算法能够更好地降低误分类代价,使分类结果更加可靠。

关键词: 基因表达数据, 代价敏感, 多数投票, 误分类代价, 极限学习机, 拒识代价

Abstract:

To get the minimum misclassification of cost-sensitive classification, the algorithm of cost-sensitive extreme learning machine (CS-ELM) was proposed by using probability estimation and misclassification cost to reconstruct the classification results. Then the “rejection cost” was put into the above algorithm to further reduce the average misclassification cost. This algorithm was applied on the gene expression datasets and compared with extreme learning machine, cost-sensitive decision tree, cost-sensitive BP neural networks and cost-sensitive support vector machine. The experiments demonstrated that the CS-ELM embedded rejection cost could reduce the average misclassification cost better and could make the classification result more reliable.

Key words: extreme learning machine, cost-sensitive, majority voting, misclassification cost, gene expression data, rejection cost

中图分类号: 

  • TP181
[1] 叶明全,高凌云,万春圆. 基于人工蜂群和SVM的基因表达数据分类[J]. 山东大学学报(工学版), 2018, 48(3): 10-16.
[2] 于青民,李晓磊,翟勇. 基于改进EMD和数据分箱的轴承内圈故障特征提取方法[J]. 山东大学学报(工学版), 2017, 47(3): 89-95.
[3] 何其佳,刘振丙,徐涛,蒋淑洁. 基于LBP和极限学习机的脑部MR图像分类[J]. 山东大学学报(工学版), 2017, 47(2): 86-93.
[4] 翟俊海,张素芳,胡文祥,王熙照. 核心集径向基函数极限学习机[J]. 山东大学学报(工学版), 2016, 46(2): 1-5.
[5] 熊冰妍, 王国胤, 邓维斌. 分级式代价敏感决策树及其在手机换机预测中的应用[J]. 山东大学学报(工学版), 2015, 45(5): 36-42.
[6] 张伶卫,万文强. 基于云计算平台的代价敏感集成学习算法研究[J]. 山东大学学报(工学版), 2012, 42(4): 19-23.
[7] 尹建川1,2, 邹早建1,3, 徐锋1. 一种基于Akaike信息准则的极限学习机[J]. 山东大学学报(工学版), 2011, 41(6): 7-11.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!