您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版) ›› 2011, Vol. 41 ›› Issue (4): 79-84.

• 论文 • 上一篇    下一篇

基于通信系统的决策树构造算法

张小峰,张志旺,逄珊   

  1. 鲁东大学信息科学与工程学院, 山东 烟台 264025
  • 收稿日期:2011-04-15 出版日期:2011-08-16 发布日期:2011-04-15
  • 作者简介:张小峰(1978- ),男,山东烟台人,讲师,硕士,主要研究方向为图像处理,数据挖掘等. E-mail: iamzxf@ldu.edu.cn
  • 基金资助:

    山东省自然科学基金资助项目(Y2008E11)

Algorithm based on communication system for constructing decision tree

ZHANG Xiao-feng, ZHANG Zhi-wang, PANG Shan   

  1. School of Information Science and Engineering, Ludong University, Yantai 264025, China
  • Received:2011-04-15 Online:2011-08-16 Published:2011-04-15

摘要:

决策树构造过程中的属性选择标准一直是数据挖掘领域的研究热点。本研究在分析ID3算法和C4.5算法属性选择策略的基础上,基于通信系统中的平均自信息与平均互信息提出了两种决策树的构造算法。研究过程中从理论证明了所提出的两种算法与ID3算法以及C4.5算法是等价的,即,信息增益等价于通信系统中的平均互信息,而信息增益率等价于通信系统中平均互信息与平均自信息的比值。在AllElectronics数据集进行的实验表明:与信息增益和信息增益率相比,本研究提出的属性选择标准具有计算方便、且容易理解的特点。

关键词: 决策树, 信息增益, 信息增益率, 平均互信息,

Abstract:

Attribute selection criterion in constructing decision trees is always the focus in the area of data mining. Based on the analysis of ID3 and C4.5, this paper proposes two algorithms based on average self-information and average mutual-information in communication system. In this research, we prove that the two proposed algorithms are equivalent to ID3 and C4.5. That is, information gain is equivalent to average mutual information in communication system, and information gain ratio is the same as the ratio of average mutual information to the entropy. Experiments on AllElectrionics illustrate that compared with information gain and information gain ratio, attribute selection criteria proposed in this paper are easy to compute and understand.

Key words:  decision tree, information gain, information gain ratio, average mutualinformation, entropy

[1] 邱路,叶银忠,姜春娣. 基于小波奇异熵和SOM神经网络的微电网系统故障诊断[J]. 山东大学学报(工学版), 2017, 47(5): 118-122.
[2] 吴建萍,姜斌,刘剑慰. 基于小波包信息熵和小波神经网络的异步电机故障诊断[J]. 山东大学学报(工学版), 2017, 47(5): 223-228.
[3] 林耀进,张佳,林梦雷,王娟. 一种基于模糊信息熵的协同过滤推荐方法[J]. 山东大学学报(工学版), 2016, 46(5): 13-20.
[4] 张佳,林耀进,林梦雷,刘景华,李慧宗. 基于信息熵的协同过滤算法[J]. 山东大学学报(工学版), 2016, 46(2): 43-50.
[5] 郭逾,张二华,刘驰. 一种基于频域特征和过渡段判决的端点检测算法[J]. 山东大学学报(工学版), 2016, 46(2): 57-63.
[6] 熊冰妍, 王国胤, 邓维斌. 分级式代价敏感决策树及其在手机换机预测中的应用[J]. 山东大学学报(工学版), 2015, 45(5): 36-42.
[7] 宋冬梅, 刘春晓, 沈晨, 石学法, 臧琳, 冯文强. 基于主客观赋权法的多目标多属性决策方法[J]. 山东大学学报(工学版), 2015, 45(4): 1-9.
[8] 辛丽玲, 何威, 于剑, 贾彩燕. 一种基于密度差异的离群点检测算法[J]. 山东大学学报(工学版), 2015, 45(3): 7-14.
[9] 周咏梅1,阳爱民1,林江豪2. 中文微博情感词典构建方法[J]. 山东大学学报(工学版), 2014, 44(3): 36-40.
[10] 潘盼1,王熙照2,翟俊海2. 基于有序决策树的改进归纳算法[J]. 山东大学学报(工学版), 2014, 44(1): 41-44.
[11] 贺思艳1,李鹏2,刘澄玉2,吴学谦2,陈启军3. 互模糊熵中隶属函数的改进和影响分析[J]. 山东大学学报(工学版), 2014, 44(1): 63-68.
[12] 许春耀1,2, 陈明志3*, 余轮1. 适应用户需求变化的前摄推荐模型[J]. 山东大学学报(工学版), 2013, 43(3): 1-6.
[13] 李慧1,2,胡云1,3,李存华1. 基于粗糙集理论的瓦斯灾害信息特征提取技术[J]. 山东大学学报(工学版), 2012, 42(5): 91-95.
[14] 赖艳华,魏露露,吕明新,赵琳妍,岳虹,刘存芳. 基于最小熵产法的大功率LED散热器的结构优化[J]. 山东大学学报(工学版), 2012, 42(5): 118-122.
[15] 于江德1,周宏宇1,余正涛2. 汉语词性标注的特征工程[J]. 山东大学学报(工学版), 2011, 41(6): 12-17.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!