您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版) ›› 2010, Vol. 40 ›› Issue (5): 1-7.

• 论文 •    下一篇

一种网络流量分类特征的产生及选择方法

阳爱民1,周咏梅1,邓河2,周剑峰3   

  1. 1.广东外语外贸大学信息科学技术学院, 广东 广州 510420; 2.长沙民政职业技术学院, 湖南 长沙 410004;
    3.广东外语外贸大学国际工商管理学院, 广东 广州 510420
  • 收稿日期:2010-04-02 出版日期:2010-10-16 发布日期:2010-04-02
  • 作者简介:阳爱民(1970-),男,湖南永州人,教授,博士后,研究方向为智能计算、网络流量分类、模糊分类.Email:amyang@mail.gdufs.edu.cn
  • 基金资助:

    广东省科技计划项目(2009B080701031);广东省高等学校人才引进项目。

Method of feature generation and selection for network traffic classification

YANG Ai-min1, ZHOU Yong-mei1, DENG He2, ZHOU Jian-feng3   

  1. 1. School of Informatics, Guangdong University of Foreign Studies, Guangzhou 510420,China;
     2. Changsha Social Work College, Changsha 410004, China;
    3. School of Management, Guangdong University of Foreign Studies, Guangzhou 510420, China
  • Received:2010-04-02 Online:2010-10-16 Published:2010-04-02

摘要:

在基于机器学习方法的网络流量分类系统中,特征产生及特征选择将直接影响到分类的速度及精度。针对这种情况,在特征产生方面,结合Packet-Level和Flow-Level上的信息,对报文属性(大小、个数、时间、标志位)、流的属性(时间)进行分析和研究,产生了37个网络流量统计特征。在特征选择方面,提出一种结合Filter模型和Wrapper模型的网络流量特征选择方法,实现了降维作用。实验表明,提出的方法提高了分类的精度。

关键词: 网络流量分类, 特征产生, 特征选择, 遗传算法

Abstract:

In the System of Network Traffic Classification based on machine learning method, feature generation and feature selection directly affects the speed and accuracy of classification. To solve this problem, in feature generation aspect, we analyze the packet’s attributes (size, count, time, flag) and flow’s attributes (time) from the information of Packet-Level and FlowLevel, and 37 statistical features are generated. In feature selection aspect, we proposes a method of feature selection integrating Filter model and Wrapper model, to decrease the dimension of features. Experiments show the proposed methods improve the accuracy of classification.

Key words: network traffic classification, feature generation, feature selection, feature distance, genetic algorithm

[1] 牟廉明. 自适应特征选择加权k子凸包分类[J]. 山东大学学报(工学版), 2018, 48(5): 32-37.
[2] 陈嘉杰,王金凤. 基于蚁群算法求解Choquet模糊积分模型[J]. 山东大学学报(工学版), 2018, 48(3): 81-87.
[3] 王飞,徐健,李伟,汪新浩,施啸寒. 基于分布式储能系统的风储滚动优化调度方法[J]. 山东大学学报(工学版), 2017, 47(6): 89-94.
[4] 李素姝,王士同,李滔. 基于LS-SVM与模糊补准则的特征选择方法[J]. 山东大学学报(工学版), 2017, 47(3): 34-42.
[5] 方昊,李云. 基于多次随机欠采样和POSS方法的软件缺陷检测[J]. 山东大学学报(工学版), 2017, 47(1): 15-21.
[6] 莫小勇,潘志松,邱俊洋,余亚军,蒋铭初. 基于在线特征选择的网络流异常检测[J]. 山东大学学报(工学版), 2016, 46(4): 21-27.
[7] 王常顺,肖海荣. 基于自抗扰控制的水面无人艇路径跟踪控制器[J]. 山东大学学报(工学版), 2016, 46(4): 54-59.
[8] 刘德宝, 吴耀华, 郭耀阳, 王艳艳. 基于串并行混合拣选策略的自动拣选系统品项分配优化[J]. 山东大学学报(工学版), 2015, 45(6): 36-44.
[9] 董红斌, 张广江, 逄锦伟, 韩启龙. 一种基于协同进化方法的聚类集成算法[J]. 山东大学学报(工学版), 2015, 45(2): 1-9.
[10] 梁兴建, 詹志辉. 基于双模式变异策略的改进遗传算法[J]. 山东大学学报(工学版), 2014, 44(6): 1-7.
[11] 徐晓丹, 段正杰, 陈中育. 基于扩展情感词典及特征加权的情感挖掘方法[J]. 山东大学学报(工学版), 2014, 44(6): 15-18.
[12] 魏小敏,徐彬,关佶红. 基于递归特征消除法的蛋白质能量热点预测[J]. 山东大学学报(工学版), 2014, 44(2): 12-20.
[13] 潘冬寅,朱发,徐昇,业宁*. 结肠癌基因表达谱的特征选取研究[J]. 山东大学学报(工学版), 2012, 42(2): 23-29.
[14] 孙鹏,程世庆*,谢敬思,张海瑞. 预测混合生物质灰熔点的CV-GA-SVM模型[J]. 山东大学学报(工学版), 2012, 42(2): 108-111.
[15] 李霞1,王连喜2,蒋盛益1. 面向不平衡问题的集成特征选择[J]. 山东大学学报(工学版), 2011, 41(3): 7-11.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!