您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版) ›› 2012, Vol. 42 ›› Issue (6): 1-7.

• 机器学习与数据挖掘 •    下一篇

一种面向入侵检测的半监督聚类算法

夏战国,万玲,蔡世玉,孙鹏辉   

  1. 中国矿业大学计算机科学与技术学院, 江苏 徐州 221116
  • 收稿日期:2012-04-20 出版日期:2012-12-20 发布日期:2012-04-20
  • 作者简介:夏战国(1974- ),男,河北保定人,副教授,硕士生导师,主要研究方向为机器学习与数据挖掘. E-mail:xiazg@cumt.edu.cn
  • 基金资助:
    国家自然科学基金资助项目(50674086);高等学校博士学科点专项科研基金资助项目(20100095110003)

A semi-supervised clustering algorithm oriented to intrusion detection

XIA Zhan-guo, WAN Ling, CAI Shi-yu, SUN Peng-hui   

  1. School of Computer Science and Technology, China University of Mining and Technology, Xuzhou 221116, China
  • Received:2012-04-20 Online:2012-12-20 Published:2012-04-20

摘要: 为了解决传统的入侵检测聚类算法准确率较低这个问题,结合半监督学习的思想,提出了一种面向入侵检测的半监督聚类算法。首先利用样本数据集中的部分标记数据,生成用于初始化聚类的种子集,通过计算样本数据集中标记点与每个类簇中标记点均值的欧氏距离,得到每类的初始聚类中心,实现了入侵检测数据的准确识别。该算法有效地避免了传统聚类算法中初始聚类中心选择的盲目性和随机性,提高了检测率。实验结果表明,在处理入侵检测数据时,该算法能够充分利用少量类标记信息进行半监督学习,较传统的K-means算法聚类效果更好,检测准确率更高。

关键词: 半监督学习, 半监督聚类, 入侵检测, K-均值, 检测率

Abstract: The detection rate of the traditional intrusion detection clustering algorithm is low. We combined the idea of semi-supervised learning and proposed a semi-supervised clustering algorithm oriented intrusion detection in order to improve it. Based on the part of the labeled data in the sample dataset, we generated the Seed set for initializing the cluster. The accuracy recognition of the intrusion detection data was achieved by calculating the Euclidean distance between the labeled data in the sample dataset and the average value of labeled data in each cluster and getting the initial center point. The blindness and randomness of the traditional cluster algorithm were avoided when choosing the initial center point. Furthermore, the efficiency of the detection was also improved. Experimental results showed that the proposed algorithm could utilize less label information via semi-supervised learning, and could achieve a higher efficiency than the traditional K-means method when dealing with intrusion detection dataset.

Key words: semi-supervised learning, semi-supervised clustering, intrusion detection, K-means, detection rate

中图分类号: 

  • TP181
[1] 肖苗苗,魏本征,尹义龙. 基于BFOA和K-means的复合入侵检测算法[J]. 山东大学学报(工学版), 2018, 48(3): 115-119.
[2] 孔超1,2,张化祥1,2*,刘丽1,2. 基于兴趣区域特征融合的半监督图像检索算法[J]. 山东大学学报(工学版), 2014, 44(3): 22-28.
[3] 李春彦,刘怡良,王良民*. 车载自组网中基于交通场景的入侵行为检测机制[J]. 山东大学学报(工学版), 2014, 44(1): 29-34.
[4] 王昊,华继学,范晓诗. 基于双联支持向量机的入侵检测技术[J]. 山东大学学报(工学版), 2013, 43(6): 53-56.
[5] 李雅林1,2,张化祥1,2*,冯新营1,2. 一种新的基于半监督的多标记学习算法[J]. 山东大学学报(工学版), 2013, 43(2): 18-22.
[6] 丁彦,李永忠*. 基于PCA和半监督聚类的入侵检测算法研究[J]. 山东大学学报(工学版), 2012, 42(5): 41-46.
[7] 谢伙生,刘敏. 一种基于主动学习的集成协同训练算法[J]. 山东大学学报(工学版), 2012, 42(3): 1-5.
[8] 张友新,王立宏. 两阶段近邻传播半监督聚类算法[J]. 山东大学学报(工学版), 2012, 42(2): 18-22.
[9] 魏巍,张艳宁. 基于半监督隐含狄利克雷分配的人脸姿态判别方法[J]. 山东大学学报(工学版), 2011, 41(3): 17-22.
[10] 宿洪禄,李凡长*. 基于相异性和不变特征的半监督图像检索[J]. 山东大学学报(工学版), 2010, 40(5): 150-153.
[11] 崔宝今 林鸿飞 张霄. 基于半监督学习的蛋白质关系抽取研究[J]. 山东大学学报(工学版), 2009, 39(3): 16-21.
[12] 周广通,尹义龙,郭文鹃,任春晓. 基于协同训练的指纹图像分割算法[J]. 山东大学学报(工学版), 2009, 39(1): 22-26.
[13] 刘元勋,徐秋亮,云晓春 . 面向入侵检测系统的通用应用层协议识别技术研究[J]. 山东大学学报(工学版), 2007, 37(1): 65-69 .
[14] 高小伟,蒋晓芸 . BP神经网络在入侵检测系统中的应用及优化[J]. 山东大学学报(工学版), 2006, 36(6): 107-110 .
[15] 姜政,江铭炎 . 一种基于K-均值聚类优化的快速分形图像压缩算法[J]. 山东大学学报(工学版), 2006, 36(3): 22-25 .
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!