您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版) ›› 2012, Vol. 42 ›› Issue (6): 1-7.

• 机器学习与数据挖掘 •    下一篇

一种面向入侵检测的半监督聚类算法

夏战国,万玲,蔡世玉,孙鹏辉   

  1. 中国矿业大学计算机科学与技术学院, 江苏 徐州 221116
  • 收稿日期:2012-04-20 出版日期:2012-12-20 发布日期:2012-04-20
  • 作者简介:夏战国(1974- ),男,河北保定人,副教授,硕士生导师,主要研究方向为机器学习与数据挖掘. E-mail:xiazg@cumt.edu.cn
  • 基金资助:
    国家自然科学基金资助项目(50674086);高等学校博士学科点专项科研基金资助项目(20100095110003)

A semi-supervised clustering algorithm oriented to intrusion detection

XIA Zhan-guo, WAN Ling, CAI Shi-yu, SUN Peng-hui   

  1. School of Computer Science and Technology, China University of Mining and Technology, Xuzhou 221116, China
  • Received:2012-04-20 Online:2012-12-20 Published:2012-04-20

摘要: 为了解决传统的入侵检测聚类算法准确率较低这个问题,结合半监督学习的思想,提出了一种面向入侵检测的半监督聚类算法。首先利用样本数据集中的部分标记数据,生成用于初始化聚类的种子集,通过计算样本数据集中标记点与每个类簇中标记点均值的欧氏距离,得到每类的初始聚类中心,实现了入侵检测数据的准确识别。该算法有效地避免了传统聚类算法中初始聚类中心选择的盲目性和随机性,提高了检测率。实验结果表明,在处理入侵检测数据时,该算法能够充分利用少量类标记信息进行半监督学习,较传统的K-means算法聚类效果更好,检测准确率更高。

关键词: 半监督学习, 半监督聚类, 入侵检测, K-均值, 检测率

Abstract: The detection rate of the traditional intrusion detection clustering algorithm is low. We combined the idea of semi-supervised learning and proposed a semi-supervised clustering algorithm oriented intrusion detection in order to improve it. Based on the part of the labeled data in the sample dataset, we generated the Seed set for initializing the cluster. The accuracy recognition of the intrusion detection data was achieved by calculating the Euclidean distance between the labeled data in the sample dataset and the average value of labeled data in each cluster and getting the initial center point. The blindness and randomness of the traditional cluster algorithm were avoided when choosing the initial center point. Furthermore, the efficiency of the detection was also improved. Experimental results showed that the proposed algorithm could utilize less label information via semi-supervised learning, and could achieve a higher efficiency than the traditional K-means method when dealing with intrusion detection dataset.

Key words: semi-supervised learning, semi-supervised clustering, intrusion detection, K-means, detection rate

中图分类号: 

  • TP181
[1] 刘财辉,周琪,叶晓文. 一种基于改进ReliefF算法的入侵检测模型[J]. 山东大学学报 (工学版), 2023, 53(2): 1-10.
[2] 尹旭,刘兆英,张婷,李玉鑑. 基于弱监督和半监督学习的红外舰船分割方法[J]. 山东大学学报 (工学版), 2022, 52(2): 99-106.
[3] 朱恒东, 马盈仓, 代雪珍. 自适应半监督邻域聚类算法[J]. 山东大学学报 (工学版), 2021, 51(4): 24-34.
[4] 张海军,陈映辉. 语义分析及向量化大数据跨站脚本攻击智检[J]. 山东大学学报 (工学版), 2020, 50(2): 118-128.
[5] 肖苗苗,魏本征,尹义龙. 基于BFOA和K-means的复合入侵检测算法[J]. 山东大学学报(工学版), 2018, 48(3): 115-119.
[6] 孔超1,2,张化祥1,2*,刘丽1,2. 基于兴趣区域特征融合的半监督图像检索算法[J]. 山东大学学报(工学版), 2014, 44(3): 22-28.
[7] 李春彦,刘怡良,王良民*. 车载自组网中基于交通场景的入侵行为检测机制[J]. 山东大学学报(工学版), 2014, 44(1): 29-34.
[8] 王昊,华继学,范晓诗. 基于双联支持向量机的入侵检测技术[J]. 山东大学学报(工学版), 2013, 43(6): 53-56.
[9] 李雅林1,2,张化祥1,2*,冯新营1,2. 一种新的基于半监督的多标记学习算法[J]. 山东大学学报(工学版), 2013, 43(2): 18-22.
[10] 丁彦,李永忠*. 基于PCA和半监督聚类的入侵检测算法研究[J]. 山东大学学报(工学版), 2012, 42(5): 41-46.
[11] 谢伙生,刘敏. 一种基于主动学习的集成协同训练算法[J]. 山东大学学报(工学版), 2012, 42(3): 1-5.
[12] 张友新,王立宏. 两阶段近邻传播半监督聚类算法[J]. 山东大学学报(工学版), 2012, 42(2): 18-22.
[13] 魏巍,张艳宁. 基于半监督隐含狄利克雷分配的人脸姿态判别方法[J]. 山东大学学报(工学版), 2011, 41(3): 17-22.
[14] 宿洪禄,李凡长*. 基于相异性和不变特征的半监督图像检索[J]. 山东大学学报(工学版), 2010, 40(5): 150-153.
[15] 崔宝今 林鸿飞 张霄. 基于半监督学习的蛋白质关系抽取研究[J]. 山东大学学报(工学版), 2009, 39(3): 16-21.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 王素玉,艾兴,赵军,李作丽,刘增文 . 高速立铣3Cr2Mo模具钢切削力建模及预测[J]. 山东大学学报(工学版), 2006, 36(1): 1 -5 .
[2] 李 侃 . 嵌入式相贯线焊接控制系统开发与实现[J]. 山东大学学报(工学版), 2008, 38(4): 37 -41 .
[3] 孔祥臻,刘延俊,王勇,赵秀华 . 气动比例阀的死区补偿与仿真[J]. 山东大学学报(工学版), 2006, 36(1): 99 -102 .
[4] 来翔 . 用胞映射方法讨论一类MKdV方程[J]. 山东大学学报(工学版), 2006, 36(1): 87 -92 .
[5] 余嘉元1 , 田金亭1 , 朱强忠2 . 计算智能在心理学中的应用[J]. 山东大学学报(工学版), 2009, 39(1): 1 -5 .
[6] 陈瑞,李红伟,田靖. 磁极数对径向磁轴承承载力的影响[J]. 山东大学学报(工学版), 2018, 48(2): 81 -85 .
[7] 李可,刘常春,李同磊 . 一种改进的最大互信息医学图像配准算法[J]. 山东大学学报(工学版), 2006, 36(2): 107 -110 .
[8] 季涛,高旭,孙同景,薛永端,徐丙垠 . 铁路10 kV自闭/贯通线路故障行波特征分析[J]. 山东大学学报(工学版), 2006, 36(2): 111 -116 .
[9] 浦剑1 ,张军平1 ,黄华2 . 超分辨率算法研究综述[J]. 山东大学学报(工学版), 2009, 39(1): 27 -32 .
[10] 张英,郎咏梅,赵玉晓,张鉴达,乔鹏,李善评 . 由EGSB厌氧颗粒污泥培养好氧颗粒污泥的工艺探讨[J]. 山东大学学报(工学版), 2006, 36(4): 56 -59 .