您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版) ›› 2012, Vol. 42 ›› Issue (5): 41-46.

• 机器学习与数据挖掘 • 上一篇    下一篇

基于PCA和半监督聚类的入侵检测算法研究

丁彦,李永忠*   

  1. 江苏科技大学计算机科学与工程学院, 江苏 镇江 212003
  • 收稿日期:2012-05-06 出版日期:2012-10-20 发布日期:2012-05-06
  • 通讯作者: 李永忠(1961- ),男,甘肃兰州人,教授,硕士生导师,主要研究方向为网络安全、计算机应用、藏文信息处理. E-mail:liyongzhong61@163.com
  • 作者简介:丁彦(1988- ),男,江苏镇江人,硕士研究生,主要研究方向为网络与信息安全. E-mail:jkddy@qq.com
  • 基金资助:
    江苏省高校自然科学基金资助项目(05KJD52006);江苏科技大学科研资助项目(2005DX006J)

Research on intrusion detection algorithm based on PCA and semisupervised clustering

DING Yan, LI Yong-zhong*   

  1. School of Computer Science and Engineering, Jiangsu University of Science and Technology, Zhenjiang 212003, China
  • Received:2012-05-06 Online:2012-10-20 Published:2012-05-06

摘要: 针对网络入侵检测数据存在大量冗余信息和传统聚类算法对离群点检测不足的问题,提出一种基于主成分分析(principal component analysis, PCA)和半监督聚类的入侵检测算法。首先使用PCA对数据进行特征提取,消除数据间的冗余属性;然后利用少量已标记样本和成对约束信息,通过引入竞争凝聚让系统主动学习,以实现对大量未知样本的检测。在入侵检测数据集和UCI基准数据集上的实验结果表明,该算法能有效提高系统的性能。

关键词: 入侵检测, PCA, 半监督聚类, 成对约束, 竞争凝聚

Abstract: In order to solve the problem that lots of redundant information existed in network intrusion detection data and the traditional clustering algorithms were inadequate for detecting outlier, an intrusion detection algorithm based on principal component analysis(PCA) and semisupervised clustering was proposed. First, the features of data were extracted by using PCA, and the redundant attributes among the data were eliminated. Then, a few labeled samples and pairwise constraints information were exploited, and competitive agglomeration was introduced to letting the system active learning in order that the detection of lots of unknown samples could be realized. The experimental results on intrusion detection data set and UCI benchmark data sets showed that this algorithm could effectively improve the system performance.

Key words: intrusion detection, principal component analysis (PCA), semisupervised clustering, pairwise constraints, competitive agglomeration

中图分类号: 

  • TP393.08
[1] 肖苗苗,魏本征,尹义龙. 基于BFOA和K-means的复合入侵检测算法[J]. 山东大学学报(工学版), 2018, 48(3): 115-119.
[2] 张米露,王天真,汤天浩,辛斌. 一种模式关联主元分析的海流机故障检测方法[J]. 山东大学学报(工学版), 2017, 47(5): 123-129.
[3] 庞人铭,王波,叶昊,张海峰,李明亮. 基于PCA相似度和谱聚类相结合的高炉历史数据聚类[J]. 山东大学学报(工学版), 2017, 47(5): 143-149.
[4] 李春彦,刘怡良,王良民*. 车载自组网中基于交通场景的入侵行为检测机制[J]. 山东大学学报(工学版), 2014, 44(1): 29-34.
[5] 王昊,华继学,范晓诗. 基于双联支持向量机的入侵检测技术[J]. 山东大学学报(工学版), 2013, 43(6): 53-56.
[6] 夏战国,万玲,蔡世玉,孙鹏辉. 一种面向入侵检测的半监督聚类算法[J]. 山东大学学报(工学版), 2012, 42(6): 1-7.
[7] 张友新,王立宏. 两阶段近邻传播半监督聚类算法[J]. 山东大学学报(工学版), 2012, 42(2): 18-22.
[8] 张道强. 知识保持的嵌入方法[J]. 山东大学学报(工学版), 2010, 40(2): 1-10.
[9] 刘元勋,徐秋亮,云晓春 . 面向入侵检测系统的通用应用层协议识别技术研究[J]. 山东大学学报(工学版), 2007, 37(1): 65-69 .
[10] 高小伟,蒋晓芸 . BP神经网络在入侵检测系统中的应用及优化[J]. 山东大学学报(工学版), 2006, 36(6): 107-110 .
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!