您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版) ›› 2012, Vol. 42 ›› Issue (5): 35-40.

• 机器学习与数据挖掘 • 上一篇    下一篇

基于事件本体的Web不良信息挖掘

刘东慧1,2,姜薇1*   

  1. 1.中国矿业大学计算机科学与技术学院, 江苏 徐州 221000; 2.连云港师范高等专科学校计算机系, 江苏 连云港 222000
  • 收稿日期:2012-05-10 出版日期:2012-10-20 发布日期:2012-05-10
  • 通讯作者: 姜薇(1966- ),女,江苏徐州人,副教授,硕士生导师,主要从事数据挖掘等方面的研究. E-mail:wjiang@cumt.edu.cn
  • 作者简介:刘东慧(1980- ),女,江苏连云港人,硕士研究生,主要从事概念格,信息检索等方面的研究. E-mail:denghuiliu@126.com
  • 基金资助:
    江苏省高校自然科学研究项目(10KJD520008)

Research on Web negative information mining based on event ontology

LIU Dong-hui1,2, JIANG Wei1*   

  1. 1. School of Computer Science and Technology, China University of Mining and Technology, Xuzhou 221000, China; 2. Department of Computers, Lianyungang Teachers’ College, Lianyungang 222000, China
  • Received:2012-05-10 Online:2012-10-20 Published:2012-05-10

摘要: 为挖掘互联网上的不良信息,本研究借鉴了事件语义分析技术。研究了基于事件本体的Web不良信息挖掘方法,重点是事件本体的构建、文本特征重构。为了验证所提方法的有效性,以信息聚类为例实现了一个基于事件本体的Web不良信息挖掘的原型系统。实验结果表明:基于事件本体和k均值的信息聚类方法的平均准确率为721%,较之传统的基于k均值的信息聚类方法的平均准确率提高了5.3%。

关键词: Web挖掘, 不良信息, 聚类, 事件本体, 信息检索

Abstract: In order to mine the negative information on the internet, the eventbased semantic analysis technology was applied. The methods of event ontologybased Web negative information mining, especially event ontology construction and text feature reconstitution were studied. Information clustering was used as an example to validate the methods proposed. A prototype system based on event ontology was implemented. Experimental results showed that the average accuracy obtained by the event ontologybased and kmeans method was 721%, which increased by 53% compared with the traditional kmeans clustering method.

Key words: Web mining, negative information, clustering, event ontology, information retrieval

中图分类号: 

  • TP393
[1] 王换,周忠眉. 一种基于聚类的过抽样算法[J]. 山东大学学报(工学版), 2018, 48(3): 134-139.
[2] 张佩瑞,杨燕,邢焕来,喻琇瑛. 基于核K-means的增量多视图聚类算法[J]. 山东大学学报(工学版), 2018, 48(3): 48-53.
[3] 读习习,刘华锋,景丽萍. 一种融合社交网络的叠加联合聚类推荐模型[J]. 山东大学学报(工学版), 2018, 48(3): 96-102.
[4] 杨天鹏,徐鲲鹏,陈黎飞. 非均匀数据的变异系数聚类算法[J]. 山东大学学报(工学版), 2018, 48(3): 140-145.
[5] 庞人铭,王波,叶昊,张海峰,李明亮. 基于PCA相似度和谱聚类相结合的高炉历史数据聚类[J]. 山东大学学报(工学版), 2017, 47(5): 143-149.
[6] 周旺,张晨麟,吴建鑫. 一种基于Hartigan-Wong和Lloyd的定性平衡聚类算法[J]. 山东大学学报(工学版), 2016, 46(5): 37-44.
[7] 吉兴全,韩国正,李可军,傅荣荣,朱仰贺. 基于密度的改进K均值聚类算法在配网区块划分中的应用[J]. 山东大学学报(工学版), 2016, 46(4): 41-46.
[8] 李朔,石宇良. 基于位置社交网络中地点聚类推荐方法[J]. 山东大学学报(工学版), 2016, 46(3): 44-50.
[9] 江峰,杜军威,刘国柱,眭跃飞. 基于加权的K-modes聚类初始中心选择算法[J]. 山东大学学报(工学版), 2016, 46(2): 29-34.
[10] 樊淑炎, 丁世飞. 基于多尺度的改进Graph cut算法[J]. 山东大学学报(工学版), 2016, 46(1): 28-33.
[11] 徐平安,唐雁,石教开,张辉荣. 基于薛定谔方程的K-Means聚类算法[J]. 山东大学学报(工学版), 2016, 46(1): 34-41.
[12] 马相明, 孙霞, 张强. 轮式装载机典型作业工况构建与分析[J]. 山东大学学报(工学版), 2015, 45(5): 82-87.
[13] 朱红, 丁世飞. 变粒度二次聚类方法[J]. 山东大学学报(工学版), 2015, 45(3): 1-6.
[14] 董红斌, 张广江, 逄锦伟, 韩启龙. 一种基于协同进化方法的聚类集成算法[J]. 山东大学学报(工学版), 2015, 45(2): 1-9.
[15] 浩庆波, 牟少敏, 尹传环, 昌腾腾, 崔文斌. 一种基于聚类的快速局部支持向量机算法[J]. 山东大学学报(工学版), 2015, 45(1): 13-18.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!