您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版)

• 机器学习与数据挖掘 • 上一篇    下一篇

基于SimRank的百度百科词条语义相似度计算

尹坤,尹红风*,杨燕,贾真   

  1. 西南交通大学信息科学与技术学院, 四川 成都 610031
  • 收稿日期:2013-06-28 出版日期:2014-06-20 发布日期:2013-06-28
  • 通讯作者: 尹红风(1964- ),男,河南夏邑人,教授,博士,主要研究方向为大数据处理,语义网,搜索引擎. E-mail: hongfeng-yin2002@yahoo.com
  • 作者简介:尹坤(1986- ),男,湖北黄冈人,硕士研究生,主要研究方向为自然语言理解. E-mail:yinkun6514@163.com
  • 基金资助:
    国家自然科学基金资助项目 (61152001,61170111 );中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题资助项目(20110102 );中央高校基本科研业务费专项资金资助项目(SWJTU11ZT08 )

Semantic similarity computation of Baidu encyclopedia entries based on SimRank

YIN Kun, YIN Hongfeng*, YANG Yan, JIA Zhen   

  1. School of Information Science & Technology, Southwest Jiaotong University, Chengdu 610031, Sichuan, China
  • Received:2013-06-28 Online:2014-06-20 Published:2013-06-28

摘要: 提出一种利用百度百科半结构化数据自动获取词语相似度的方法,该方法将百科词条与其相关词条看做有向图的两个节点,且两节点相互之间存在着链接关系,然后利用SimRank算法计算百科词条语义相似度。实验表明,该方法优于传统的词语语义相似度测量,能准确地反映词语之间的语义关系。

关键词: 语义相似度, SimRank, 百科词条, 有向图

Abstract: The measurement of the semantic similarity using semistructured data on Baidu encyclopedia was proposed. The encyclopedia entries and related entries were considered as two nodes of a directed graph, of which there was a link between two nodes. Then SimRank algorithm was used to calculate the semantic similarity of encyclopedia entries. Experimental results showed that the proposed measure significantly outperformed the traditional similarity measures, and might accurately reflect  the semantic relationship between words.

Key words: oriented graph, SimRank, semantic similarity, encyclopedia entry

[1] 林江豪,周咏梅,阳爱民,陈锦. 基于词向量的领域情感词典构建[J]. 山东大学学报(工学版), 2018, 48(3): 40-47.
[2] 徐庆, 段利国, 李爱萍, 阴桂梅. 基于实体词语义相似度的中文实体关系抽取[J]. 山东大学学报(工学版), 2015, 45(6): 7-15.
[3] 钱肃驰, 彭甫镕, 陆建峰. 基于语义相似度的标签优化[J]. 山东大学学报(工学版), 2015, 45(2): 37-42.
[4] 巩敦卫,孙晓燕,任洁.

基于联赛评价和知识提取的交互式遗传算法

[J]. 山东大学学报(工学版), 2009, 39(2): 1-7.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!