您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版)

• 机器学习与数据挖掘 • 上一篇    下一篇

中文微博情感词典构建方法

周咏梅1,阳爱民1,林江豪2   

  1. 1.广东外语外贸大学思科信息学院,广东 广州510006;
    2.广东外语外贸大学管理学院,广东 广州510006
  • 收稿日期:2013-04-30 出版日期:2014-06-20 发布日期:2013-04-30
  • 作者简介:周咏梅(1971- ),女,湖南永州人,教授,主要研究方向为文本情感分析.E-mail:yongmeizhou@163.com
  • 基金资助:
    国家社科基金资助项目(12BYY045);教育部人文社会科学研究青年项目(10YJCZH247);广东省科技计划资助项目(2010B031000014)

A method of building Chinese microblog sentiment lexicon

ZHOU Yongmei1, YANG Aimin1, LIN Jianghao2   

  1. 1.Cisco School of Informatics, Guangdong University of Foreign Studies, Guangzhou 510006, Guangdong, China;
    2. School of Management, Guangdong University of Foreign Studies, Guangzhou 510006, Guangdong, China
  • Received:2013-04-30 Online:2014-06-20 Published:2013-04-30

摘要: 提出了一种中文微博情感词典构建方法。采用上下文熵的网络用语发现策略,通过TFIDF(term frequencyinverse document frequency)进行二次过滤得到网络用语;利用SOPMI(semantic orientationpointwise mutual information)算法在已标注的微博语料库中计算网络用语的情感倾向值,构建网络用语情感词典;将词典应用到微博情感分类实验,并与朴素贝叶斯分类器的分类性能进行了比较分析。实验结果表明,直接利用微博情感词典的分类效果好于朴素贝叶斯分类器,并具有分类过程简单、快速等优势。

关键词: 微博情感词典, 网络用语, 朴素贝叶斯, 情感分析, 上下文熵

Abstract:

A method of building Chinese microblog sentiment lexicon was proposed,which adopted the discovery strategies of context entropy for network language, acquired network languages from the secondary filtration by TF-IDF and computed the sentiment weights of network language by SO-PMI algorithm in the labeled corpus. The built lexicon was applied into the analysis experiments of micro-blog sentiment,which was compared with that of naive bayesian classifier. Experiment results showed that the efficacy of classification by the built micro-blog sentimental lexicon was better than that by naive bayesian classifier,and was simple and rapid in the classification process.

Key words: sentiment analysis, context entropy, microblog sentiment lexicon, network languages, naive Bayesian

[1] 杨修远,彭韬,杨亮,林鸿飞. 基于知识蒸馏的自适应多领域情感分析[J]. 山东大学学报 (工学版), 2021, 51(3): 15-21.
[2] 蔡国永,贺歆灏,储阳阳. 基于空间注意力和卷积神经网络的视觉情感分析[J]. 山东大学学报 (工学版), 2020, 50(4): 8-13.
[3] 蔡国永, 林强, 任凯琪. 基于域对抗网络和BERT的跨领域文本情感分析[J]. 山东大学学报 (工学版), 2020, 50(1): 1-7.
[4] 钱春琳,张兴芳,孙丽华. 基于在线评论情感分析的改进协同过滤推荐模型[J]. 山东大学学报 (工学版), 2019, 49(1): 47-54.
[5] 周荣翔,贾修一. 中文反语识别特征分析[J]. 山东大学学报 (工学版), 2019, 49(1): 41-46.
[6] 屈庆涛,刘其成,牟春晓. 基于N-Gram语言模型的并行自适应新闻话题追踪算法[J]. 山东大学学报 (工学版), 2018, 48(6): 37-43.
[7] 沈冀,马志强,李图雅,张力. 面向短文本情感分析的词扩充LDA模型[J]. 山东大学学报(工学版), 2018, 48(3): 120-126.
[8] 周哲, 商琳. 一种基于动态词典和三支决策的情感分析方法[J]. 山东大学学报(工学版), 2015, 45(1): 19-23.
[9] 于江德1,赵红丹1,郑勃举1,余正涛2. 基于中文人名用字特征的性别判定方法[J]. 山东大学学报(工学版), 2014, 44(1): 13-18.
[10] 周咏梅1,杨佳能2,阳爱民2. 面向文本情感分析的中文情感词典构建方法[J]. 山东大学学报(工学版), 2013, 43(6): 27-33.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 李 侃 . 嵌入式相贯线焊接控制系统开发与实现[J]. 山东大学学报(工学版), 2008, 38(4): 37 -41 .
[2] 来翔 . 用胞映射方法讨论一类MKdV方程[J]. 山东大学学报(工学版), 2006, 36(1): 87 -92 .
[3] 余嘉元1 , 田金亭1 , 朱强忠2 . 计算智能在心理学中的应用[J]. 山东大学学报(工学版), 2009, 39(1): 1 -5 .
[4] 陈瑞,李红伟,田靖. 磁极数对径向磁轴承承载力的影响[J]. 山东大学学报(工学版), 2018, 48(2): 81 -85 .
[5] 王波,王宁生 . 机电装配体拆卸序列的自动生成及组合优化[J]. 山东大学学报(工学版), 2006, 36(2): 52 -57 .
[6] 张英,郎咏梅,赵玉晓,张鉴达,乔鹏,李善评 . 由EGSB厌氧颗粒污泥培养好氧颗粒污泥的工艺探讨[J]. 山东大学学报(工学版), 2006, 36(4): 56 -59 .
[7] Yue Khing Toh1 , XIAO Wendong2 , XIE Lihua1 . 基于无线传感器网络的分散目标跟踪:实际测试平台的开发应用(英文)[J]. 山东大学学报(工学版), 2009, 39(1): 50 -56 .
[8] 刘忠国,张晓静,刘伯强,刘常春 . 视觉刺激间隔对大脑诱发电位的影响[J]. 山东大学学报(工学版), 2006, 36(3): 34 -38 .
[9] 孙炜伟,王玉振. 考虑饱和的发电机单机无穷大系统有限增益镇定[J]. 山东大学学报(工学版), 2009, 39(1): 69 -76 .
[10] 杨发展1 ,艾兴1 ,赵军1 ,侯建锋2 . ZrO2含量对WC基复合材料的力学性能和微观结构的影响[J]. 山东大学学报(工学版), 2009, 39(1): 92 -95 .