您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版) ›› 2013, Vol. 43 ›› Issue (6): 27-33.

• 机器学习与数据挖掘 • 上一篇    下一篇

面向文本情感分析的中文情感词典构建方法

周咏梅1,杨佳能2,阳爱民2   

  1. 1. 广东外语外贸大学思科信息学院, 广东 广州 510006;
    2. 广东外语外贸大学国际工商管理学院,广东 广州 510006
  • 收稿日期:2013-04-30 出版日期:2013-12-20 发布日期:2013-04-30
  • 作者简介:周咏梅(1971- ),女,湖南永州人,教授,硕士,主要研究方向为文本情感分析.Email: yongmeizhou@163.com
  • 基金资助:

    国家社科基金资助项目(12BYY045);教育部人文社会科学研究青年资助项目(10YJCZH247);广东省科技计划资助项目(2010B031000014)

A method on building Chinese sentiment lexicon for text sentiment analysis

ZHOU Yong-mei1, YANG Jia-neng2, YANG Ai-min1   

  1. 1. Cisco School of Informatics, Guangdong University of Foreign Studies, Guangzhou 510006, China;
    2. School of Management, Guangdong University of Foreign Studies, Guangzhou 510006, China
  • Received:2013-04-30 Online:2013-12-20 Published:2013-04-30

摘要:

提出了构建基于HowNet和SentiWordNet的中文情感词典方法。将词语自动分解为多个义元后计算其情感倾向强度,并且使用词典校对方法对词语情感倾向强度进行优化。将所构建词典应用到文本情感分析任务中,使用支持向量机构建文本情感分类器进行实验。实验结果表明,该词典优于一般极性情感词典,为情感分析研究提供了有效的词典资源。

关键词: 中文文本, 情感强度, 情感词典, 情感分析, 支持向量机

Abstract:

A method on building Chinese sentiment lexicon based on HowNet and SentiWordNet was proposed,in which sentiment intensity of the word was automatically calculated by decomposing it into multiple semantic units and a lexicon proofreading technique was used to optimize the value of sentiment intensity of the word. The building lexicon was applied to the task of sentiment analysis, in which the support vector machine was used to build the sentiment classifier. The experiment results showed that the built sentiment lexicon was more effective than the general polar sentiment lexicon,and provided an effective dictionary resource for the research of sentiment analysis.

[1] 亓晓燕,刘恒杰,侯秋华,刘啸宇,谭延超,王连成. 融合LSTM和SVM的钢铁企业电力负荷短期预测[J]. 山东大学学报 (工学版), 2021, 51(4): 91-98.
[2] 杨修远,彭韬,杨亮,林鸿飞. 基于知识蒸馏的自适应多领域情感分析[J]. 山东大学学报 (工学版), 2021, 51(3): 15-21.
[3] 蔡国永,贺歆灏,储阳阳. 基于空间注意力和卷积神经网络的视觉情感分析[J]. 山东大学学报 (工学版), 2020, 50(4): 8-13.
[4] 马昕,王雪. 基于Laplacian支持向量机和序列信息的microRNA-结合残基预测[J]. 山东大学学报 (工学版), 2020, 50(2): 76-82.
[5] 蔡国永, 林强, 任凯琪. 基于域对抗网络和BERT的跨领域文本情感分析[J]. 山东大学学报 (工学版), 2020, 50(1): 1-7.
[6] 梁志祥,刘晓明,牟颖,刘玉田. 基于深度学习的新能源爬坡事件预测方法[J]. 山东大学学报 (工学版), 2019, 49(5): 24-28.
[7] 高明霞,李经纬. 基于word2vec词模型的中文短文本分类方法[J]. 山东大学学报 (工学版), 2019, 49(2): 34-41.
[8] 严云洋,张慧珍,刘以安,高尚兵. 基于GMM与三维LBP纹理的视频火焰检测[J]. 山东大学学报 (工学版), 2019, 49(1): 1-9.
[9] 周荣翔,贾修一. 中文反语识别特征分析[J]. 山东大学学报 (工学版), 2019, 49(1): 41-46.
[10] 钱春琳,张兴芳,孙丽华. 基于在线评论情感分析的改进协同过滤推荐模型[J]. 山东大学学报 (工学版), 2019, 49(1): 47-54.
[11] 李兴,侯振杰,梁久祯,常兴治. 基于线性加速度的多节点人体行为识别[J]. 山东大学学报 (工学版), 2018, 48(6): 56-66.
[12] 叶明全,高凌云,万春圆. 基于人工蜂群和SVM的基因表达数据分类[J]. 山东大学学报(工学版), 2018, 48(3): 10-16.
[13] 林江豪,周咏梅,阳爱民,陈锦. 基于词向量的领域情感词典构建[J]. 山东大学学报(工学版), 2018, 48(3): 40-47.
[14] 沈冀,马志强,李图雅,张力. 面向短文本情感分析的词扩充LDA模型[J]. 山东大学学报(工学版), 2018, 48(3): 120-126.
[15] 韩学山,王俊雄,孙东磊,李文博,张心怡,韦志清. 计及空间关联冗余的节点负荷预测方法[J]. 山东大学学报(工学版), 2017, 47(6): 7-12.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 张永花,王安玲,刘福平 . 低频非均匀电磁波在导电界面的反射相角[J]. 山东大学学报(工学版), 2006, 36(2): 22 -25 .
[2] 孔祥臻,刘延俊,王勇,赵秀华 . 气动比例阀的死区补偿与仿真[J]. 山东大学学报(工学版), 2006, 36(1): 99 -102 .
[3] 来翔 . 用胞映射方法讨论一类MKdV方程[J]. 山东大学学报(工学版), 2006, 36(1): 87 -92 .
[4] 余嘉元1 , 田金亭1 , 朱强忠2 . 计算智能在心理学中的应用[J]. 山东大学学报(工学版), 2009, 39(1): 1 -5 .
[5] 李梁,罗奇鸣,陈恩红. 对象级搜索中基于图的对象排序模型(英文)[J]. 山东大学学报(工学版), 2009, 39(1): 15 -21 .
[6] 季涛,高旭,孙同景,薛永端,徐丙垠 . 铁路10 kV自闭/贯通线路故障行波特征分析[J]. 山东大学学报(工学版), 2006, 36(2): 111 -116 .
[7] 秦通,孙丰荣*,王丽梅,王庆浩,李新彩. 基于极大圆盘引导的形状插值实现三维表面重建[J]. 山东大学学报(工学版), 2010, 40(3): 1 -5 .
[8] 孙殿柱,朱昌志,李延瑞 . 散乱点云边界特征快速提取算法[J]. 山东大学学报(工学版), 2009, 39(1): 84 -86 .
[9] 胡天亮,李鹏,张承瑞,左毅 . 基于VHDL的正交编码脉冲电路解码计数器设计[J]. 山东大学学报(工学版), 2008, 38(3): 10 -13 .
[10] 卜德云 张道强. 自适应谱聚类算法研究[J]. 山东大学学报(工学版), 2009, 39(5): 22 -26 .