山东大学学报(工学版) ›› 2014, Vol. 44 ›› Issue (6): 15-18.doi: 10.6040/j.issn.1672-3961.1.2014.108
徐晓丹, 段正杰, 陈中育
XU Xiaodan, DUAN Zhengjie, CHEN Zhongyu
摘要: 针对情感分类中采用单一特征分类精度不高的问题,提出多特征加权的分类算法:根据扩展的情感词典计算每个词的情感倾向度,经CHI特征选择后,根据情感词的极性强度调整贝叶斯分类模型中该词的正负后验概率,在原值的基础上加上极性强度影响值。实验将该方法和其他3种单特征选择方法在酒店、影视等语料上的分类精度进行了对比,分类精度得到提升。实验结果表明,将词语的情感倾向度的特征融入到分类器中方法,在有效提高情感倾向性分类精度的同时降低了特征维数。
