%A 林江豪,周咏梅,阳爱民,陈锦 %T 基于词向量的领域情感词典构建 %0 Journal Article %D 2018 %J 山东大学学报 (工学版) %R 10.6040/j.issn.1672-3961.0.2017.403 %P 40-47 %V 48 %N 3 %U {http://gxbwk.njournal.sdu.edu.cn/CN/abstract/article_1733.shtml} %8 2018-06-20 %X 针对现有领域情感词典在情感和语义表达等方面的不足,提出一种基于词向量的领域情感词典构建方法。利用25万篇新闻语料和10万余条酒店评论数据,训练得到word2vec模型;选择80个情感明显、内容丰富、词性多样化的情感词作为种子词集;利用TF-IDF值在词汇重要程度的度量作用,在酒店评论中获得9 860个领域候选情感词汇;通过计算候选情感词与种子词的词向量之间的语义相似度,将情感词映射到高维向量空间,实现了情感词的特征向量表示(Senti2vec)。将Senti2vec应用于情感词极性分类和文本情感分析任务中,试验结果表明,Senti2vec能实现情感词的语义表示和情感表示;基于特定领域语料的语义相似计算,使得提取的情感特征更具有领域特性,同时不受候选情感词集范围的约束。