山东大学学报 (工学版) ›› 2022, Vol. 52 ›› Issue (4): 131-138.doi: 10.6040/j.issn.1672-3961.0.2021.311

  1. 1.北京交通大学计算机与信息技术学院, 北京 100044;2.北京新纽科技有限公司, 北京 100044
  • 发布日期:2022-08-24
  • 作者简介:孙志巍(1998— ),女,安徽阜阳人,硕士研究生,主要研究方向为自然语言处理及主题模型. E-mail:19120401@bjtu.edu.cn. *通信作者简介:景丽萍(1978— ),女,河南南阳人,教授,博士,博士生导师,主要研究方向为机器学习及其应用. E-mail:lpjing@bjtu.edu.cn
Context-aware discriminative topic model

SUN Zhiwei1, SONG Mingyang1, PAN Zehua2, JING Liping1*   

  1. 1. School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044, China;
    2. Beijing Newlink Technology Co., Ltd., Beijing 100044, China
  • Published:2022-08-24

摘要: 为了解决主题识别过程中词的上下文语境缺失问题,通过卷积神经网络将特定的上下文信息嵌入到词向量中,再将词向量输入到判别式主题模型中。本方法可以融合附加标签信息进行有监督的训练,处理文档分类等下游任务。通过与现有判别式主题模型进行对比和分析,能够获取到更加连贯的主题,同时在文本分类任务上表现出更好的预测性能,从而验证了方法的有效性和准确性。

关键词: 主题模型, 词嵌入表示, 判别式模型, 上下文语义, 文本分类


