山东大学学报(工学版) ›› 2014, Vol. 44 ›› Issue (1): 7-12.doi: 10.6040/j.issn.1672-3961.0.2013.141
翟东海1,2,鱼江1,聂洪玉1,崔静静1,杜佳1
ZHAI Dong-hai1,2, YU Jiang1, NIE Hong-yu1, CUI Jing-jing1, DU Jia1
摘要:
针对在热点话题追踪过程中容易发生话题漂移的问题,提出了基于相关性反馈的自适应热点话题追踪模型。为准确把握话题的动态演变过程,首先,在词频-逆向文档频率(term frequency—inverse document frequency, TF-IDF)的基础上引入了相关度因子。其次,构造了报道与话题的相关度计算公式和新特征词能否反馈加入到话题词汇库的判别函数。同时,利用了话题词汇库本身的特性,构造了自适应更新阈值和自适应相关阈值的动态计算方法。最后,根据各个特征词对该话题贡献度的大小,对更新后的词汇库中的各特征词动态赋予新权重。实验结果显示,和其它3类追踪器相比,该追踪器模型的漏报率平均降低0.018、误报率平均降低0.063,这表明,该追踪模型更适合于解决话题漂移问题。
[1] | 刘成云 陈振学 常发亮. 基于平稳小波的自适应阈值MR图像去噪法[J]. 山东大学学报(工学版), 2009, 39(5): 58-61. |
|