山东大学学报(工学版) ›› 2013, Vol. 43 ›› Issue (2): 29-34.
高爽1,2,张化祥1,2*,房晓南1,2
GAO Shuang1,2, ZHANG Hua-xiang1,2*, FANG Xiao-nan1,2
摘要:
垃圾网页检测具有重要意义,由于只有少量标记网页,所以可使用半监督协同训练方法检测垃圾网页。将网页特征分为两个视图,即内容视图与链接视图。首先使用独立成分分析分别提取两视图特征的独立成分,然后进行协同训练。实验结果表明,该方法可有效提高垃圾网页检测精度,同时验证了对两个视图分别进行独立成分分析相比于其他方法更为有效。
中图分类号:
[1] | 王丽,周以齐,于刚,米永振. 基于EEMD和ICA方法的驾驶室内噪声源时频分析[J]. 山东大学学报(工学版), 2014, 44(2): 80-88. |
[2] | 谢伙生,刘敏. 一种基于主动学习的集成协同训练算法[J]. 山东大学学报(工学版), 2012, 42(3): 1-5. |
[3] | 崔宝今 林鸿飞 张霄. 基于半监督学习的蛋白质关系抽取研究[J]. 山东大学学报(工学版), 2009, 39(3): 16-21. |
[4] | 周广通,尹义龙,郭文鹃,任春晓. 基于协同训练的指纹图像分割算法[J]. 山东大学学报(工学版), 2009, 39(1): 22-26. |
|