您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版) ›› 2011, Vol. 41 ›› Issue (3): 17-22.

• 机器学习与数据挖掘 • 上一篇    下一篇

基于半监督隐含狄利克雷分配的人脸姿态判别方法

魏巍,张艳宁   

  1. 西北工业大学计算机学院, 陕西 西安 710129
  • 收稿日期:2011-01-10 出版日期:2011-06-16 发布日期:2011-01-10
  • 作者简介:魏巍(1979- ),陕西宝鸡人,博士研究生,主要研究方向为模式识别,计算机视觉. Email: weiwin1979@hotmail.com
  • 基金资助:

    国家自然科学基金资助项目(60872145, 60903126); 国家高技术研究发展计划(863计划)资助项目 (2009AA01Z315)

Pose estimation based on semi-supervised latent Dirichlet allocation

WEI Wei, ZHANG Yanning   

  1. School of Computer Science, Northwestern Polytechnical University, Xi′an 710129, China
  • Received:2011-01-10 Online:2011-06-16 Published:2011-01-10

摘要:

针对无监督的主题模型无法对图像主题进行类别标记、有监督主题模型中类别信息的标记繁琐且受主观因素影响的问题,提出了一种半监督主题模型。提取图像中与位置无关的局部特征,用尺度不变特征变换对特征进行描述,用词袋模型将人脸图像表示成一组视觉单词的集合;在基于隐含狄利克雷分配(latent Dirichlet allocation, LDA)方法中的主题-单词层分布上引入少量的类别标记指导未标记样本的分类的基础上提出半监督隐含狄利克雷分配方法。在多姿态人脸判别任务上的测试结果表明该算法比无监督LDA算法分类率高9.0%~24.7%;对于部分遮挡人脸图像、未对齐的人脸图像的分类率比多姿态主成分分析法分别提高8.8%和21.5%~39.8%。结果表明该方法在少量样本标记的情况下,性能逼近有监督的隐含狄利克雷分配方法,且适用于其它图像分类问题。

关键词: 姿态判别, 视觉词袋模型, 隐含狄利克雷分配, 半监督学习

Abstract:

Topics cannot be labeled in the unsupervised topic model, while the labeling work in supervised topic models is tedious and subjective. To solve these problems, a semisupervised topic model was proposed. First, the locationirrelevant local features were detected and described by the scaleinvariant feature transform (SIFT), based on which images were represented by a bag of visual words. Then partial labels were introduced to the topicword level distribution in the latent Dirichlet allocation (LDA) model to guide the classification of the unlabeled data, which resulted in a semisupervised LDA (SSLDA) model. The validation on head pose estimation showed the classification rate of the proposed method was 9.0%~24.7% higher than that of LDA. And the pose classification rate on partially occluded and misaligned face images was 8.8% and 21.5%~39.8% higher than multi-pose PCA method. With a small amount of labeled images, the proposed SSLDA model approaches the fully supervised LDA method. And it is applicable to other image classification problems.
 

Key words: pose estimation, bag of visual words model, latent Dirichlet allocation, semi-supervised learning

[1] 沈冀,马志强,李图雅,张力. 面向短文本情感分析的词扩充LDA模型[J]. 山东大学学报(工学版), 2018, 48(3): 120-126.
[2] 孔超1,2,张化祥1,2*,刘丽1,2. 基于兴趣区域特征融合的半监督图像检索算法[J]. 山东大学学报(工学版), 2014, 44(3): 22-28.
[3] 李雅林1,2,张化祥1,2*,冯新营1,2. 一种新的基于半监督的多标记学习算法[J]. 山东大学学报(工学版), 2013, 43(2): 18-22.
[4] 夏战国,万玲,蔡世玉,孙鹏辉. 一种面向入侵检测的半监督聚类算法[J]. 山东大学学报(工学版), 2012, 42(6): 1-7.
[5] 谢伙生,刘敏. 一种基于主动学习的集成协同训练算法[J]. 山东大学学报(工学版), 2012, 42(3): 1-5.
[6] 宿洪禄,李凡长*. 基于相异性和不变特征的半监督图像检索[J]. 山东大学学报(工学版), 2010, 40(5): 150-153.
[7] 崔宝今 林鸿飞 张霄. 基于半监督学习的蛋白质关系抽取研究[J]. 山东大学学报(工学版), 2009, 39(3): 16-21.
[8] 周广通,尹义龙,郭文鹃,任春晓. 基于协同训练的指纹图像分割算法[J]. 山东大学学报(工学版), 2009, 39(1): 22-26.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!