数字半色调,也称为图像空间抖动,是一种将一幅连续色调的图像先进行二值化处理,再用这些黑白二色的点来表示各个等级灰度的技术[1]。数字半色调技术已广泛应用于传真、打印、印刷、显示设备及数字图像的压缩存储等领域。较常用的数字半色调方法包括有序抖动法[2]、误差分散法[3]、点分散法[4-6]、直接二值搜索法[7]、蓝噪声模板法[4]、绿噪声半调法[8]等。分析现有的半色调技术可知,不同半色调技术应用于多级图像时将产生具有各自不同特性的半色调图像[9],如周期性、点分布、点分散性、点相关性等。由于这些特性的存在,当通用型逆半调技术用于某种半色调图像的重建时,将缺少相关半调模式信息,所以很难获得半色调图像的最优重建。
目前对数字半色调图像分类的方法较少,最早对半色调图像分类进行研究的是CHANG P C[10],其提出一维自相关函数的半色调图像特征提取方法,采用BP神经网络对半色调图像纹理特征[11]进行分类。该方法针对某些特殊的图像能达到100%的分类效率,但是适用的图像类别较少。LIU Y F[9] 等针对4种类型的半色调图像,利用支持区域和最小均方(least mean square,LMS)算法识别半色调图像类型,然后采用不同的逆半色调技术重建最优原始图像[12-14]。然后,针对9 种半色调图像,采用LMS对半色调图像频谱进行特征建模,并利用朴素贝叶斯方法进行分类[15],取得了较好的分类效果。文志强等提出有监督流行上的半色调图像分类方法,采用3个方向的像素自相关特征和同或运算来描述纹理特征,利用图像分块的思想获取纹理特征[13];梁永峰等提出统计矩阵描述子对误差分散类半色调图像进行分类[16]。上述文献方法对于6种常用的误差分散法分类效果不是很好。也可根据同样,采用姚莉的评价方法得到的判定结果不好[17]。表 1列出了常用的6种误差分散法。图 1显示了使用6种误差分散法产生的Lena(256×256)半色调图像(其子图从左至右、从上至下对应表 1中的序号)。图 1中,只有(b)中的纹理稍微明显,其余纹理都很不明显,难以区分,所以误差分散半色调图像的纹理特征提取有一定的难度。
局部二值化模式(local binary pattern,LBP)是近年来提出的一种特征提取方法。最初由OJALA T等为了辅助性度量图像的局部对比度而提出,是一种灰度范围内的纹理度量[18]。因LBP对光照、旋转等变换具有较好的鲁棒性、计算简便高效、 能有效描述 局部纹理特征及便于与其它描述符复合使用等优点[19],LBP广泛应用于纹理图像检索、纹理分类、目标跟踪和人脸识别等领域[20-26]。
在LBP基础上,结合半色调图像特点,提出一种像素相似性描述子方法。先将图像中各像素8邻域与中心像素值进行比较,再将8邻域对应值存放在8个矩阵中,最后求各矩阵之间的相似性,获得相似性邻域统计量,作为图像的纹理特征向量。提出的方法在一幅图像中有7~28个特征值,比LBP的8邻域中产生的256个特征值少。试验结果表明,提出方法的特征维数低且其分类性能好。
1 LBP方法图 2为基于二值图像LBP特征的计算过程。如图 2所示,LBP算子以3×3邻域定义窗口,中心像素值设为gc,其余邻域定义为g1,g2,…,g8。LBP的思想是将8邻域g1,g2,…,g8分别与中心像素值gc进行比较,若大于gc为1,否则为0。连接周围8个像素点的值得到一个8位二进制数,将这个二进制数的值转为十进制作为中心像素点的灰度值,计算公式如式(1)所示。图 2中LBP值的范围与所选取的邻域相关,3×3窗口LBP值的范围为[0,255]。最后,统计LBP值的个数并归一化后作为图像的特征值。
$LBP\left( {{x}_{c}},{{y}_{c}} \right)=\sum\limits_{i=1}^{8}{s\left( {{g}_{i}}-{{g}_{c}} \right){{2}^{i}}},$ | (1) |
其中,s(x)为二值函数,定义如式(2)所示:
$s(x)=\left\{ \begin{align} & 1,x>\text{ }0; \\ & 0,其他。 \\ \end{align} \right.$ | (2) |
LBP算法描述为
Step 1 输入图像f;
Step 2 以某一像素gc为中心像素,g1,g2,…,g8为其余8个像素点的灰度值,将g1,g2,…,g8依次与gc的灰度值进行式(1)和(2)运算;
Step 3 统计LBP(xc,yc)相同值的个数并归一化,即图像纹理特征。
2 邻域相似性描述子LBP是一种局部信息特征提取方法,反映每个像素与周围像素的关系,对于纹理特征比较明显的图像分类效果较好。但在误差分散类半色调图像的纹理特征不明显,图像较难区分,所以分类效果并不理想。对LBP进行改进,提出邻域相似性描述子(neighborhood similarity descriptor,NSD)对误差分散类半色调图像纹理特征进行描述。
既考虑局部信息也考虑全局信息,将图像的相似性作为特征,如图 3所示。以3×3窗口为例,gc为中心像素值,g1,g2,g3,g4,g5,g6,g7,g8为邻域像素,C1,C2,C3,C4,C5,C6,C7,C8为用于存放邻域像素的矩阵,称为邻域矩阵。首先将中心像素值与邻域像素值进行如式(3)运算。其中,s(x)为二值函数如式(2)所示,若邻域像素值比中心像素值大记为1,否则记为0。例如,若g1大于gc则g1c为1,若g1小于或等于gc则g1c为0。再将g1c,g2c,g3c,g4c,g5c,g6c,g7c,g8c分别存放在8个邻域矩阵C1,C2,C3,C4,C5,C6,C7,C8中,即g1c存放在C1中,g2c存放在C2中,以此类推,g8c存放在C8中。最后将矩阵C1,…,C8相互之间求相似性矩阵如式(4)所示。
${{g}_{ic}}=s\left( {{g}_{i}}-{{g}_{c}} \right)\text{ }\left( i=1,2,\ldots ,8 \right)。$ | (3) |
将图像中的值进行式(3)和(2)运算之后,可知图像少了两行和两列,比如原图像为256×256,运算之后大小为254×254。其原因可由图 3解释。当3×3窗口移动到边界时,可知上下左右两行两列的边界值信息运算后将置于矩阵Ci中,所以图像进行式(2)和(3)运算后少了两行和两列。
${{M}_{ij}}\left( x,y \right)={{C}_{i}}\left( x,y \right)\circ \text{ }{{C}_{j}}\left( x,y \right),$ | (4) |
其中,i,j=1,2,…,8(i≠j);
归一化方法如式(5)所示,
${{m}_{ij}}=\frac{\sum\limits_{ii=0}^{M\times N-1}{{{I}_{ij}}\left( ii \right)}}{M\times N},$ | (5) |
其中,Iij(ii)=Mij(x,y),即Iij(ii)为Mij矩阵的像素值,Iij(ii)=1或0。M,N为图像宽、高。统计Mij(x,y)中1的个数与图像所有像素的比作为mij,将任意两矩阵(已有的除外)进行式(4)与(5)运算后合成特征向量
${{R}_{n}}=\{{{m}_{ij}}\}\left( i=1,\cdots ,n,j=1,2,\cdots ,8\left( i\ne j \right) \right),$ | (6) |
其中,Rn由mij组成的集合,比如R1={m12,m13,m14,m15,m16,m17,m18},R2={m12,m13,m14,m15,m16,m17,m18,m23,m24,m25,m26,m27,m28},所以由此可推出特征值的个数kn为nj-(1+n)n/2。由此,k1=7,k2=13,k3=18,k4=22,k5=25,k6=27,k7=28。由此可知,提取图像的特征值个数不多,但其特征值包含的图像信息权重较大。正因为误差分散类半色调图像很相似,所以将相似性作为特征值最具代表性。提出的方法不仅考虑了图像的局部信息,而且还兼顾了全局信息。
提出的NSD算法描述如下:
Step 1 输入半色调图像f;
Step 2 以某一像素gc为中心像素,以g1,g2,…,g8为其余8个像素点的灰度值,将g1,g2,…,g8依次与gc的灰度值进行公式(2)和(3)运算保存至邻域矩阵C1,C2,C3,C4,C5,C6,C7,C8中;
Step 3 进行式(4)运算求出特征值Mij;
Step 4 进行式(5)与(6)运算,即获得纹理特征向量Rn。
3 试验 3.1 试验环境本试验在Windows 7操作系统环境下进行,采用VC6.0结合OpenCV 1.0 及MATLAB 7.11进行编程。误差分散类图像由VC6.0结合OpenCV 1.0产生,特征值的提取使用MATLAB 7.11生成。通过对半色调方法产生的6种误差分散类图像库中,每一类随机取出1 000副图像通过NSD算法提取特征向量Rn。从1000个特征向量中随机抽取600个作为训练样本,剩余400个作为测试样本进行分类。
为验证提出方法的有效性,采用BP神经网络对纹理特征进行分类,通过分类精度测试方法的性能。
3.2 试验结果为验证提出方法的有效性,选取不同的样本运行M次分类程序(取M=15),计算平均分类正确率rv的总平均分类正确率Rave如式(9)所示,将第i次运行的6类平均分类正确率记为rvi。由于针对6类误差分散类进行分类,所以类别数为6。Rave作为分类器性能的度量标准,Rave越大说明分类器性能越好。其中,0≤rv≤100%,rvmin≤Rave≤rvmax。
${{r}_{j}}=\frac{{{n}_{j}}-{{m}_{j}}}{{{n}_{j}}}\times 100%,$ | (7) |
${{r}_{v}}=\frac{1}{N}\sum\limits_{j=1}^{N}{{{r}_{j}}},$ | (8) |
${{R}_{ave}}=\frac{1}{M}\sum\limits_{i=1}^{M}{{{r}_{vi}}}。$ | (9) |
为验证性能的有效性,将其他类似方法与本研究提出的方法都在相同图像库中进行试验比较。类似方法有:LBP、灰度共生矩阵(gray level co-occurrence matrix,GLCM)、像素相关算子(pixel correlation operator,PCO)、自相关函数(autocorrelation function,AF)、像素相关算子与旋转不变的局部二值化模式相结合(LBP+PCO,LPCO)、LMS、Gabor,具体描述如表 2所示。计算时间比较如表 3所示。
分析表 3可知,本研究提出方法的Rave最高,LPCO方法的计算时间最少。主要原因是:常用的6种误差分散类半色调图像的纹理特征不明显,LMS+Bayes和AF方法都很难做出正确的判决;GLCM通过计算灰度的特征,如角二阶矩、对比度、相关度、熵等值作为图像的特征值。这些特征从不同方面反应了图像的一些特性,比如图像的灰度分布均匀程度、纹理的均匀性、图像清晰度、纹理粒度、纹理的沟纹深浅等。半色调图像的纹理差别不明显,所以这些特性的区别也不明显,并且计算这些特征值比较耗时。GLCM的分类效果也不太明显;LBP在应用于半色调图像特征提取时,由于半色调图像只有0和1二值,当中心像素值为1时,8邻域都为0,只有当中心像素值为0时,才会有1~255的像素值存在,所以在二值化图像中直接使用LBP方法具有局限性。若图像中1的像素值比较多,则图像的分类性能将会降低很多。PCO仅考虑像素之间的相关性,当L取值越大时,漏掉的信息越多,分类性能会降低。LPCO比PCO分类性能更好,因为LBP考虑了中心像素的8邻域,再结合PCO运算,该方法比PCO涉及到的像素相关性更多,所以LPCO性能比PCO和LBP更好一些。Gabor虽然兼顾局部和全局特征,但效果很不明显,主要原因是Gabor增强边缘信息,而半色调图像的边缘信息基本是一致的。因此,提出方法更有利于提高半色调图像分类的性能。
将本研究提出方法与LBP方法进行更详细地比较。同样,本试验在同一图像库中进行,都采用BP神经网络进行分类。本研究提出方法采用半径为1,邻域个数为8提取特征与现有5种LBP方法比较,如表 4所示。第一种方法:使用传统的LBP对半色调图像进行建模,其中半径为1,邻域个数为8,特征值有28个,记为LBP(8,1)。第二种方法:使用均匀LBP对半色调图像进行建模,其半径为1,邻域个数为8,记为LBP-u(8,1)。在LBP二进制数中,0到1和1到0的跳变总数不超过两次。在局部纹理描述上取得了较好的描述效果,因为即使采样半径与周围像素点个数不同但其各种模式占据了图像中所有模式的绝大部分(50%~95%),经过LBP-u(8,1)后,特征向量包含59个特征值。第三种方法:使用均匀旋转不变LBP对半色调图像进行建模,其半径为1,邻域个数为8,记为LBP-riu(8,1)。经过LBP-riu(8,1)后,特征向量包含有10个特征值。第四种方法:使用均匀旋转不变LBP对半色调图像进行建模,其半径为2,邻域个数为16,记为LBP-riu(16,2)。经过LBP-riu(16,2)后,特征向量包含18个特征值。第五种方法:使用均匀旋转不变LBP对半色调图像进行建模,其半径为3,邻域个数为24,记为LBP-riu(24,3)。经过LBP-riu(24,3)后,特征向量包含26个特征值。
表 4为各种LBP算法的Rave和计算时间比较。由表 4可知,LBP-riu(8,1)计算时间最少,其原因是特征值最少,只有10个,其分类性能不佳。LBP(8,1)特征值最多达256个,但用于误差分散类半色调图像的分类性能并不好。由此表明,提出方法比LBP更好一些。
试验中,式(4)中求矩阵的相似性采用异或运算,也可采用同或运算。两种运算的试验比较如表 5所示。分析表 5可知,异或的效果优于同或,且单幅图像计算时间较少。主要原因是,误差分散类半色调图像只有0和1二值,纹理特征不明显。将8个邻域值与中心像素值进行比较时,若中心像素值为1,则8个邻域值都为0;只有当中心像素值为0时,8个邻域值才保持不变,所以在求两矩阵的相似性时,实际是求8邻域值之间的相似性。异或运算更具代表性,而同或运算会导致相似矩阵中的0个数增多,因而同或运算产生的统计个数增大,计算时间也会增加。故实验中采用异或运算。
提出算法式(4)中图像的特征值是通过计算两矩阵的相似性获得,下面将研究特征值与分类性能的关系。不同kn值下的Rave和计算时间如表 6所示。kn分别取k1=7,k2=13,k3=18,k4=22,k5=25,k6=27,k7=28。
分析表 6可知,k4的分类效果最好,分类精度高达97.167%。开始随着特征值的增多,Rave增大;但在k4后,随着特征值增多,Rave下降。算法的计算时间随着特征值的增多而增加。
按常理应该是正确分类精度随着特征值增多而增大,但表 6情况不然,现对表 6结论进行试验研究。
试验中,用邻域矩阵Ci分别与其他7个矩阵求相似性,共7个相似性特征值,以此来构造特征向量。8个矩阵可构造8个特征向量,称为相似性特征向量,分别用m1j,m2j,…,m8j表示。分别以这些特征向量作为分类器的输入来获取分类正确率,其结果如表 7所示。
表 7表明,不同的相似性特征向量将导致不同的Rave和不同的计算时间。m3j分类效果最好,计算时间较少,验证了表 6中k4的效果最好,而不是特征值最多效果最好。所以在本研究提出方法中,应先获取以每个矩阵Ci为主矩阵与其他矩阵的相似性作为特征向量的分类准确度,选择分类准确度高的特征向量Rn作为最终特征向量而计算平均分类准确度,这样既提高分类精度,也减少时间开销。通过上述方法获得的相似性特征向量具有较大的差异,图 5给出了6种误差分散类半色调图像的Ci(对应图 1由左至右由上至下)。由图 5可知,6种类型的M2,M4,M5和M7纹理比较明显,即与其他矩阵的差异较大,所以这4个矩阵作为相似性特征时正确分类率比较低,这也解释了表 6中Rave并不是随着特征维数越大分类精度越高的现象。
针对误差分散类半色调图像的分类问题,对半色调图像特征本研究方法进行了研究,提出一种像素相似性描述子方法。由于考虑了局部和全局信息,所以提出方法能提高分类精度。另外,利用邻域矩阵之间的相似性特征向量可降低特征维数,特征维数为7~28。试验表明,在现所选取的样本中特征维数为22时,正确分类精度可高达97.167%,计算时间为0.1634s;当特征维数为7时,正确分类精度能达到91.667%,计算时间为0.0993s。大量的试验比较和分析表明本研究提出的方法是有效的。本研究提出方法的不足之处在于具体的特征维数与所采集的样本有关,但与前人提出的特征提取方法相比,从128维降低到了最多28维,减少了内存,在实际的特征提取应用中具有重要的意义与价值。本研究提出方法的方法提高了分类的准确性并降低了维度,但实际上半色调图像分类研究还需要进一步研究。今后对于不同图像库将下选取一种更有效的确定半色调图像特征维数的方法进行研究。
[1] |
文志强, 胡永祥, 朱文球. 基于统计量模板的半色调图像特征提取与分类[J].
计算机科学,2013, 40 (12) : 94-112.
WEN Zhiqiang, HU Yongxiang, ZHU Wenqiu. Feature extraction and classification of halftone image based on statistics template[J]. Compute Science,2013, 40 (12) : 94-112. (0) |
[2] |
孔月萍,曾平.图像逆半调及其质量评价技术研究[D].西安:西安电子科技大学,2008.
KONG Yueping, ZENG Ping. A study of inverse halftoning and quality assessment schemes[D]. Xi′an:Xidian University, 2008. (0) |
[3] | ULICHNEY R A. Dithering with blue noise[J]. Proceedings of the IEEE,1988, 76 (1) : 56-79. (0) |
[4] | STEVEBSON R. Inverse halftoning via MAP estimation[J]. IEEE Transaction on Image Processing,1997, 6 (4) : 574-583. (0) |
[5] | KNUTH D E. Digital halftones by dot diffusion[J]. ACM Transactions on Graphics (TOG),1987, 6 (4) : 245-273. (0) |
[6] | MESE M, VAIDYANATHAN P P. Optimized halftoning using dot diffusion and methods for inverse halftoning[J]. Image Processing, IEEE Transactions on,2000, 9 (4) : 691-709. (0) |
[7] | MESE M, VAIDYANATHAN P P. Recent advances in digital halftoning and inverse halftoning methods[J]. IEEE Trans. on Ciruits and Systems: Fundamental Theory and Applications,2002, 49 (6) : 790-805. (0) |
[8] | SELDOWITZ M A, ALLEBACH J P, SWEENEY D E. Synthesis of digital holograms by direct binary search[J]. Applid Optics,1987, 26 (14) : 2788-2798. (0) |
[9] | LIU Y F, GUO J M, LEE J D. Inverse halftoning based on the Bayesian theorem[J]. IEEE Trans on Image Processing,2011, 20 (4) : 1077-1084. (0) |
[10] | CHANG P C,YU C S.Neural net classification and LMS reconstruction to halftone images[C]//Proceedings of SPIE-The International Society for Optical Engineering. San Jose, USA: SPIE, 1997:592-602. (0) |
[11] |
刘丽, 匡纲要. 图像纹理特征提取方法综述[J].
中国图象图形学报,2009, 14 (4) : 622-635.
LIU Li, KUANG Gangyao. Overview of image texture feature extraction methods[J]. Journal of Image and Graphics,2009, 14 (4) : 622-635. (0) |
[12] | RIDDER D, LOOG M, REINDERS M. Local fisher embedding[C]//Proceedings of the 17th International Conference on Pattern Recognition. New York, USA: IEEE, 2004:295-298. (0) |
[13] |
文志强, 朱文球, 胡永祥. 半调图像的分类方法[J].
山东大学学报(工学版),2013, 43 (4) : 7-12.
WEN Zhiqiang, ZHU Wenqiu, HU Yongxiang. A classification method of halftone image[J]. Journal of Shandong University(Engineering Science),2013, 43 (4) : 7-12. (0) |
[14] |
孔月萍, 曾平, 张跃鹏. 一种半调图像分类识别算法[J].
西安电子科技大学学报(自然科学版),2011, 38 (5) : 62-69.
KONG Yueping, ZENG Ping, ZHANG Yuepeng. Classification and recognition algorithm for the halftone image[J]. Journal of Xidian University(Nature Science),2011, 38 (5) : 62-69. (0) |
[15] | WEN Zhiqiang, HU Yongxiang, ZHU Wenqiu. A novel classification method of halftone image via statistics matrices[J]. IEEE Transaction on Image Processing,2014, 23 (11) : 4724-4736. (0) |
[16] |
梁永峰,黄进.一种改进的误差扩散算法[D].西安:西安电子科技大学, 2013.
LIANG Yongfeng, HUANG Jin. An improve error diffusion algorithm[D]. Xi′an:Xidian University, 2013. (0) |
[17] |
姚莉. 数字半调技术及其评价方法研究[J].
计算机工程与应用,2010, 46 (3) : 4-8.
YAO Li. Review on digital halftoning and quality assessment schemes[J]. Computer Engineering and Applications,2010, 46 (3) : 4-8. (0) |
[18] | OJALA T, PIETIKAINEN M, HARWOOD D. A comparative study of texture measures with classification based on featured distributions[J]. Pattern Recognition,1996, 29 (1) : 51-59. (0) |
[19] |
徐少平, 刘小平, 李春泉, 等. 基于LBP值对空间统计特征的纹理描述符[J].
模式识别与人工智能,2013, 26 (8) : 669-776.
XU Shaoping, LIU Xiaoping, LI Chunquan, et al. Texture descriptor based on spatial feature of local binary pattern code pair[J]. Pattern Recognition and Artificial Intelligence,2013, 26 (8) : 669-776. (0) |
[20] | CHUN H, CHANG H, LIU T. Local discriminant embedding and its variants[C]//Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition. New York, USA: IEEE, 2005:846-853. (0) |
[21] | FREITAS P G, FARIAS M C Q, DEARAUJO A P F. Fast inverse halftoning algorithm for ordered dithered images[C]//Graphics, Patterns and Images (Sibgrapi), 2011 24th SIBGRAPI Conference on. Alagoas, Brazil: IEEE, 2011:250-257. (0) |
[22] | HUANG Di, SHAN Caifeng, ARDABILIAN Metal. Local binary patterns and its application to facial image analysis: a survey[J]. IEEE transaction on Systems, Man and Cybernetics,2011, 41 (6) : 765-781. (0) |
[23] | REN J, JIANG X, YUAN J. Noise-resistant local binary pattern with an embedded error-correction mechanism[J]. IEEE transaction on Image Processing,2013, 22 (10) : 4049-4060. (0) |