《1 引言 》

1 引言    

线性鉴别分析[1 ~ 4] (LDA , linear discriminant analysis)是模式识别领域一个重要的研究方向并且成功应用于模式识别的很多领域。但是传统的 LDA 方法是对一维向量的,对于二维的图像矩阵必须先将其转化成对应的一维向量,然后才能使用 LDA 方法。此外,当采用由向量所构成的矩阵做线性鉴别分析特征提取时,由于实际应用中图像的像素个数往往远大于图像本身的个数,由此遇到的小样本问题将导致相应的类内散布矩阵奇异而无法直接使用此法。为了克服这缺陷,改进方案中比较常用的方法是首先通过主成分分析(PCA , principal component analysis)方法将图像降维到低维空间,然后在此空间采用 LDA 方法得到原始图像的有效特征。这些改进的 LDA 方法都是基于一维图像向量的,即必须先将图像矩阵转化成相应的图像向量才能进行特征提取。 Liu[5] 等提出基于图像矩阵的二维线性鉴别分析(2DLDA)方法,是直接对二维图像矩阵做线性鉴别分析,跳过将图像矩阵转化成一维向量过程,此时相应的类内散布矩阵就是非奇异的(除非只有一个训练样本)。

2DLDA 方法[6 ,7] 给出了使用 LDA 的一个新的解决方案,并且其识别性能优于传统的人脸识别方法。但是 2DLDA 在做特征提取时,并未有效地利用相应图像的原始分布信息。笔者提出了一种利用样本原始分布信息的新的二维线性鉴别分析方法——模糊二维线性鉴别分析(F2DLDA)方法。在该方法中,原始样本的分布信息通过相应的模糊隶属度函数[8 ~ 11] 来表示,并且将样本的分布信息融入特征提取过程,以得到有效分类的最佳信息。实验结果验证了该算法的有效性。

《2 二维线性鉴别分析 》

2 二维线性鉴别分析    

假设有 c 类已知的模式,训练样本的总数为 MMi 代表第 i 类样本所拥有的训练样本个数并且满足  代表第 i 类的第 个样本(假设为 × n 维),分别表示第 i 类样本的均值和所有训练样本的均值,可以得到 2DLDA 算法中相应的类间散布矩阵和类内散布矩阵,分别定义为

同样,总体散布矩阵为

据此可以得出,相应的散布矩阵都是 n × n 维矩阵。在人脸识别中, 2DLDA 中的类内散布矩阵 Gw 通常是可逆的,无须对原始图像降维就可直接用广义 Fisher 鉴别准则求取相应的最佳鉴别矢量集,得到广义二维 Fisher 线性鉴别准则

此时,用 2DLDA 方法求取最优鉴别矢量集的方法就变成求取广义线性方程

特征值与特征向量的问题。假设 为广义特征方程的前 q 个非零最大特征值(按从大到小的顺序排列),对应的特征向量为 ,…, ,那么 U =(,…, )就构成了最终的特征向量集

即最终得到原始样本在特征向量集上的投影数据。

《3 模糊二维线性鉴别分析》

3 模糊二维线性鉴别分析

传统的 2DLDA 方法跳过了将二维图像矩阵转化成一维矢量的过程,得到了一个利用线性鉴别分析的新方法。但是传统的 2DLDA 方法将各个样本同等对待,当有重叠(离群)样本存在时,此时样本不再是规则的球形分布,有样本点处于重叠区域或样本点远离自己所属的类别,因此传统的二值分类问题对于此种情况缺乏有效的特征提取手段。利用模糊集概念,通过模糊隶属度函数来表示相应的样本分布信息,提出了一种新的 2DLDA 算法—— F2DLDA 算法。在该算法中,首先通过模糊 k 近邻(FKNN , fuzzy k-nearest neighbor)算法[8 , 11] 得到相应的类中心点和隶属度信息,利用这些信息来表示相应的样本物理分布,并且将这些信息融入到特征提取过程中,得到更能代表原始样本分布的有效分类特征数据。

《3.1 模糊 k 近邻算法》

3.1 模糊 k 近邻算法

在 F2DLDA 算法中,相应的模糊隶属度函数通过 FKNN 算法得到,然后利用此隶属度函数得到相应每类新的类中心。此时,利用得到的信息表示样本的原始分布,并将这些信息融入到特征提取的过程中。利用 FKNN 算法得到相应的隶属度信息的计算步骤如下:

Step 1   计算训练集中的任意 2 个样本之间的欧氏距离,对于 2DLDA 而言,直接在二维图像矩阵上计算任意 2 个样本之间的距离。假设 为第 i 类样本中的任意 2 个样本,那么这 2 个样本点的欧式距离为

其中 分别代表样本点的在处的像素值。

Step 2   由于样本与其本身的距离等于零,为了防止在 Step 3中将与本身的距离作为最小距离,因此将距离矩阵中的本身距离置为无限大(对角线位置),便于下一步骤的处理;

Step 3   将每一列的距离值按照从小到大的次序排列,因此每列可分别得到对应的一组最小距离值,通过这些距离值可以找到对应的样本及其所属的类别(在 k 近邻的情况下,那么返回的是一组 k 个类别所构成的向量);

Step 4   按下列公式计算每个样本的隶属度:

式中 为应属于第 j 类的样本个数现属于第 i 类,为训练集中每一样本对各个类别的隶属度。

根据隶属度函数,每一类的中心点定义为

其中 xj j = 1 ,2 ,…, M)代表训练集中的样本。

因此得到相应的新类中心矩阵 ω 和模糊隶属度矩阵 U

《3.2 模糊二维线性鉴别分析》

3.2 模糊二维线性鉴别分析

F2DLDA 的关键是如何将训练样本的分布信息融入到相应的特征提取过程之中,特别是要考虑如何消除重叠(离群)样本对于特征提取的影响,对于具体的样本,根据其在原始样本中的分布,赋于不同的权重信息,以表示该样本对于最后提取到的特征所做的贡献。利用 FKNN 算法得到的模糊隶属度函数和新类中心重新定义了相应的散布矩阵,有效地利用了样本的分布信息,并且将这些信息融入特征提取过程中,以得到最有助于分类的信息。

在相应的新的模糊类内散布矩阵的定义中,那些距离新类中心越近的样本对于最后的有效特征将做更多的贡献,而距离新中心点远的样本也应当被赋于相应的权值,此时样本集中的重叠(离群)信息被考虑进特征提取过程中,有助于得到更有效分类的信息。因此,根据相应的隶属度函数信息,可以得到新的 F2DLDA 中的类内散布矩阵,定义为

其中的 p 是用户定义的常量,用来控制模糊隶属度函数的影响。

与类内散布矩阵定义的相反,在相应的模糊类间散布矩阵的定义中,不同类样本之间的类中心相隔的越远,那么其对分类所作的贡献就越大。得到的相应模糊类间散布矩阵的定义为

表示所有训练样本的均值。

相应的总体散布矩阵定义为

因此,得到在 F2DLDA 中所有的相应散布矩阵的定义,并且对于每一不同的样本,将该样本对于最后分类所作的影响也考虑到相应的散布矩阵的定义中。根据得到的相应的散布矩阵,就可以将相应的散布矩阵代入到广义 Fisher 鉴别准则之中,求取相应的最佳鉴别矢量集。 F2DLDA 算法如下:

Step 1  在原始图像空间通过 FKNN 算法得到相应的类中心矩阵ω和模糊隶属度矩阵 U

Step 2   根据得到的 ω 和 U ,利用式(12)、式(13)和式(14)分别得到相应的类内散布矩阵 GwF 、类间散布矩阵 GbF和总体散布矩阵 GtF

Step 3   根据重新定义的散布矩阵,利用广义 Fisher 鉴别准则式(4)求得相应的最优鉴别矢量集 UU =(,…, )。

Step 4   根据式(6)得到所有样本在最佳鉴别矢量集上的投影数据,选择分类器进行分类。

《4 实验结果》

4 实验结果    

实验数据采用 AT&T 人脸数据库。人脸图像具体为 40 人,每人由不同表情或不同视点的 10 幅图像所构成。

实验中,训练数据集和测试数据集均随机产生,在不同的训练样本个数下均做 10 次不同的实验,得到 10 次不同数据集下的均值和方差。每组实验中,均随机地从人脸库的每类人脸中抽取 κ(κ= 4,5 , 6 ,)个样本构成训练集,其余的样本构成测试集。其中 F2DLAD 和 2DLAD 的特征维数均取4维,模糊散布矩阵的参数 p = 2 。 Fisherface 最终特征由基于 fisher 鉴别准则的广义特征方程的前 39 (c - 1)个最大特征值所对应的特征向量构成。最后采用最近邻分类器进行分类。表 1 显示了 10 次不同实验数据集下识别率的均值和方差。

《表 1》

表 1 在 AT&T 人脸库中不同情况下的识别率比较(均值/方差)

Table 1 Recognition rates on the AT&T face database (mean and standard deviation)

从表 1 的识别率比较表中可以得出, F2DLAD 在识别率上优于传统的 2DLAD 和 Fisherface 人脸识别方法。在 F2DLAD 中,随着模糊集理论的引入,原始样本的分布信息通过 FKNN 算法被融入到特征提取的过程之中,由此抽取得到的特征向量集反映了样本的原始分布,利用隶属度函数重新表示的模糊散布矩阵和新的类中心反映了样本的原始数据分布,有效地压制了由于光照、表情变化等引起的差异,最终得到的有效特征更有助于样本分类,表 1 的实验结果也验证了该算法的合理性。图 1 显示了 3 组不同实验情况下的平均识别率比较图。图 2 、图 3 和图 4 分别显示了每组实验中 10 次不同的实验数据集下的识别率比较。

《图 1》

图 1 不同训练样本个数下的平均识别率比较图

Fig.1 Recognition rate comparison under different numbers of training samples

《图 2》

图 2 每类随机抽取 4 个训练样本下的识别率比较

Fig.2 Recognition rates comparison with training samples of per class equal to 4

《图 3》

图 3 每类随机抽取 5 个训练样本下的识别率比较

Fig.3 Recognition rates comparison with training samples of per class equal to 5

《图 4》

图 4 每类随机抽取 6 个训练样本下的识别率比较

Fig.4 Recognition rates comparison with training samples of per class equal to 6

《5 结语》

5 结语    

模糊二维线性鉴别分析方法,继承了二维线性鉴别分析方法的优点,引入模糊集理论以得到样本的分布信息,并将该信息融入特征提取的过程中,以抽取更有助于分类的有效特征。模糊隶属度函数的引入,原始样本的分布通过相应的隶属度信息体现在散布矩阵的定义中,每一样本对于分类所做的贡献通过相应的隶属度函数来体现,更有助于抽取代表原始样本分布的特征信息。在 AT&T 人脸库上的实验结果验证了该算法优于传统的二维线性鉴别分析人脸识别方法和 Fisherface 人脸识别方法。