《1 引言》
1 引言
在模式识别领域中, Fisher线性判别方法有着重大的影响, 其基本思想是在Fisher鉴别准则函数取极值的条件下, 求得一个最佳鉴别方向, 然后再将模式高维特征向量投影到该最佳鉴别方向上, 构成一维鉴别特征空间, 于是模式鉴别分析就在一维空间中进行
Foley 和Sammon在1970年发展了Fisher线性判别方法, 提出了Sammon最佳鉴别平面的技术, 并将它用于解决两类问题
《2 统计不相关最佳鉴别矢量集》
2 统计不相关最佳鉴别矢量集
设w1, w2, …, wm为m个模式类, X={xi}, i=1, 2, …, N 为n维训练样本集, X中的每一个xi属于wj类, 即xi∈wj, i=1, 2, …, N , j=1, 2, …, m。设wi类的平均矢量、协方差矩阵与先验概率分别为mi, Ci, P (wi) , 则类间散布矩阵Sb、类内散布矩阵Sw和总散布矩阵St分别为:
其中m0为全体训练样本的平均矢量, E表示数学期望。
由散布矩阵, Fisher鉴别函数可定义为
《图1》
其中φ为任一n维列矢量。使函数J (φ) 达到最大值的矢量φ*1为Fisher最佳鉴别方向, 训练样本在方向φ*1上的投影集, 在一维子空间Span { (φ*1} 中有最小的类内距离和最大的类间距离。
设φ1=φ*1/|φ*1|, 则φ1是Foley-Sammon最佳鉴别矢量集的第一个矢量, Foley-Sammon最佳鉴别矢量集的第i个鉴别矢量 φi (1<i≤ r) 可以由解下列问题计算得到:
《图2》
设S={φi}, i=1, 2, …, r。 由Foley-Sammon最佳鉴别矢量集可以构成线性变换:
其中 Φ=[φ1φ2 … φr]。
当r=2时, Foley-Sammon最佳鉴别矢量集等价于Sammon最佳鉴别平面。
首先求出Fisher最佳鉴别方向φ1。在求出r (r≥1) 个最佳鉴别方向φ1, φ2, …, φr后, 第r+1个最佳鉴别方向在满足共轭正交条件式 (9) 下, 使Fisher鉴别准则函数式 (6) 取得最大值的向量φr+1:
《图3》
关于具有统计不相关性的最佳鉴别方向的求解有如下的定理:
《图4》
式中
I为单位矩阵, 而且,
《图5》
《3 统计不相关最佳鉴别矢量集的本质》
3 统计不相关最佳鉴别矢量集的本质
事实上, 若统计不相关性最佳鉴别矢量集为φ1, φ2, …, φn, 则有
《图6》
因此, 若St退化为单位矩阵时, 统计不相关性就退化为正交性, 那么, 能否找到一个线性变换使得St变换为单位矩阵呢?这是下面将要解决的问题。
对St进行特征分解,
《图7》
由于V是正交矩阵, 所以VVT=I, 即VT=V-1, 因此白化变换为
《图8》
样本x经白化变换后的样本为
同样,
这样, 用任何一种方法求得的2个最优鉴别矢量φi和φj (i≠j) 都是正交的, 即φTiφj=0。在空间
根据上述分析, 可以得到统计不相关最优鉴别矢量集的本质, 即统计不相关最优鉴别是白化变换加普通线性鉴别变换。
《4 实验与结果分析》
4 实验与结果分析
从ORL人脸图像库中分别取出若干个人的脸部图像 (92×112) , 每人10幅图像。计算中, 取每人的4幅图像训练, 其余6幅图像作为检验样本。分别用文献
《5 结论》
5 结论
笔者对统计不相关最佳鉴别矢量集的求解方法进行研究, 获得如下结论:
1) 对统计不相关最佳鉴别矢量集的本质进行研究表明, 统计不相关最优鉴别是白化变换加普通线性鉴别变换。这丰富了模式识别中有关特征提取的理论。
表1 文献
Table 1 Performance comparison of the algorithm in
《表1》
类数 |
鉴别 矢量数 |
训练 样本数 |
文献[9]的方法 |
改进后的方法 | ||
错误 识别数 |
计算 时间/s |
错误 识别数 |
计算 时间/s |
|||
5 | 4 | 4 | 1 | 13.73 | 1 | 73.32 |
10 |
9 | 4 | 4 | 21.26 | 2 | 100.68 |
15 |
14 | 4 | 8 | 25.93 | 2 | 106.72 |
20 |
19 | 4 | 33 | 25.49 | 19 | 83.93 |
25 |
24 | 4 | 57 | 21.03 | 23 | 61.63 |
30 |
29 | 4 | 64 | 15.16 | 16 | 15.27 |
35 |
34 | 4 | 92 | 20.21 | 17 | 20.05 |
40 |
39 | 4 | 92 | 26.04 | 33 | 25.71 |
表2 文献
Table 2 Performance comparison of the algorithm in
《表2》
类数 |
鉴别 矢量数 |
训练 样本数 |
文献[10]的方法 |
改进后的方法 | ||
错误 识别数 |
计算 时间/s |
错误 识别数 |
计算 时间/s |
|||
25 | 24 | 4 | 57 | 4.34 | 15 | 12.03 |
30 |
29 | 4 | 73 | 1.04 | 16 | 1.48 |
35 |
34 | 4 | 80 | 1.43 | 17 | 1.59 |
40 |
39 | 4 | 93 | 1.59 | 33 | 1.87 |
表3 文献
Table 3 Performance comparison of the algorithm in
《表3》
类数 |
鉴别 矢量数 |
训练 样本数 |
文献[13]的方法 |
改进后的方法 | ||
错误 识别数 |
计算 时间/s |
错误 识别数 |
计算 时间/s |
|||
5 | 4 | 4 | 1 | 3.84 | 1 | 16.04 |
10 |
9 | 4 | 3 | 3.46 | 2 | 12.41 |
15 |
14 | 4 | 3 | 3.25 | 1 | 9.67 |
20 |
19 | 4 | 16 | 2.97 | 13 | 5.27 |
25 |
24 | 4 | 15 | 2.91 | 14 | 5.88 |
30 |
29 | 4 | 24 | 0.61 | 16 | 1.16 |
35 |
34 | 4 | 28 | 0.71 | 17 | 1.26 |
40 |
39 | 4 | 41 | 0.88 | 33 | 1.49 |
2) 该方法的最大优点在于所获得的最优鉴别矢量, 同时具有正交性和统计不相关性。不仅如此, 该方法对代数特征抽取具有普遍适用性。
3) 该方法不仅对人脸的特征提取非常有效, 而且对手写体数字识别、汉字识别以及基于内容的检索等模式识别领域的研究都有一定的意义。