《1 引言》

1 引言

综合评价是指对以多属性体系结构描述的对象系统作出全局性、整体性的评价[1]。目前国内外建立的综合评价方法有数百种之多, 但大多数尚处于理论研究阶段, 不十分成熟。最主要的和最常用的方法有专家评价法、经济分析法、层次分析法、主成分分析法、因子分析法、人工神经网络法、数据包络分析法、灰色关联度法、模糊综合评价法、熵值法等等。

由于应用不同的方法对同一对象进行评价所得到的结果往往存在着差异, 同时每一种方法都各有其优缺点, 无法说明哪一种方法好或不好, 仅采用一种方法进行评价无疑具有一定的片面性。为解决上述问题, 目前有不少学者提出了组合评价的思路[2,3,4], 即选用多种方法进行评价, 而后将几种评价结果进行组合。但目前有关组合评价模型的依据都不够充分。因为到目前为止尚未有人对不同方法评价结论的差异 (漂移) 规律作过认真的研究, 因此, 很难提出让人信服的组合评价模型。

由于评价机理的不同, 不同方法对被评价对象是有偏好的, 即有些方法可能更适合于对某些问题进行评价, 而对另一些问题可能不太适合, 或者适合的程度有所不同。要建立多方法的组合评价模型, 必须对这些规律有所了解。从实践意义上来讲, 要研究不同评价方法的漂移规律, 可以通过对大量的实例用不同的方法进行评价后加以归纳和总结。显然, 大量实例 (样本) 的采集, 难度相当大。因此, 通过仿真实验的方法研究单一方法评价结论的漂移性, 旨在为组合评价提供实验依据。

《2 基本思路》

2 基本思路

漂移性定义为评价结论与客观实际的不一致性。漂移度是单一方法评价结论漂移性的测度。

《2.1基本假设》

2.1基本假设

对单一方法评价结论漂移性的测度研究基于以下基本假设:

假设1 漂移性假设 对同一对象运用多种不同方法分别进行评价时客观上存在着结论的漂移性问题, 即评价结论与客观实际存在一定差异, 同时不同方法所得结论之间也存在差异。

假设2 相容性假设 不同的评价方法对不同的待评价问题适用程度是有差异的, 有些可能是根本不适用的。对某特定待评价问题而言, 不适用的方法称为不相容方法, 适用的方法称为相容的方法。

假设3 待评价对象的等级差异假设 在实践中同一组内若干个被评价对象客观上存在等级差异。

假设4 待评价对象数据分布假设 某特定等级内待评价对象某属性 (指标) 值的样本数据服从正态分布。

《2.2基本思路》

2.2基本思路

试图通过计算机仿真实验揭示不同方法评价结论的漂移规律, 并对漂移性进行测度。基本思路如图1所示, 具体说明如下:

Step 1 确定实验方法 选择几种有代表性的评价方法进行实验。

Step 2 利用系统仿真方法生成足够的待评价样本对象 根据实验设计要求利用MATLAB6.1生成接近现实的分等级的待评价样本对象。

Step 3 利用几种不同的评价方法分别对相同待评价样本对象进行评价, 并将评价结果进行标准化处理。

Step 4 相容性检验包括直观判断和模糊聚类分析。

直观判断 比较各种不同方法的评价结论与预期结果 (实验数据生成时人为划分的等级) 是否相似, 对评价结论与预期结果明显不相似的方法可认为相对于被评价对象此方法为不相容方法, 应予以剔除。所有通过直观判断未被剔除的方法构成方法集M

模糊聚类分析 对方法集M进一步用模糊聚类方法检验其相容性。步骤如下:

a.对方法集M中所有方法的评价结论向量作模糊聚类分析, 在给定阀值ξ的情况下可以将其分成2类, 第一类仅由第k种方法的评价结论uk组成, 第二类由除uk以外的所有向量组成。

b.求第二类评价结论的平均向量u¯, 以代表第二类评价结论总体。

c.求uku¯的相关系数rk。在一定显著性水平下根据rk检验uku¯的相关性, 进而判断第k种方法与第二类方法全体是否相容。如果检验结果认为uku¯密切相关, 则判定集合M中的方法都具有相容性, M即为相容方法集M1;否则判定第k种方法是M中的一种不相容方法并将其从M中剔除, 然后对M中所剩余方法按以上步骤再进行检验, 直至找到相容方法集M1

《图1》

图1 单一方法评价结论漂移性测度的仿真实验基本思路

图1 单一方法评价结论漂移性测度的仿真实验基本思路  

Fig.1 Basic thought of simulation to measure drifting degree of single method evaluation conclusion

Step 5 求标准化处理以后相容评价方法评价结论的平均值, 并作为各种方法评价结论漂移性测度的参照系。

Step 6 求各评价方法标准化处理后的评价值与所有相容方法评价结论的平均值的相关系数r。

Step 7 求漂移度 将漂移度定义为p=1-r。

《3 实验设计》

3 实验设计

《3.1确定实验方法》

3.1确定实验方法

参考文献[5]中曾将已有的综合评价方法分成12类, 研究表明, 由于评价原理和适用对象的差异, 许多方法是不具有可比较性的, 也难以用一个统一的标准来寻找各种方法的偏移规律, 因此将方法分为3个层次分别讨论。

1) 具有相同属性的综合评价方法

常见的单一评价方法中, 有一类方法能够实现对结构不良的系统对象进行有效的评价;同时, 这类方法在评价时可以避开人为权重, 减小因主观性造成的偏差, 评价结论体现了评价对象的实际水平;另外, 对于每个对象的评价结果均以一个评价值来反映, 且此数值的差异在一定意义上反映对象的差异程度。这类方法, 定义为具有相同属性的综合评价方法集合, 简称综合评价方法集合1。

2) 特殊属性的综合评价方法

在综合评价方法中, 有一类方法由于其工作机理的特殊性, 只能适用于某些特定属性的评价对象, 而不具有一般的适用性;同时与综合评价方法集合1相比, 其评价的结论没有一般的可比性。定义此类方法为具有特殊属性的综合评价方法集合, 简称综合评价方法集合2。

3) 基于方法论层次的综合评价方法

在综合评价中, 存在另外一类评价方法, 与评价方法集合1、评价方法集合2相比, 这类方法实质上是一种思想体系。它可以指导人们如何去选择合适的评价方法, 如何去有效地、合理地执行具体的评价工作;可以很好地指导评价工作者系统地、逻辑地去思考整个评价问题, 确保不遗漏任何有可能引起重要后果的部分;在评价中合理地考虑并处理好人理关系可以更有利于评价工作的顺利完成, 并保证评价结果的有效利用。定义这类方法为评价方法集合3, 或方法论层次的评价方法。

由于第一层次是一些最常用的评价方法, 故实验主要对其展开讨论。它主要包括统计分析方法、人工神经网络方法、熵值法、改进的数据包络分析法、灰色关联度法、模糊综合评价法。由于人工神经网络方法必须事先有样本进行训练, 因此实验暂不考虑此方法。

熵值法、灰色关联度、模糊综合评价法、改进的DEA和主成分分析法都是评价中常用的方法[6,7,8,9,10]

《3.2评价对象分类》

3.2评价对象分类

根据现实评价问题, 把待评价对象分为以下3类分别进行实验:

1) 只有正向指标的评价问题。

2) 只有逆向指标的评价问题。

3) 既有正向指标又有逆向指标的评价问题, 将该类评价对象再分为3类进行实验:a.投入少量增加引起产出大幅度增加的规模收益递增的投入—产出型问题;b.投入大幅度增加而产出只有少量增加的规模收益递减的投入—产出型问题;c.规模收益不变的投入—产出型问题。

《3.3实验数据生成》

3.3实验数据生成

假设每个被评价对象由若干属性 (指标) 值来体现 (其中有正向指标和逆向指标若干) , 运用Matlab 6.1生成若干组评价样本 (每组包含若干个待评价对象) 。根据前面的基本假设, 在生成每组待评价对象时, 人为划分若干等级 (以1—100的随机数表示, 视为标准化以后的样本数据) , 属于同一等级的被评价对象分别在一定范围 (期望值、方差) 内生成服从正态分布的属性值。

《3.4评价及漂移度计算》

3.4评价及漂移度计算

利用前面确定的评价方法分别对以上3大类评价对象的实验数据进行评价, 利用MATLAB 6.1编程计算熵值法、灰色关联度法、模糊综合评价法和改进的DEA方法评价结果。利用SPSS计算主成分分析法评价结果。对于以上5种方法的评价结果都利用极差变换法进行标准化处理。然后按照以上基本思路的Step 4至Step 7进行方法的相容性检验和漂移性计算。

《4 实验过程、结果及其分析》

4 实验过程、结果及其分析

对以上3大类评价对象分别进行实验:对每一类对象利用MATLAB 6.1生成10组服从正态分布的随机样本, 每组样本都包含3个等级, 每个等级各20个样本 (对象、方案) , 这样每组共有60个待评价对象。

《4.1只有正向指标的评价问题》

4.1只有正向指标的评价问题

服从正态分布的随机数按如下规则生成:

等级 7个正向指标

一级 random (norm, 75, 9, 20, 7)

二级 random (norm, 50, 16, 20, 7)

三级 random (norm, 25, 9, 20, 7)

Random函数说明:第一个参数表示服从正态分布, 第二个参数表示均值, 第三个参数表示方差, 第四个参数表示随机数矩阵的行数 (待评价对象数) , 第五个参数表示随机数矩阵的列数 (评价指标数)

利用熵值法、灰色关联度法、模糊综合评价法和主成分分析法分别对以上生成的待评价对象进行评价, 并进行相容性检验。结果表明, 此4种方法为相容方法, 求经过标准化处理后相容方法评价结果的平均值。再分别求各种方法的评价结论与平均值的相关系数r, 得到各单一方法评价结论的漂移度p=1-r, 如表1所示。

表1 只有正向指标评价问题单一方法评价结论的漂移度

Table 1 Drifting degrees of evaluation objects with positive indicators only

《表1》

实验
组数
熵值法灰色关
联度法
模糊综合
评价法
主成分
分析法
10.001 217 0000.005 6190.001 8170.000 812

2
0.000 985 4240.005 7710.002 6360.000 931

3
0.001 383 5300.006 0840.001 6890.001 234

4
0.001 105 7210.006 4030.001 8910.000 950

5
0.001 148 0000.005 8720.001 9050.001 024

6
0.001 383 5300.006 0840.001 6890.001 234

7
0.001 090 3780.006 4010.001 8870.000 944

8
0.001 147 9210.005 8720.001 9050.001 024

9
0.001 085 0430.006 3260.002 7830.000 953

10
0.001 217 3610.005 6190.001 8170.000 812

平均值
0.001 176 3910.006 0050.002 0020.000 992

表1的实验结果表明, 对于此类问题, 这4种评价方法是适合的, 且漂移度很小, 其漂移度大小关系为:主成分分析法<熵值法<模糊综合评价法<灰色关联度法。

《4.2只有逆向指标的评价问题》

4.2只有逆向指标的评价问题

待评价对象按如下规则生成:

等级 7个逆向指标

三级 random (norm, 75, 9, 20, 7)

二级 random (norm, 50, 16, 20, 7)

一级 random (norm, 25, 9, 20, 7)

利用熵值法、灰色关联度法、模糊综合评价法和主成分分析法分别对以上生成的待评价对象进行评价, 并进行相容性检验。结果表明, 这4种方法为相容方法, 求经过标准化处理后相容方法评价结果的平均值。再分别求各种方法的评价结论与平均值的相关系数r, 得到各单一方法评价结论的漂移度, 如表2所示。

表2 只有逆向指标评价问题单一方法评价结论的漂移度

Table 2 Drifting degrees of evaluation objects with reverse indicators only

《表2》


实验
组数
熵值法灰色关
联度法
模糊综合
评价法
主成分
分析法

1
0.059 1220.004 4830.022 3550.015 149

2
0.010 6740.003 1360.018 7680.007 199

3
0.091 1580.007 9010.028 6250.023 610

4
0.001 1480.005 8720.001 9050.001 024

5
0.010 4520.002 8640.019 1610.006 993

6
0.059 1220.004 4830.022 3550.015 149

7
0.021 6770.004 5680.024 8360.014 975

8
0.057 9800.004 8370.024 7960.014 637

9
0.015 4650.002 8600.023 1290.010 016

10
0.230 6100.010 3290.031 2810.028 658

平均值
0.055 7410.005 1330.021 7210.013 741

表2的实验结果表明, 对于此类问题, 这4种评价方法是适合的, 且漂移度较小, 其漂移度大小关系为:灰色关联度法<主成分分析法<模糊综合评价法<熵值法。

《4.3既有正向指标也有逆向指标的评价问题》

4.3既有正向指标也有逆向指标的评价问题

《4.3.1 投入少量增加引起产出大幅度增加的规模收益递增的投入—产出型问题 待评价对象按如下规则生成:》

4.3.1 投入少量增加引起产出大幅度增加的规模收益递增的投入—产出型问题 待评价对象按如下规则生成:

等级 4个输入 (逆向) 指标 8个输出 (正向) 指标

一级 random (norm, 60, 9, 20, 4) random (norm, 80, 9, 20, 8)

二级 random (norm, 50, 9, 20, 4) random (norm, 50, 9, 20, 8)

三级 random (norm, 40, 9, 20, 4) random (norm, 30, 9, 20, 8)

利用熵值法、灰色关联度法、模糊综合评价法、改进的DEA方法和主成分分析法分别对以上生成的待评价对象进行评价, 并进行相容性检验, 结果表明这5种方法为相容方法, 求经过标准化处理后相容方法评价结果的平均值。再分别求各种方法的评价结论与平均值的相关系数r, 得到各单一方法评价结论的漂移度, 如表3所示。

表3的实验结果表明, 对于此类问题, 这5种评价方法是适合的, 且漂移度较小, 其漂移度大小关系为:熵值法<模糊综合评价法<主成分分析法<灰色关联度法<改进的DEA法。

《4.3.2 投入大幅度增加而产出只有少量增加的规模收益递减的投入—产出型问题 待评价对象按如下规则生成:》

4.3.2 投入大幅度增加而产出只有少量增加的规模收益递减的投入—产出型问题 待评价对象按如下规则生成:

等级 5个输入指标 3个输出指标

一级 random (norm, 30, 9, 20, 5) random (norm, 40, 9, 20, 3)

二级 random (norm, 50, 9, 20, 5) random (norm, 50, 9, 20, 3)

三级 random (norm, 80, 9, 20, 5) random (norm, 60, 9, 20, 3)

表3 规模收益递增型评价问题单一方法评价结论的漂移度

Table 3 Drifting degrees of evaluation objects with increasing returns to scale

《表3》


实验
组数
熵值法灰色关
联度法
模糊综合
评价法
改进的
DEA法
主成分
分析法

1
0.020 7130.027 2000.017 5800.127 4700.028 489

2
0.005 0350.039 8310.004 0020.087 1940.027 249

3
0.006 2670.039 1980.008 9450.142 8520.034 578

4
0.003 3790.025 1070.005 5080.105 4580.031 006

5
0.007 6000.033 1990.005 0020.099 7420.038 056

6
0.004 0780.036 8220.005 2070.108 0310.030 190

7
0.010 4530.022 5050.008 1660.079 2290.019 989

8
0.005 8820.031 5510.004 1750.146 5240.045 690

9
0.005 2660.036 4030.008 5760.125 6140.030 039

10
0.005 2780.032 2440.006 9240.124 3490.036 230

平均值
0.007 3950.032 4060.007 4090.114 6460.032 152

利用熵值法、灰色关联度法、模糊综合评价法、改进的DEA方法和主成分分析法分别对以上生成的待评价对象进行评价, 并进行相容性检验, 结果表明这5种方法为相容方法, 求经过标准化处理后相容方法评价结果的平均值。再分别求各种方法的评价结论与平均值的相关系数r, 得到各单一方法评价结论的漂移度, 如表4所示。

表4的实验结果表明, 对于此类问题, 这5种评价方法是适合的, 且漂移度较小, 其漂移度大小关系如下:灰色关联度法<熵值法<模糊综合评价法<主成分分析法<改进的DEA法。

《4.3.3 规模收益不变的投入—产出型问题 待评价对象按如下规则生成:》

4.3.3 规模收益不变的投入—产出型问题 待评价对象按如下规则生成:

4个输入指标 4个输出指标

random (norm, 25, 9, 20, 4) random (norm, 25, 9, 20, 4)

random (norm, 50, 16, 20, 4) random (norm, 50, 16, 20, 4)

random (norm, 75, 9, 20, 4) random (norm, 75, 9, 20, 4)

利用熵值法、灰色关联度法、模糊综合评价法、改进的DEA方法和主成分分析法分别对以上生成的待评价对象进行评价, 并进行相容性检验, 结果表明主成分分析法为不相容方法;熵值法、灰色关联度法、模糊综合评价法、改进的DEA方法为相容方法, 求这4种相容方法标准化处理后的评价结果平均值。再分别求5种方法评价结果与平均值的相关系数, 得到它们漂移度, 如表5所示。

表4 规模收益递减型评价问题单一方法评价结论的漂移度

Table 4 Drifting degrees of evaluation objects with decreasing returns to scale

《表4》


实验
组数
熵值法灰色关
联度法
模糊综合
评价法
改进的
DEA法
主成分
分析法

1
0.018 553 0.020 251 0.041 745 0.192 904 0.057 536

2
0.030 6860.021 2280.048 1500.220 4760.057 183

3
0.023 4440.023 9430.039 1150.286 1420.038 879

4
0.030 4160.027 7800.046 7490.220 8440.076 337

5
0.028 5810.020 6720.040 3060.1704060.062 919

6
0.025 4730.020 1010.044 2490.185 0790.053 195

7
0.016 1560.028 9290.045 2080.216 1930.042 450

8
0.022 6750.024 1810.033 1740.190 6810.067 395

9
0.016 2620.020 4480.048 0760.142 6970.043 037

10
0.050 0420.028 7990.046 1320.178 0810.050 583

平均值
0.026 2290.023 6330.043 2900.200 3500.054 951

表5 规模收益不变型评价问题单一方法评价结论的漂移度

Table 5 Drifting degrees of evaluation objects with constant returns to scale

《表5》


实验
组数
熵值法灰色关
联度法
模糊综合
评价法
改进的
DEA法
主成分
分析法

1
0.295 7060.139 0680.162 6400.368 6361.045 135

2
0.346 7710.161 5450.249 3790.323 4251.316 514

3
0.494 2850.136 8970.160 5250.316 3990.991 857

4
0.211 9960.174 7080.255 2380.301 3450.766 821

5
0.105 3380.094 7650.188 2230.303 0391.157 558

6
0.198 7590.139 4050.167 1390.295 5801.117 831

7
0.328 1000.139 6410.193 1150.357 2921.205 989

8
0.128 5090.104 2900.216 8470.252 9081.316 560

9
0.117 5200.136 1920.170 3320.327 7081.065 489

10
0.196 1290.106 2190.174 7390.313 2981.138 674

平均值
0.242 3110.133 2730.193 8180.315 9631.112 243

实验中, 对于规模收益不变的投入—产出型问题, 主成分分析法为不相容方法, 漂移度很大, 不适合评价该类问题;熵值法、灰色关联度法、模糊综合评价法和改进的DEA法为相容方法。这5种方法的漂移度大小关系为:灰色关联度法<模糊综合评价法<熵值法<改进的DEA法<主成分分析法。

《5 结论》

5 结论

通过仿真实验研究单一评价方法的漂移性, 为综合评价方法的研究提供了很好的思路。研究结果可为建立组合评价模型提供实验依据。一般认为, 用于组合评价的方法集应定义为所有相容方法的集合, 在组合时对于漂移度大的评价方法应赋予较小的权重, 对于漂移度较小的评价方法应赋予较大的权重。