《1 引言》
1 引言
综合评价是指对以多属性体系结构描述的对象系统作出全局性、整体性的评价
由于应用不同的方法对同一对象进行评价所得到的结果往往存在着差异, 同时每一种方法都各有其优缺点, 无法说明哪一种方法好或不好, 仅采用一种方法进行评价无疑具有一定的片面性。为解决上述问题, 目前有不少学者提出了组合评价的思路
由于评价机理的不同, 不同方法对被评价对象是有偏好的, 即有些方法可能更适合于对某些问题进行评价, 而对另一些问题可能不太适合, 或者适合的程度有所不同。要建立多方法的组合评价模型, 必须对这些规律有所了解。从实践意义上来讲, 要研究不同评价方法的漂移规律, 可以通过对大量的实例用不同的方法进行评价后加以归纳和总结。显然, 大量实例 (样本) 的采集, 难度相当大。因此, 通过仿真实验的方法研究单一方法评价结论的漂移性, 旨在为组合评价提供实验依据。
《2 基本思路》
2 基本思路
漂移性定义为评价结论与客观实际的不一致性。漂移度是单一方法评价结论漂移性的测度。
《2.1基本假设》
2.1基本假设
对单一方法评价结论漂移性的测度研究基于以下基本假设:
假设1 漂移性假设 对同一对象运用多种不同方法分别进行评价时客观上存在着结论的漂移性问题, 即评价结论与客观实际存在一定差异, 同时不同方法所得结论之间也存在差异。
假设2 相容性假设 不同的评价方法对不同的待评价问题适用程度是有差异的, 有些可能是根本不适用的。对某特定待评价问题而言, 不适用的方法称为不相容方法, 适用的方法称为相容的方法。
假设3 待评价对象的等级差异假设 在实践中同一组内若干个被评价对象客观上存在等级差异。
假设4 待评价对象数据分布假设 某特定等级内待评价对象某属性 (指标) 值的样本数据服从正态分布。
《2.2基本思路》
2.2基本思路
试图通过计算机仿真实验揭示不同方法评价结论的漂移规律, 并对漂移性进行测度。基本思路如图1所示, 具体说明如下:
Step 1 确定实验方法 选择几种有代表性的评价方法进行实验。
Step 2 利用系统仿真方法生成足够的待评价样本对象 根据实验设计要求利用MATLAB6.1生成接近现实的分等级的待评价样本对象。
Step 3 利用几种不同的评价方法分别对相同待评价样本对象进行评价, 并将评价结果进行标准化处理。
Step 4 相容性检验包括直观判断和模糊聚类分析。
直观判断 比较各种不同方法的评价结论与预期结果 (实验数据生成时人为划分的等级) 是否相似, 对评价结论与预期结果明显不相似的方法可认为相对于被评价对象此方法为不相容方法, 应予以剔除。所有通过直观判断未被剔除的方法构成方法集M。
模糊聚类分析 对方法集M进一步用模糊聚类方法检验其相容性。步骤如下:
a.对方法集M中所有方法的评价结论向量作模糊聚类分析, 在给定阀值ξ的情况下可以将其分成2类, 第一类仅由第k种方法的评价结论uk组成, 第二类由除uk以外的所有向量组成。
b.求第二类评价结论的平均向量
c.求uk与
《图1》
Fig.1 Basic thought of simulation to measure drifting degree of single method evaluation conclusion
Step 5 求标准化处理以后相容评价方法评价结论的平均值, 并作为各种方法评价结论漂移性测度的参照系。
Step 6 求各评价方法标准化处理后的评价值与所有相容方法评价结论的平均值的相关系数r。
Step 7 求漂移度 将漂移度定义为p=1-r。
《3 实验设计》
3 实验设计
《3.1确定实验方法》
3.1确定实验方法
参考文献
1) 具有相同属性的综合评价方法
常见的单一评价方法中, 有一类方法能够实现对结构不良的系统对象进行有效的评价;同时, 这类方法在评价时可以避开人为权重, 减小因主观性造成的偏差, 评价结论体现了评价对象的实际水平;另外, 对于每个对象的评价结果均以一个评价值来反映, 且此数值的差异在一定意义上反映对象的差异程度。这类方法, 定义为具有相同属性的综合评价方法集合, 简称综合评价方法集合1。
2) 特殊属性的综合评价方法
在综合评价方法中, 有一类方法由于其工作机理的特殊性, 只能适用于某些特定属性的评价对象, 而不具有一般的适用性;同时与综合评价方法集合1相比, 其评价的结论没有一般的可比性。定义此类方法为具有特殊属性的综合评价方法集合, 简称综合评价方法集合2。
3) 基于方法论层次的综合评价方法
在综合评价中, 存在另外一类评价方法, 与评价方法集合1、评价方法集合2相比, 这类方法实质上是一种思想体系。它可以指导人们如何去选择合适的评价方法, 如何去有效地、合理地执行具体的评价工作;可以很好地指导评价工作者系统地、逻辑地去思考整个评价问题, 确保不遗漏任何有可能引起重要后果的部分;在评价中合理地考虑并处理好人理关系可以更有利于评价工作的顺利完成, 并保证评价结果的有效利用。定义这类方法为评价方法集合3, 或方法论层次的评价方法。
由于第一层次是一些最常用的评价方法, 故实验主要对其展开讨论。它主要包括统计分析方法、人工神经网络方法、熵值法、改进的数据包络分析法、灰色关联度法、模糊综合评价法。由于人工神经网络方法必须事先有样本进行训练, 因此实验暂不考虑此方法。
《3.2评价对象分类》
3.2评价对象分类
根据现实评价问题, 把待评价对象分为以下3类分别进行实验:
1) 只有正向指标的评价问题。
2) 只有逆向指标的评价问题。
3) 既有正向指标又有逆向指标的评价问题, 将该类评价对象再分为3类进行实验:a.投入少量增加引起产出大幅度增加的规模收益递增的投入—产出型问题;b.投入大幅度增加而产出只有少量增加的规模收益递减的投入—产出型问题;c.规模收益不变的投入—产出型问题。
《3.3实验数据生成》
3.3实验数据生成
假设每个被评价对象由若干属性 (指标) 值来体现 (其中有正向指标和逆向指标若干) , 运用Matlab 6.1生成若干组评价样本 (每组包含若干个待评价对象) 。根据前面的基本假设, 在生成每组待评价对象时, 人为划分若干等级 (以1—100的随机数表示, 视为标准化以后的样本数据) , 属于同一等级的被评价对象分别在一定范围 (期望值、方差) 内生成服从正态分布的属性值。
《3.4评价及漂移度计算》
3.4评价及漂移度计算
利用前面确定的评价方法分别对以上3大类评价对象的实验数据进行评价, 利用MATLAB 6.1编程计算熵值法、灰色关联度法、模糊综合评价法和改进的DEA方法评价结果。利用SPSS计算主成分分析法评价结果。对于以上5种方法的评价结果都利用极差变换法进行标准化处理。然后按照以上基本思路的Step 4至Step 7进行方法的相容性检验和漂移性计算。
《4 实验过程、结果及其分析》
4 实验过程、结果及其分析
对以上3大类评价对象分别进行实验:对每一类对象利用MATLAB 6.1生成10组服从正态分布的随机样本, 每组样本都包含3个等级, 每个等级各20个样本 (对象、方案) , 这样每组共有60个待评价对象。
《4.1只有正向指标的评价问题》
4.1只有正向指标的评价问题
服从正态分布的随机数按如下规则生成:
等级 7个正向指标
一级 random (norm, 75, 9, 20, 7)
二级 random (norm, 50, 16, 20, 7)
三级 random (norm, 25, 9, 20, 7)
Random函数说明:第一个参数表示服从正态分布, 第二个参数表示均值, 第三个参数表示方差, 第四个参数表示随机数矩阵的行数 (待评价对象数) , 第五个参数表示随机数矩阵的列数 (评价指标数)
利用熵值法、灰色关联度法、模糊综合评价法和主成分分析法分别对以上生成的待评价对象进行评价, 并进行相容性检验。结果表明, 此4种方法为相容方法, 求经过标准化处理后相容方法评价结果的平均值。再分别求各种方法的评价结论与平均值的相关系数r, 得到各单一方法评价结论的漂移度p=1-r, 如表1所示。
Table 1 Drifting degrees of evaluation objects with positive indicators only
《表1》
实验 组数 | 熵值法 | 灰色关 联度法 | 模糊综合 评价法 | 主成分 分析法 |
1 | 0.001 217 000 | 0.005 619 | 0.001 817 | 0.000 812 |
2 | 0.000 985 424 | 0.005 771 | 0.002 636 | 0.000 931 |
3 | 0.001 383 530 | 0.006 084 | 0.001 689 | 0.001 234 |
4 | 0.001 105 721 | 0.006 403 | 0.001 891 | 0.000 950 |
5 | 0.001 148 000 | 0.005 872 | 0.001 905 | 0.001 024 |
6 | 0.001 383 530 | 0.006 084 | 0.001 689 | 0.001 234 |
7 | 0.001 090 378 | 0.006 401 | 0.001 887 | 0.000 944 |
8 | 0.001 147 921 | 0.005 872 | 0.001 905 | 0.001 024 |
9 | 0.001 085 043 | 0.006 326 | 0.002 783 | 0.000 953 |
10 | 0.001 217 361 | 0.005 619 | 0.001 817 | 0.000 812 |
平均值 | 0.001 176 391 | 0.006 005 | 0.002 002 | 0.000 992 |
表1的实验结果表明, 对于此类问题, 这4种评价方法是适合的, 且漂移度很小, 其漂移度大小关系为:主成分分析法<熵值法<模糊综合评价法<灰色关联度法。
《4.2只有逆向指标的评价问题》
4.2只有逆向指标的评价问题
待评价对象按如下规则生成:
等级 7个逆向指标
三级 random (norm, 75, 9, 20, 7)
二级 random (norm, 50, 16, 20, 7)
一级 random (norm, 25, 9, 20, 7)
利用熵值法、灰色关联度法、模糊综合评价法和主成分分析法分别对以上生成的待评价对象进行评价, 并进行相容性检验。结果表明, 这4种方法为相容方法, 求经过标准化处理后相容方法评价结果的平均值。再分别求各种方法的评价结论与平均值的相关系数r, 得到各单一方法评价结论的漂移度, 如表2所示。
Table 2 Drifting degrees of evaluation objects with reverse indicators only
《表2》
实验 组数 | 熵值法 | 灰色关 联度法 | 模糊综合 评价法 | 主成分 分析法 |
1 | 0.059 122 | 0.004 483 | 0.022 355 | 0.015 149 |
2 | 0.010 674 | 0.003 136 | 0.018 768 | 0.007 199 |
3 | 0.091 158 | 0.007 901 | 0.028 625 | 0.023 610 |
4 | 0.001 148 | 0.005 872 | 0.001 905 | 0.001 024 |
5 | 0.010 452 | 0.002 864 | 0.019 161 | 0.006 993 |
6 | 0.059 122 | 0.004 483 | 0.022 355 | 0.015 149 |
7 | 0.021 677 | 0.004 568 | 0.024 836 | 0.014 975 |
8 | 0.057 980 | 0.004 837 | 0.024 796 | 0.014 637 |
9 | 0.015 465 | 0.002 860 | 0.023 129 | 0.010 016 |
10 | 0.230 610 | 0.010 329 | 0.031 281 | 0.028 658 |
平均值 | 0.055 741 | 0.005 133 | 0.021 721 | 0.013 741 |
表2的实验结果表明, 对于此类问题, 这4种评价方法是适合的, 且漂移度较小, 其漂移度大小关系为:灰色关联度法<主成分分析法<模糊综合评价法<熵值法。
《4.3既有正向指标也有逆向指标的评价问题》
4.3既有正向指标也有逆向指标的评价问题
《4.3.1 投入少量增加引起产出大幅度增加的规模收益递增的投入—产出型问题 待评价对象按如下规则生成:》
4.3.1 投入少量增加引起产出大幅度增加的规模收益递增的投入—产出型问题 待评价对象按如下规则生成:
等级 4个输入 (逆向) 指标 8个输出 (正向) 指标
一级 random (norm, 60, 9, 20, 4) random (norm, 80, 9, 20, 8)
二级 random (norm, 50, 9, 20, 4) random (norm, 50, 9, 20, 8)
三级 random (norm, 40, 9, 20, 4) random (norm, 30, 9, 20, 8)
利用熵值法、灰色关联度法、模糊综合评价法、改进的DEA方法和主成分分析法分别对以上生成的待评价对象进行评价, 并进行相容性检验, 结果表明这5种方法为相容方法, 求经过标准化处理后相容方法评价结果的平均值。再分别求各种方法的评价结论与平均值的相关系数r, 得到各单一方法评价结论的漂移度, 如表3所示。
表3的实验结果表明, 对于此类问题, 这5种评价方法是适合的, 且漂移度较小, 其漂移度大小关系为:熵值法<模糊综合评价法<主成分分析法<灰色关联度法<改进的DEA法。
《4.3.2 投入大幅度增加而产出只有少量增加的规模收益递减的投入—产出型问题 待评价对象按如下规则生成:》
4.3.2 投入大幅度增加而产出只有少量增加的规模收益递减的投入—产出型问题 待评价对象按如下规则生成:
等级 5个输入指标 3个输出指标
一级 random (norm, 30, 9, 20, 5) random (norm, 40, 9, 20, 3)
二级 random (norm, 50, 9, 20, 5) random (norm, 50, 9, 20, 3)
三级 random (norm, 80, 9, 20, 5) random (norm, 60, 9, 20, 3)
Table 3 Drifting degrees of evaluation objects with increasing returns to scale
《表3》
实验 组数 | 熵值法 | 灰色关 联度法 | 模糊综合 评价法 | 改进的 DEA法 | 主成分 分析法 |
1 | 0.020 713 | 0.027 200 | 0.017 580 | 0.127 470 | 0.028 489 |
2 | 0.005 035 | 0.039 831 | 0.004 002 | 0.087 194 | 0.027 249 |
3 | 0.006 267 | 0.039 198 | 0.008 945 | 0.142 852 | 0.034 578 |
4 | 0.003 379 | 0.025 107 | 0.005 508 | 0.105 458 | 0.031 006 |
5 | 0.007 600 | 0.033 199 | 0.005 002 | 0.099 742 | 0.038 056 |
6 | 0.004 078 | 0.036 822 | 0.005 207 | 0.108 031 | 0.030 190 |
7 | 0.010 453 | 0.022 505 | 0.008 166 | 0.079 229 | 0.019 989 |
8 | 0.005 882 | 0.031 551 | 0.004 175 | 0.146 524 | 0.045 690 |
9 | 0.005 266 | 0.036 403 | 0.008 576 | 0.125 614 | 0.030 039 |
10 | 0.005 278 | 0.032 244 | 0.006 924 | 0.124 349 | 0.036 230 |
平均值 | 0.007 395 | 0.032 406 | 0.007 409 | 0.114 646 | 0.032 152 |
利用熵值法、灰色关联度法、模糊综合评价法、改进的DEA方法和主成分分析法分别对以上生成的待评价对象进行评价, 并进行相容性检验, 结果表明这5种方法为相容方法, 求经过标准化处理后相容方法评价结果的平均值。再分别求各种方法的评价结论与平均值的相关系数r, 得到各单一方法评价结论的漂移度, 如表4所示。
表4的实验结果表明, 对于此类问题, 这5种评价方法是适合的, 且漂移度较小, 其漂移度大小关系如下:灰色关联度法<熵值法<模糊综合评价法<主成分分析法<改进的DEA法。
《4.3.3 规模收益不变的投入—产出型问题 待评价对象按如下规则生成:》
4.3.3 规模收益不变的投入—产出型问题 待评价对象按如下规则生成:
4个输入指标 4个输出指标
random (norm, 25, 9, 20, 4) random (norm, 25, 9, 20, 4)
random (norm, 50, 16, 20, 4) random (norm, 50, 16, 20, 4)
random (norm, 75, 9, 20, 4) random (norm, 75, 9, 20, 4)
利用熵值法、灰色关联度法、模糊综合评价法、改进的DEA方法和主成分分析法分别对以上生成的待评价对象进行评价, 并进行相容性检验, 结果表明主成分分析法为不相容方法;熵值法、灰色关联度法、模糊综合评价法、改进的DEA方法为相容方法, 求这4种相容方法标准化处理后的评价结果平均值。再分别求5种方法评价结果与平均值的相关系数, 得到它们漂移度, 如表5所示。
Table 4 Drifting degrees of evaluation objects with decreasing returns to scale
《表4》
实验 组数 | 熵值法 | 灰色关 联度法 | 模糊综合 评价法 | 改进的 DEA法 | 主成分 分析法 |
1 | 0.018 553 | 0.020 251 | 0.041 745 | 0.192 904 | 0.057 536 |
2 | 0.030 686 | 0.021 228 | 0.048 150 | 0.220 476 | 0.057 183 |
3 | 0.023 444 | 0.023 943 | 0.039 115 | 0.286 142 | 0.038 879 |
4 | 0.030 416 | 0.027 780 | 0.046 749 | 0.220 844 | 0.076 337 |
5 | 0.028 581 | 0.020 672 | 0.040 306 | 0.170406 | 0.062 919 |
6 | 0.025 473 | 0.020 101 | 0.044 249 | 0.185 079 | 0.053 195 |
7 | 0.016 156 | 0.028 929 | 0.045 208 | 0.216 193 | 0.042 450 |
8 | 0.022 675 | 0.024 181 | 0.033 174 | 0.190 681 | 0.067 395 |
9 | 0.016 262 | 0.020 448 | 0.048 076 | 0.142 697 | 0.043 037 |
10 | 0.050 042 | 0.028 799 | 0.046 132 | 0.178 081 | 0.050 583 |
平均值 | 0.026 229 | 0.023 633 | 0.043 290 | 0.200 350 | 0.054 951 |
Table 5 Drifting degrees of evaluation objects with constant returns to scale
《表5》
实验 组数 | 熵值法 | 灰色关 联度法 | 模糊综合 评价法 | 改进的 DEA法 | 主成分 分析法 |
1 | 0.295 706 | 0.139 068 | 0.162 640 | 0.368 636 | 1.045 135 |
2 | 0.346 771 | 0.161 545 | 0.249 379 | 0.323 425 | 1.316 514 |
3 | 0.494 285 | 0.136 897 | 0.160 525 | 0.316 399 | 0.991 857 |
4 | 0.211 996 | 0.174 708 | 0.255 238 | 0.301 345 | 0.766 821 |
5 | 0.105 338 | 0.094 765 | 0.188 223 | 0.303 039 | 1.157 558 |
6 | 0.198 759 | 0.139 405 | 0.167 139 | 0.295 580 | 1.117 831 |
7 | 0.328 100 | 0.139 641 | 0.193 115 | 0.357 292 | 1.205 989 |
8 | 0.128 509 | 0.104 290 | 0.216 847 | 0.252 908 | 1.316 560 |
9 | 0.117 520 | 0.136 192 | 0.170 332 | 0.327 708 | 1.065 489 |
10 | 0.196 129 | 0.106 219 | 0.174 739 | 0.313 298 | 1.138 674 |
平均值 | 0.242 311 | 0.133 273 | 0.193 818 | 0.315 963 | 1.112 243 |
实验中, 对于规模收益不变的投入—产出型问题, 主成分分析法为不相容方法, 漂移度很大, 不适合评价该类问题;熵值法、灰色关联度法、模糊综合评价法和改进的DEA法为相容方法。这5种方法的漂移度大小关系为:灰色关联度法<模糊综合评价法<熵值法<改进的DEA法<主成分分析法。
《5 结论》
5 结论
通过仿真实验研究单一评价方法的漂移性, 为综合评价方法的研究提供了很好的思路。研究结果可为建立组合评价模型提供实验依据。一般认为, 用于组合评价的方法集应定义为所有相容方法的集合, 在组合时对于漂移度大的评价方法应赋予较小的权重, 对于漂移度较小的评价方法应赋予较大的权重。