《1 引言》

1 引言

制造企业信息化 (manufacturing enterprise informatization) 是制造企业将信息技术、自动化技术、现代管理技术与制造技术相结合, 改善制造企业的经营、管理、产品开发和生产等各个环节, 提高生产效率、产品质量和企业创新能力, 降低消耗, 带动产品设计方法和设计工具的创新, 从而全面提升企业的竞争力[1]。制造企业选择实施信息化是基于企业生存发展的内在动力和源于竞争对手、顾客等外部压力综合作用下的战略选择, 目的是创造和保持持久的竞争能力和竞争效果。制造企业信息化是信息技术环境下制造企业发展的必然选择。制造企业信息化是一项系统工程, 从属于信息化大系统。制造企业信息化建设过程, 实际上也是一个不断评价和完善的过程。制造企业信息化评价从表面上看是一个检验体系, 事实上更重要的是一个企业信息化建设的指导体系。有了这个体系就可以帮助企业有针对性地解决信息技术运行过程中的效率、成本、服务、技术创新等方面的问题。由于中国制造企业信息化尚处于初级阶段, 与信息化技术研究相比, 信息化评价研究相对滞后。

为了对制造企业信息化状况进行综合评价, 通常采用的是简单的加权合成法。这种方法的突出问题是主观赋权, 人为地给定权数, 一方面会导致对某一个因素过高或过低的估计, 使评价结果不能反映企业的真实情况;另一方面会诱使企业粉饰或片面追求权重较高的指标。而多元统计分析中的因子分析法在构造综合评价值时所涉及的权数都是从数学变换中伴随生成的, 不是人为确定的, 因此具有客观性[2]。笔者利用因子分析法, 以天津市制造企业为例, 对其信息化状况进行综合分析评价, 取得了较好的分析评价结果。

《2 评价指标选取与调查数据整理》

2 评价指标选取与调查数据整理

《2.1 指标选取》

2.1 指标选取

制造企业信息化评价指标是用来衡量制造企业信息化实施状况的。在选取指标时, 应力求全面、真实地反映制造企业信息化的实施状况。体现制造行业的基本特征, 并且指标的选取还应遵循以下原则:a. 综合性——选择独立性较强、能综合反映指标群特征的指标, 尽量避免选择意义相近的指标;b. 实用性和易操作性——各指标含义明确, 数据资料容易获得, 计算方法简明易懂;c. 可比性——保证指标口径的一致性, 便于横向、纵向比较。在征求了京津两地研究、管理和生产领域多位专家的意见后, 提出了制造企业信息化评价指标共17项, 如图1所示。

《图1》

图1 制造企业信息化评价指标

图1 制造企业信息化评价指标  

Fig.1 Evaluation architecture for manufacturing enterprise informatization

《2.2 调查数据整理》

2.2 调查数据整理

将评价指标转化为问卷中的调查问题, 形成调查问卷。调查问题的数量要合适, 要便于调查结果的统计和处理, 否则, 问卷调查结果会很不理想, 甚至徒劳无功[3]。笔者采用结构性问卷调查, 调查表设计成选择题的形式, 对选择题的备选答案做了精心设计。定性指标可量化为1—100分。为了使因子分析更加有效, 企业个数要大于指标个数, 且越大越好, 但在实际计算中也不可能取太多企业, 笔者对2001年天津市制造业中的食品加工及制造和饮料制造业、纺织业、普通机械、专用设备制造业的企业信息化状况进行了调查。共发出问卷90份, 实际收回问卷76份。

为了有效地统计分析, 需要对调查数据进行整理, 笔者对所回收的调查问卷做了以下工作:

1) 修正数据。部分调查问卷显示的数据有明显的错误。比如, 有的企业填写时忽略了计量单位“万元”, 错误地以“元”为单位填写, 此类错误在数据整理中都须加以修正。

2) 删除部分样本。即删除明显不合理的样本。比如, 有的调查企业参加培训的管理者人数大于该企业的管理人员总数, 数据间显示矛盾, 这是不合理的。为了避免这类样本对研究结果准确性造成影响, 按照谨慎性原则将此类样本删除。

3) 缺失值处理。用SPSS数据分析软件进行数据分析时, 需要对缺失值进行处理。在统计分析中笔者选用平均值替代缺失值。

整理后有效问卷有51份。按出资者分, 内资企业25家, 中外合资企业16家, 外商独资企业10家;按企业规模分, 大型企业13家, 中型企业24家, 小型企业14家。

《3 企业信息化状况的因子分析》

3 企业信息化状况的因子分析

《3.1 因子分析理论基础》

3.1 因子分析理论基础

20世纪初期, K. Pearson和C. Spearman等人关于智力的定义和测量工作, 开始了因子分析的近代发展。因子分析是主成分分析的一种推广。因子分析是一种通过对样本相关阵的内部依赖关系的研究, 将多个指标归结为少数几个不可观测的综合指标以简化观测系统, 并最终对各样品施行定量化评价的多元统计分析方法[4]。它的基本思想是根据相关性的大小把变量分组, 使得同组内的变量之间相关性较高, 不同组之间的变量相关性较低, 其关键在于正交因子模型的建立和分析应用。

xi (i=1, 2, …, p) 为评价指标随机变量, 其中某些随机变量之间具有不同程度的相关性。假定每个变量已经过标准化, 正交因子模型指的是:存在m (mp) 个综合指标 (又称主因子) fi (i=1, 2, …) , 使xi可用它们的线性组合表示为[5]

X=AF+ε

式中X= (x1, x2, …, xp) ′为可观测的随机向量;F= (f1, f2, …, fm) ′为公因子;ε= (ε1, ε2, …, εp) ′为特殊因子;A为因子载荷矩阵, A= (aij) p×m (aij称为第i个指标在第j个主因子上的载荷) , 且满足条件f1, f2, …, fm不相关且方差皆为1, ε1, ε2, …, εp不相关且方差不同;cov (ε, F) =0, 即Fε不相关;m=pε=0。

上述模型在具体应用时, 可合理选定主因子个数m, 略去线性表达式中的ε, 于是式中A的估计与计算对最终评价至关重要。

《3.2 制造企业信息化综合得分计算》

3.2 制造企业信息化综合得分计算

笔者就所涉及的实际问题, 以主成分法具体确定主因子, 计算有实际统计分析意义的因子载荷矩阵, 展开相关讨论分析。

1) 对原始数据xij (第xj个指标在第i个样品上的原始观测值) 进行标准化处理, 以消除量纲对评价结果的影响, 于是得到标准化后的矩阵X

2) 求出标准化后的样本相关系数矩阵R= (rjk) 。计算相关矩阵R的特征值λ1λ2≥…≥λ17≥0 (特征值依次为4.539, 1.979, 1.571, 1.498, …) 和对应的特征向量e1, e2, …, e17

3) 使用累积方差贡献率来确定主因子个数m。第j个因子的方差贡献率为λj/17。贡献率可衡量出每个主因子所占原始数据信息量的多少, 贡献率越大, 该因子相对越重要。同时以主因子的累积方差贡献率∑λj/17来确定因子数m。由于前8个主因子的累积方差贡献率为89.16 %, 即能用前8个综合指标来反映原始数据表中的绝大部分信息, 故抽出m=8个主因子。

4) 建立主成分因子分析的载荷矩阵为A=(λ1e1,λ2e2,λ8e8)

5) 因子旋转。得到的初始因子载荷矩阵A, 由于因子载荷的大小相差不大, 由此造成对因子的解释有困难, 因此, 为了得出较明确的分析结果, 采用了方差最大正交旋转, 使每个因子载荷向0和1两极分化, 以达到载荷二次方的方差最大。旋转后得到正交载荷矩阵A* (见表1) , 完全符合简单结构的准则, 而且每个主因子都有明确的含义。

表1 评价指标的载荷值

Table 1 Factor score of evaluation indexes

《表1》


评价指标

载 荷 值

f1
f2f3f4f5f6f7f8

x1
0.131 -0.048 7 0.064 0.898 -0.027 8 0.149 0.072 0.061 9

x2
-0.1810.020 1-0.010 80.036 7-0.018 30.006 760.9160.0014

x3
0.012 90.9070.1620.062 6-0.064 70.021 50.007 790.119

x4
0.110-0.1050.0510.016 1-0.056 10.025-0.036 40.048 3

x5
0.3210.3520.1020.022 2-0.012 70.6630.2790.110

x6
0.2130.1120.1940.1160.078 5-0.1130.042 70.886

x7
0.1320.2990.8560.2270.1930.019 30.259-0.092 2

x8
0.8830.077 10.0640.1420.1870.102-0.094 90.055 6

x9
0.8100.2260.1310.133-0.036 8-0.007 3-0.4110.089

x10
0.087 30.2090.882-0.098 30.1220.107-0.1350.280

x11
0.022 6-0.1890.019 50.1200.0410.884-0.119-0.173

x12
0.873-0.099 80.228-0.023 10.3940.1670.094 40.128

x13
0.1160.8720.2190.006 90.329-0.082 6-0.022 10.019 3

x14
-0.058 50.1170.1860.5270.389-0.018 4-0.2510.493

x15
0.2530.080 20.1320.080 60.8740.040 8-0.004 40.086 3

x16
0.1280.324-0.1070.5630.462-0.052 2-0.002 30.089 2

x17
0.453-0.023 70.5970.036 7-0.163-0.040 0-0.1860.259

6) 采用回归方法计算各企业的主因子得分, 将主因子表示为指标变量的线性组合:fj=k=117βjkxk,(j=1,2,,8)

7) 计算各企业信息化状况的综合得分。企业在各主因子上的得分乘以对应方差贡献率再求和, 便得到综合得分 (排序结果如表2所示) :

FMEI=0.317 0f1+0.166 4f2+0.092 4f3+0.088 1f4+0.071 1f5+0.061 5f6+0.049 9f7+0.045 2f8 ,

通过综合得分FMEI的大小可以对企业的信息化水平进行评价。综合得分多, 意味着该企业的信息化水平高, 反之亦然。

表2 制造企业信息化评价

Table 2 Evaluation of manufacturing enterprise informatization

《表2》

企业名称FMEI企业名称FMEI企业名称FMEI企业名称FMEI企业名称FMEI

企业1
2.793 7
企业12
0.259 5
企业23
-0.195 0
企业34
-0.377 6
企业45
-0.561 4

企业2
2.263 6
企业13
0.230 3
企业24
-0.200 1
企业35
-0.382 2
企业46
-0.623 2

企业3
1.787 3
企业14
0.214 3
企业25
-0.216 2
企业36
-0.396 2
企业47
-0.664 5

企业4
1.622 7
企业15
0.199 8
企业26
-0.223 9
企业37
-0.442 1
企业48
-0.809 7

企业5
1.249 6
企业16
0.121 7
企业27
-0.296 6
企业38
-0.452 2
企业49
-0.828 3

企业6
0.897 4
企业17
-0.096 5
企业28
-0.334 3
企业39
-0.484 5
企业50
-0.878 5

企业7
0.838 3
企业18
-0.130 2
企业29
-0.345 6
企业40
-0.484 5
企业51
-0.904 5

企业8
0.786 2
企业19
-0.147 3
企业30
-0.348 2
企业41
-0.491 5

企业9
0.477 7
企业20
-0.158 4
企业31
-0.349 5
企业42
-0.513 4

企业10
0.445 6
企业21
-0.178 6
企业32
-0.362 6
企业43
-0.515 4

企业11
0.313 4
企业22
-0.183 8
企业33
-0.377 3
企业44
-0.547 5

虽然因子分析的计算过程比较复杂, 但是通过运用SPSS统计软件中的因子分析 (FACTOR ANALYSIS) 模块可以十分方便地完成上述运算, 为实际分析提供了有力的运算支持。

《4 信息化评价结果的聚类分析》

4 信息化评价结果的聚类分析

聚类分析是将研究对象按其共性进行分类, 以便系统地加以科学研究的一种有效方法, 其目的在于辨识在某些特征上相似的事物, 并把事物就这些特征划分成若干类, 使同一类事物具有高度的共质性, 而不同类事物具有高度的相异性[6]。聚类分析方法常用的有系统聚类法、动态聚类法、模糊聚类法, 等等。笔者采用系统聚类法对上述综合得分进行最优分割, 把样本按综合得分高低分成三类, 再通过计算各类各指标的平均值来找出各企业的优势和差距, 以便各企业制定提高信息化水平的策略。

系统聚类法是在聚类分析中应用最为广泛的一种方法, 它的基本原理是[7]:首先将一定数量的样品或指标各自看成一类, 再根据样品 (或指标) 的亲疏程度, 将亲疏程度最高的两类进行合并, 然后考虑合并后的类与其他类之间的亲疏程度, 再进行合并。重复这一过程, 直至将所有的样品 (或指标) 合并为一类。衡量亲疏程度的指标有两种, 即距离和相似系数。其中, 距离是将每个样品看成是m个变量对应的m维空间中的一个点, 在该空间中所定义的距离越近, 则亲密程度越高。系统聚类法中类间距离的常用计算方法主要有最短距离法、最长距离法、中间距离法、重心法和类平均法等。

1) 数据准备。把上述所得的综合得分记为FMEI1, FMEI2, …, FMEI51

2) 聚类原理。选用聚类分析中的系统聚类法。采用欧氏距离dij=FMEIi - FMEIj, 表示样品i和样品j之间的距离, 并采用系统聚类法中常使用的由Sokal和Michener提出的类平均距离公式

Dpq2=1npnqiGpjGqdij2

式中npnq为类GpGq中元素的个数。dijGp中元素fiGq中元素fj间的欧氏距离。

3) 聚类结果。对FMEI按上述原理进行聚类, 用SPSS统计分析软件进行上述计算过程, 可得聚类谱系图 (略) 。对该图进行分析, 可将样品分成三类, 各类所包含的样品如下:第一类包括企业1—企业4, 第二类包括企业5—企业16, 第三类包括企业17—企业51。

4) 分类结果分析。上述分类中, 第一类企业的综合信息化水平高, 其综合得分大于1.5;第二类企业的综合信息化水平一般, 其综合得分介于0.15与1.5之间;第三类企业的综合信息化水平低下, 其综合得分小于0.15。这三类企业相应的各指标的平均值列于表3。

对上述计算结果进行分析可以得出以下结论:

1) 第一类企业x4x11的平均值是所有三类企业中最差的, 说明其综合信息化水平虽然最高, 但它的平均网络性能状况和网络营销率却不佳。对其所含的4个企业在x4上进行分析, 发现除第4个企业外, 其他3个企业的Internet出口带宽都小于128 kB。在x11即网络营销率上进行分析, 发现除第4个企业外, 其他3个均未开展电子商务业务。

表3 各指标的平均值

Table 3 Average of indexes

《表3》


指标
第一类企业第二类企业第三类企业

x1
65.25 78.25 60.34

x2
39.4127.9824.46

x3
10.8010.337.81

x4
25.0030.0025.14

x5
52.9365.4140.54

x6
67.5053.7546.29

x7
39.0025.8310.40

x8
65.0055.0031.14

x9
65.0055.8345.71

x10
44.5023.8919.74

x11
0.637.371.36

x12
47.6334.4619.17

x13
38.6413.9212.00

x14
50.6427.3414.59

x15
38.4312.130.04

x16
27.5015.001.71

x17
35.2822.8324.19

2) 第一类企业对各指标的平均值与第二类比较, 可以看出两者各有千秋, 但综合来看, 第一类优于第二类。第一类企业对x2, x3, x6, x7, x8, x9, x10, x12, x13, x14, x15, x16x17的平均值都明显优于第二类企业相应的平均值, 而前者对x1, x4, x5, x11的平均值都稍逊于后者, 因此从总体来看, 前者综合水平高于后者。

3) 总体来看, 除x1, x4, x5, x11对第一类企业异常和x17对第二类企业异常外, 其他各指标都呈现出从第一类企业向第三类企业递减的态势。

用系统聚类法划分出来的三类企业间的信息化水平的差异是明显的。各企业可根据上述分析结果制定对策, 发挥原有优势, 弥补不足, 从而提高信息化水平。

《5 结语》

5 结语

笔者综合运用多元统计方法的因子分析和聚类分析对天津市51家制造企业的信息化状况进行综合排序和分类。通过因子分析法对指标体系量化求解, 最终得到制造企业信息化的综合得分;用系统聚类法对综合得分进行分析, 得到各企业信息化状况的分布情况。笔者的研究结果为天津市制造企业制定信息化战略, 分析企业信息化状况提供了科学依据, 具有重要的理论与实际意义。