《1 前言》

1 前言

目前, 中国的火灾形势比较严重 [1], 在经济越发达的地方越严重, 而且随着经济的发展更趋严重。这一现象已经受到工程界和企业界的高度重视。因此有必要用适当的方法对中国火灾统计数据进行分析和预测。

R/S分析方法 (重标极差方法) [2]是正在工程和经济学等领域崭露头角的分析预测方法。在我国已经有越来越多的学者应用这一方法。作者讨论如何改进R/S分析方法及做好火灾统计数据分析和预测的一些行之有效的措施和方法。

《2 R/S分析及其应用》

2 R/S分析及其应用

在工程和经济学等领域中, 存在着大量的统计数据, 从表面上看, 这些数据没有任何规律。在这种情况下, 如何从中发现一些规律性的东西, 从而有效地分析已经过去的历史纪录, 并且准确或比较准确地预测未来的发展趋势, 就是一个非常重要的问题。 在工程建设与经济生活中, 存在着一种难以琢磨而又相当系统的内部关系的混合。在外行人看来, 在无法用实验支持的条件下, 去寻求这些极为复杂的变化过程中的发展规律, 无异于异想天开。然而, 工程专家与经济学家对有关战略性的工程控制、经济关系与管理模式构造数学模型的企图, 以至借助于时间序列的统计分析来定量地分析与阐述它们, 事实上已经证明是成功的。

在众多的数学模型中, 分形分布模型越来越受到人们的重视与青睐。

分形理论自1967年问世以来, 虽然只有短短几十年的历史, 已在一些领域获得成功应用。分形理论的特点是引入了分维数的概念。在传统的几何学中, 维数为整数, 例如点为0维, 直线为1维, 平面为2维等。而在分形方法中, 分维数D突破了整数的限制, 例如海岸线的分维数D值可以取为1.02, 1.25等。在原有的分形理论中, 分维数为常量, 这种分形分布在双对数坐标上就是一条直线。

分形方法揭示的有组织结构的特征之一是自相似性。例如, 从飞机上拍摄的山地照片, 与碎石堆的照片, 以及显微镜中粗糙岩石表面的照片, 是极为相似的, 有时根本就无法区分。再如, 将海岸线的照片, 与其放大1倍, 2倍, 5倍的照片放在一起, 从其曲折的特征上看, 也是无法区分的。另外, 对于同一段海岸线, 如果分别用1 m, 0.5 m, 0.2 m, 0.1 m的尺子测量其长度, 则测量的结果是不一样的, 尺子越短, 测量的长度越长。上述自相似现象, 在许多领域中 (包括工程科学与经济科学) 都可以发现, 因此他们都可以用分形方法来统一处理。

分形理论发展到今天, 已经包括了许多行之有效的方法。这里对赫斯特过程和S/R分析作一简要介绍, 欲了解更详细内容的读者可以阅读参考文献[2,3,4]

假设有一个大的时间序列的子序列, 由n个数值组成

x=x1,x2,xn

其平均值定义如下:

xm=x1+x2++xnn

标准差定义如下:

S=(x1-xm)2++(xn-xm)2n

累积离差定义如下:

Xt,n=u=1t(xu-xm);

极差定义如下:

R=max(Xt,n)-min(Xt,n)

则重标极差R/S的表达式为

RS=(an)Η

式中a为常数, 在某些文献中取值为0.5;H为赫斯特指数 (或赫斯特系数) , 其计算公式为

Η=ln(R/S)ln(an)

在某些文献中定义分维数为

D=2-Η

赫斯特指数是一个非常有用的统计量, 实际上它对几乎所有的时间序列分析都有广泛的应用。

赫斯特指数可以分为3种类型:

1) H=0.5, 这标志着序列是随机的。其所对应的事件是随机的和不相关的, 即现在的状态不会影响将来。

2) 0≤H<0.5, 这是一种反持久性的时间序列, 经常被称为“均值回复”。如果一个系统以前是向上走的, 那么它在下一个时期多半向下走, 反过来也是一样。这种反持久性的强度依赖于H值离零有多近, 越接近于零, 这种时间序列就具有比随机序列更强的突变性或易变性。

3) 0.5<H≤1, 表明一个持久性或趋势增强的序列。如果一个系统以前是向上走的, 那么它在下一个时期多半是继续向上走, 反过来也是一样。这种持久性的强度依赖于H值离1有多近, 越接近1, 这种时间序列就具有比随机序列更强的持久性。

上述赫斯特指数的特征已经广泛地用于工程研究与市场分析, 特别是资本市场分析。例如用于股票市场及外汇市场的分析与预测 [3,4]

同样, R/S分析也将在其他领域包括工程建设和经济管理领域获得广泛应用。例如某一企业的工程建设质量状态一直处于上升状态, 但是由于存在一些不利因素, 使得形势随时可能逆转, 而这些不利因素之中, 有一些不利因素并不会使形势发生逆转, 因而可以暂时不必考虑, 但是必须找出哪些不利因素将使形势发生逆转, 以便采取措施处理这些不利因素。通过或者借助于R/S分析, 根据赫斯特指数的特征, 就有可能找出那些将使形势发生逆转的不利因素。另外, 通过或者借助于R/S分析, 还有可能在工程建设质量状态不可避免地发生逆转之前发出预警, 以便及时采取措施, 避免或减少损失。

如所周知, 避免事故是工程建设与经济管理的重要内容之一, 尤其要避免事故的突然增加。下面讨论事故问题的R/S分析。我们以对于各行各业来说都是最严重事故之一的火灾的情况为例 (由于各行各业公开发表的火灾起数不容易得到, 所以作者采用全国火灾起数, 但是其分析原理是一样的) 。

表1给出1950~2000年全国火灾起数 [5]

其中火灾激增年份为:1952年 (比上一年增加85%) , 1955年 (比上一年增加105%) , 1959年 (比上一年增加57%) , 1969年 (比上一年增加36%) , 1971年 (比上一年增加89%) , 1990年 (比上一年增加141%) , 1997年 (比上一年增加281%) 。

传统的计算赫斯特指数H的方法是将时间序列按次序划分为若干区间, 每个区间都是独立的 (即每一个数据必属于、且只属于一个区间) , 然后对每一个区间分别计算赫斯特指数。这种方法有其优越性, 对某些问题的应用效果也很好。不过作者采取2种新的分区方法, 其特点是每一个数据可以属于若干个连续的区间。

第一种方法:区间所含数据的数目是依次递增的, 第一个区间所含数据的数目应该大于或者等于2 (文中第一个区间所含数据的数目均为6) , 后一区间包含前一区间的全部数据。例如对表1的数据, 假设每一区间的数据都比前一区间的数目增加一个, 第一区间含1950~1955年的数据 (共有6个数据) , 第二区间含1950~1956年的数据 (共有7个数据) , 依此类推, 最后一个区间含1950~2000年的数据 (共有51个数据) 。需要说明的是, 第一区间所含数据计算的赫斯特指数作为1955年的赫斯特指数, 第二区间所含数据计算的赫斯特指数作为1956年的赫斯特指数, 依此类推, 最后一个区间所含数据计算的赫斯特指数作为2000年的赫斯特指数。

第二种方法:区间所含数据的数目是固定的, 与后一区间重复数据的数目也是固定的。例如对表1的数据, 假设每一区间都含6个数据, 第一区间含1950~1955年的数据 (共有6个数据) , 第二区间含1951~1956年的数据 (共有6个数据, 其中前5个数据与第一区间的后5个数据相同) , 依此类推。最后一个区间含1995~2000年的数据 (共有6个数据) 。与第一种方法一样, 每一个区间所含数据计算的赫斯特指数作为该区间最后一年的赫斯特指数。

全部计算结果见表1, 其中ΔH等于当年的赫斯特指数减去上一年的赫斯特指数。

下面分析火灾激增年份1959, 1969, 1971, 1990, 1997年的情况 (1952年和1955年的情况因数据太少无法分析) 。为了提前预测火灾激增年份, 作者考察前一年的情况, 即1958, 1968, 1970, 1989, 1996年的情况。发现对于第一种方法的计算结果, 这几年有一个共同的现象, 即这几年的赫斯特指数H值比前一年的H值增大, 但是ΔH值却比前一年的ΔH值减少。例如, 1958年的H值 (0.9556) 比1957年的H值 (0.9367) 增大, 但是1958年的ΔH值 (0.0189) 却比1957年的ΔH值 (0.0567) 减少。虽然有一些非火灾激增年份的前一年也出现类似的现象, 但并不多见。因此, 从有备无患的角度出发, 当发现对于第一种方法的计算结果, 某一年的H值比前一年的H值增大, 但是ΔH值却比前一年的ΔH值减少时, 就应该警惕, 下一年可能是火灾激增年份。

表1 1950~2000年全国火灾起数及其R/S分析结果

Table 1 Total fire numbers in China during 1950~2000 and the results of R/S analysis

 

《表1》


年份
火灾
起数

第1种方法
第2种方法

H
ΔH H ΔH
1950 19 692        

1951
19 740        

1952*
36 585        

1953
37 766        

1954
43 849        

1955*
89 703 0.706 9   0.706 9  

1956
89 680 0.880 1 0.173 2 0.911 9 0.205 0

1957
75 579 0.936 7 0.056 7 0.976 7 0.064 8

1958
73 315 0.955 6 0.018 9 0.898 2 -0.078 6

1959*
114 880 0.944 6 -0.110 4 0.502 9 -0.395 3

1960
90 845 0.949 7 0.005 1 0.696 5 0.193 6

1961
103 485 0.947 9 -0.001 8 0.804 4 0.107 9

1962
105 064 0.943 8 -0.004 1 0.841 0 0.036 6

1963
106 468 0.938 5 -0.005 3 0.586 8 -0.254 2

1964
63 301 0.934 9 -0.003 6 0.643 9 0.057 1

1965
76 859 0.913 6 -0.021 2 0.871 5 0.227 6

1966
85 377 0.901 1 -0.012 6 0.921 2 0.049 7

1967
36 861 0.923 2 0.022 1 0.724 7 -0.196 5

1968
25 940 0.940 3 0.017 1 0.829 3 0.104 6

1969*
35 205 0.950 7 0.010 4 0.949 6 0.120 3

1970
39 925 0.956 8 0.006 1 0.924 2 -0.024 4

1971*
75 593 0.938 7 -0.018 1 0.921 8 -0.002 4

1972
88 417 0.908 4 -0.030 3 0.918 4 -0.003 4

1973
84 966 0.884 6 -0.023 8 0.977 0 0.058 6

1974
86 614 0.861 1 -0.023 5 0.929 4 -0.047 6

1975
82 221 0.843 9 -0.017 2 0.721 8 -0.207 5

1976
81 634 0.828 6 -0.015 3 0.825 5 0.103 6

1977
85 442 0.810 9 -0.017 7 0.835 1 0.009 6

1978
81 667 0.797 8 -0.013 1 0.651 4 -0.183 7

1979
88 082 0.779 9 -0.017 9 0.796 7 0.145 2

1980
54 333 0.784 6 0.004 7 0.712 3 -0.084 3

1981
50 034 0.789 9 0.005 2 0.933 6 0.221 3

1982
41 541 0.795 8 0.005 9 0.976 5 0.042 8

1983
37 026 0.814 6 0.018 9 0.902 6 -0.073 9

1984
33 618 0.833 8 0.019 2 0.739 5 -0.163 1

1985
34 996 0.849 1 0.015 3 0.885 6 0.146 0

1986
38 766 0.860 1 0.011 5 0.789 7 -0.095 9

1987
32 053 0.872 2 0.011 7 0.560 2 -0.229 5

1988
29 852 0.882 5 0.010 3 0.761 1 0.200 9

1989
24 154 0.892 0 0.009 5 0.778 7 0.017 6

1990*
58 207 0.890 8 -0.001 1 0.689 6 -0.089 1

1991
45 167 0.894 4 0.003 6 0.834 7 0.145 1

1992
39 391 0.898 9 0.004 5 0.844 0 0.009 3

1993
38 073 0.903 1 0.004 2 0.768 6 -0.075 4

1994
39 337 0.906 6 0.003 4 0.706 8 -0.061 8

1995
37 915 0.909 8 0.003 2 0.798 1 0.091 3

1996
36 856 0.912 8 0.003 0 0.682 4 -0.115 7

1997*
140 280 0.854 0 -0.058 7 0.732 2 0.049 8

1998
142 326 0.797 9 -0.056 2 0.946 2 0.214 0

1999
179 955 0.786 5 -0.011 4 0.978 0 0.031 8

2000
189 185 0.778 2 -0.008 3 0.906 7 0.071 4

*火灾激增年

 

但是根据第二种方法的结果, 则看不出这样的趋势。也就是说, 对于本例, 第一种方法的效果较好。不过对于其他问题, 第二种方法的结果可能有利于趋势分析, 因此将其结果也列在表1中。

需要指出的是, 用上述R/S分析方法只能提前一年预测火灾激增年份。如果打算提前几年预测, 就要用文献[6]中的方法。根据前几个全国火灾激增年份为1952, 1955, 1959, 1969, 1971, 1990和1997年, 用文献[6]中的方法, 可以预测出以后3个全国火灾激增年份将为2009, 2021和2034年。

《3 高阶赫斯特指数》

3 高阶赫斯特指数

为了更有效地对统计数据进行分析预测, 引入高阶赫斯特指数的概念。对于已经计算出的所有赫斯特指数H, 将其视为一组已知的统计数据。于是可以对这一组已知的统计数据再进行R/S分析, 从而得到一组新的赫斯特指数, 将其记为H1, 即赫斯特指数的赫斯特指数, 以及相应的ΔH1, 依此类推可以得到高阶赫斯特指数及其差值H2 , ΔH2, H3, ΔH3等。

下面用第一种分组方法对表1中第一种分组方法所得赫斯特指数进行R/S分析。

按照第一种分组方法, 区间所含赫斯特指数数据的数目是依次递增的, 后一区间包含前一区间的全部数据。例如对表1的第一种分组方法所得赫斯特指数数据, 假设每一区间的数据都比前一区间的数目增加一个, 第一区间含1955~1960年的赫斯特指数数据 (共有6个数据) , 第二区间含1955~1961年的赫斯特指数数据 (共有7个数据) , 依此类推, 最后一个区间含1955~2000年的赫斯特指数数据 (共有46个数据) 。需要说明的是, 第一区间所含数据计算的赫斯特指数的赫斯特指数, 即一阶赫斯特指数H1, 作为1960年的一阶赫斯特指数, 第二区间所含数据计算的一阶赫斯特指数作为1961年的一阶赫斯特指数, 依此类推, 最后一个区间所含数据计算的一阶赫斯特指数作为2000年的一阶赫斯特指数。

同样, 某一年的一阶赫斯特指数的差值ΔH1定义为该年的一阶赫斯特指数减去前一年的一阶赫斯特指数。

依此类推, 可以计算更高阶的高阶赫斯特指数及其差值H2, ΔH2, H3, ΔH3等。

对于表1的情况, 最高可以计算至九阶赫斯特指数。

有关的计算结果见表2。

下面分析火灾激增年份1969, 1971, 1990, 1997年的情况。为了提前预测火灾激增年份, 考察前一年的情况, 即1968, 1970, 1989, 1996年的情况。发现对于第一种方法的计算结果, 有2个共同的现象, 即这几年的一阶赫斯特指数H1值均比前一年的H1值减少;另外, 一阶赫斯特指数的差值ΔH1值均为负数。例如, 1968年的H1值 (0.7105) 比1967年的H1值 (0.7203) 减少, 而且1968年的ΔH1 (-0.0098) 为负数。虽然有一些非火灾激增年份的前一年也出现类似的现象, 但也不多见。因此, 从有备无患的角度出发, 当发现对于第一种方法的计算结果, 某一年的H1值比前一年的H1值减少, 而且ΔH1值为负数时, 就应该警惕, 下一年可能是火灾激增年份。

由此可见, 高阶赫斯特指数可以用来帮助判断下一年是否为火灾激增年份。至于高阶赫斯特指数的其他应用, 将是进一步的研究课题。

《4 R/S方法预测下一年的数据》

4 R/S方法预测下一年的数据

原有的R/S方法只能预测趋势, 而不能预测具体的数据。

现在根据1950~1999年的全国火灾起数预测2000年的全国火灾起数。这里以表1中的第一种方法为例。

首先计算出1955~1999年的赫斯特指数H。然后根据1955~1999年的赫斯特指数用参考文献[6]中的分形方法计算2000年的赫斯特指数H2000, 则可以得到 H2000=0.775 0

根据计算的H2000, 就可以用打靶法 (试射法) 确定2000年的全国火灾起数。

先假定2000年的全国火灾起数等于1999年的全国火灾起数179 955, 这样可以得到2000年的赫斯特指数为0.7807。再分别假定2000年的全国火灾起数等于170 000和189 000, 这样可以得到2000年的赫斯特指数分别为0.783 1和0.778 3。于是可以得出结论:应该沿着高于189 000的方向进行搜索。最后得到, 当2000年的全国火灾起数为199 960时H2000= 0.775 0。即预测的2000年全国火灾起数为199 960, 而实际值为189 185, 预测误差为5.7%。应该说预测效果还是不错的。

表2 高阶赫斯特指数的计算结果

Table 2 Results of high order hurst exponent

 

《表2》


年份
H1 ΔH1 H2 H3 H4 H5 H6 H7 H8 H9
1960 0.7663                  

1961
0.7703 0.0039                

1962
0.7664 -0.0039                

1963
0.7595 -0.0070                

1964
0.7517 -0.0078                

1965
0.7380 -0.0137 0.8385              

1966
0.7469 0.0089 0.9102              

1967
0.7203 -0.0266 0.8646              

1968
0.7105 -0.0098 0.8826              

1969*
0.7074 -0.0032 0.8986              

1970
0.7040 -0.0034 0.9284 0.5252            

1971*
0.7008 -0.0032 0.9515 0.7387            

1972
0.7138 0.0130 0.9611 0.8466            

1973
0.7488 0.0350 0.9576 0.8968            

1974
0.7909 0.0421 0.9356 0.9071            

1975
0.8282 0.0373 0.8954 0.9060 0.8318          

1976
0.8584 0.0302 0.8750 0.9113 0.8260          

1977
0.8851 0.0267 0.8741 0.9126 0.8167          

1978
0.9051 0.0200 0.8828 0.9100 0.8069          

1979
0.9195 0.0144 0.9060 0.8944 0.7969          

1980
0.9306 0.0111 0.9237 0.8636 0.7843 0.8810        

1981
0.9392 0.0085 0.9362 0.8216 0.7932 0.9017        

1982
0.9461 0.0069 0.9476 0.7696 0.8295 0.9314        

1983
0.9515 0.0054 0.9566 0.7117 0.8695 0.8531        

1984
0.9541 0.0026 0.9633 0.6929 0.8976 0.8553        

1985
0.9546 0.0005 0.9682 0.7032 0.9187 0.8729 0.8118      

1986
0.9530 -0.0016 0.9719 0.7532 0.9246 0.9201 0.8513      

1987
0.9492 -0.0038 0.9746 0.7899 0.9196 0.9466 0.8412      

1988
0.9436 -0.0056 0.9766 0.8180 0.9065 0.9611 0.8232      

1989
0.9363 -0.0073 0.9789 0.8418 0.8872 0.9652 0.8367      

1990*
0.9296 -0.0067 0.9805 0.8605 0.8633 0.9566 0.8733 0.4901    

1991
0.9225 -0.0071 0.9813 0.8745 0.8364 0.9530 0.8919 0.8081    

1992
0.9148 -0.0077 0.9816 0.8859 0.8076 0.9544 0.9023 0.9009    

1993
0.9068 -0.0080 0.9813 0.8948 0.7782 0.9512 0.9071 0.9356    

1994
0.8984 -0.0083 0.9805 0.9019 0.7501 0.9404 0.9080 0.9493    

1995
0.8898 -0.0086 0.9792 0.9080 0.7221 0.9236 0.8969 0.9535 0.7679  

1996
0.8810 -0.0088 0.9773 0.9132 0.7132 0.9147 0.8919 0.9516 0.7735  

1997*
0.8814 0.0004 0.9755 0.9172 0.7199 0.9132 0.8882 0.9464 0.7709  

1998
0.8830 0.0016 0.9738 0.9203 0.7256 0.9138 0.8841 0.9388 0.7652  

1999
0.8845 0.0016 0.9721 0.9226 0.7304 0.9144 0.8796 0.9292 0.7582  

2000
0.8855 0.0010 0.9704 0.9242 0.7352 0.9149 0.8754 0.9179 0.7503 0.8528

*火灾激增年

 

《5 需要进一步讨论的课题》

5 需要进一步讨论的课题

根据正在工程与经济科学等领域中崭露头角的R/S分析方法, 讨论了做好工程与经济管理工作的一些措施和方法, 但是要使这些措施和方法的效果更好, 还有一些需要进一步讨论的课题。

1) 将分形方法, 特别是R/S分析等方法用于工程和经济等领域, 是否能够照搬分形市场分析中的成熟做法?例如在R/S分析中, a为常数, 在某些文献中取值为0.5, 这种处理方式在用于工程和经济等领域时是否仍然适用?再如, 是否要考虑赫斯特指数H为复数或为变量的情况?这类问题可能要通过专门研究才能加以解决。

2) 在工程与市场分析等领域, 除了R/S分析方法以外, 其他分形方法也获得了成功应用。例如在参考文献[6]中, 就应用变维分形等方法对股票市场进行分析和预测。经验表明, 处理复杂问题时, 单纯应用一种方法的效果往往不理想, 需要联合应用多种方法效果才理想。因此, 在处理工程和经济等领域的问题时, 如何联合应用多种方法, 也是需要进一步讨论的课题。

3) 应用R/S方法进行预测时, 预测效果取决于用外插的方法计算赫斯特指数的效果, 因此应探讨更好的计算赫斯特指数的外插方法。

《6 结语》

6 结语

采用工程科学和数理经济学以及计量经济学中的若干成熟方法, 如分形方法及R/S分析方法等, 可以有效地对火灾等事故的有关数据进行分析和预测, 并且将对做好工程控制和经济管理以及工程、经济预测等工作产生积极而深远的影响。当然也还存在许多需要进一步讨论的课题, 有必要通过深入持久的研究加以解决。