《1 介绍》

1 介绍

面临SARS这样突发的传染性疾病, 人们应该采取什么样的方法进行防御、诊治, 以及如何定位与分析SARS对国民经济发展长期的潜在的影响日渐成为关注的焦点。一方面, 人们可以通过不断摸索经验, 找到SARS疾病的传播规律以便更好地进行诊治;另一方面, 运用各种智能化方法手段、系统科学的方法可以从数据中找出规律, 同时建造智能型的决策支持系统, 帮助人们更好地决策, 是应付SARS这样的突发性传染病的有效方法。

笔者讨论一种基于统一集论的SARS智能决策支持系统的建造方法和数学模型。统一集论[1]是近年新提出的一套包括模糊集、粗糙集、可拓集、Vague集、集对分析、模糊灰色物元理论、模糊可拓经济控制等理论的新型非经典集合论。它已在决策支持、控制、匹配等领域取得了一定的成绩。采用统一集论的SARS智能决策支持系统是一种集多种理论的综合方法。

《2 系统的结构》

2 系统的结构

系统的总体框图如图1所示。系统首先对历史SARS数据进行收集、处理, 并在此基础上构造预测和模拟SARS发展的模型。当有SARS疫情出现的时候, 要及时对最新发展情况进行搜集和噪声处理, 以获得有效的决策数据。随后将有效的SARS疫情数据输入预测和模拟子系统, 经系统处理得到SARS疫情的发展预测信息。在此基础上通过诊治子系统制定相应的诊治策略, 同时对未患病人员进行二次防御。因此, 所讨论的决策支持系统由4个子系统组成:噪声分析子系统、预测和模拟子系统、诊断子系统和二次防御子系统。

《图1》

图1 系统框图
Fig.1 System structure

图1 系统框图 Fig.1 System structure  

《3 噪声分析子系统》

3 噪声分析子系统

在现实的系统中, 虽然能获取大量的信息, 然而这些信息中有些是有价值的, 而另一些则是噪声, 所以必须把这些噪声数据从数据中分离出来。例如, SARS来袭, 由于人们对这种疾病认识不够, 有多起谎报、错报的现象, 如果用这些原始数据进行分析将导致错误的结果, 因此必须进行噪声分析, 通过专家的经验和计算机智能软件对原始的粗糙数据进行有效的处理。噪声主要有两大类:一类是在信息采集阶段, 信息的评价标准——信息熵[2] 的取值过大引起的, 也就是说信息集中收集了过多的不确定信息或收集了不确定性过高的信息;另一类是具有模糊和灰色性质的信息, 这类噪声的产生一般有两种原因, 一种是信息在传播过程中由于中转环节过多导致信息失真, 另一种原因是由于有些人出于某种原因故意制造假象或发出虚假消息。对于这两种噪声都必须事先将其除去。

《3.1 模糊集与信息推理》

3.1 模糊集与信息推理

随着科学的深化, 研究的对象越来越复杂, 这些复杂的东西越来越难以精确化。在一个大系统中, 当它的复杂性增加时, 将它精确化的能力将会降低, 在达到一定阈值以上时, 复杂性和精确性将相互排斥, 产生由复杂性引起的模糊性问题。在SARS发生的过程中人们所得到的信息常常是不精确不完全或模糊的, 为此用Fuzzy 集理论[3] 来处理这些问题。在SARS防治中, 首先建立模糊规则库, 它是由若干模糊推理规则库组成的。模糊规则库可以通过向专家咨询得到, 把专家的经验抽象成模糊与可拓规则的规则库, 也可以通过自学习的方式得到。将SARS传播过程中收集到的各项信息输入规则库中, 进行模糊推理, 提高信息的精确性。此外, 还可以利用灰色关联分析[4]、可拓学3-4-4法[5] 对这些模糊信息进行处理。

《3.2 确定决策目标及指标体系》

3.2 确定决策目标及指标体系

为确定决策目标及指标体系, 首先聘请一些专家并为每一位专家分配权重。WAS权重分配系统[6], 通过对所聘专家的权威质量m、熟悉度s、谨慎度g、知识广度e、智力激发度w等方面进行评判分析, 确定各专家的权重, 然后将极值统计与专家的权重结合起来确定一个任务的各指标权重。再让专家对数据进行初步的分析后, 根据问题的复杂程度, 调用不同的系统来对局势进行分析并给出评估结果。

如果问题不复杂, 只需要调用WAS即可, 如果问题比较复杂, 则必须调用模糊灰色物元空间 (FHW) [7] 或其最新进展的VGES[8], 有效地组织专家、咨询专家、进行群决策。它是建立在多级专家决策系统基础上, 可以全面吸收从中央到地方的各级领导、专家的意见, 并对这些意见进行加权处理, 发挥专家的正确意见, 而舍弃那些不全面的意见。

通过分析专家们的分析结果, 选择一些能够反映客观状况的实际指标。这些指标包括疫情状况、当地的地域经济状况等特点, 从而建立指标体系。

《3.3 利用集对分析确定噪声》

3.3 利用集对分析确定噪声

集对分析 (SPA , set pair analysis) [9] 的基本思想是:在一定的问题背景下, 把客观系统之间的确定与不确定性作为一个系统来研究, 用联系度来描述其中同异反的联系关系, 并用来处理和分析事物之间的中介不确定性等。其联系度为

u=a+bi+cj,

且满足归一化条件 a + b + c = 1。

设SARS传播过程中标准信息式为

u=a+bi+cj,

式中a为SARS传播过程中的非噪声, 即真信息, 是进行决策的直接参考的信息, 不需要进行转换, 是SARS信息中的“同”;b为SARS信息中的第一类噪声信息, 是SARS信息中的“异”;c为SARS信息中的第二类噪声信息, 是SARS信息中的“反”。

而经过集对分析以后的目标表达式为

u=a+bi+cj,

它应当满足如下要求:

a>a,bb,c=0

对所得的信息u′, 根据实际情况选取适当的阈值λ, 来判断该数据是接受还是拒绝。如果不满足要求, 可利用消错学中的15-6-3法[10], 从各种不同的路径, 进行一些基本变换和一些组合, 找出所需要的消错方案进行反馈与消错。然后再重新收集信息……。噪声分析子系统框图如图2所示。

《图2》

图2 噪声分析子系统框图
Fig.2 Noise analysis program structure

图2 噪声分析子系统框图 Fig.2 Noise analysis program structure  

《4 预测和模拟子系统》

4 预测和模拟子系统

预测和模拟子系统模块的主要功能是用得到的数据对SARS的疫情进行预测分析和计算机模拟。通过预测和模拟, 系统能够辅助人们进行科学而准确的判断, 从而制定合理的政策来阻止疫情的进一步蔓延。

《4.1 预测子系统》

4.1 预测子系统

预测子系统是利用各种方法对历史SARS数据的进行分析, 进而建立相应的传播模型, 以预测在各种情况下SARS疫情的发展趋势。对SARS建立三类模型, 即解析模型、数据模型和逻辑模型。并采用FGR方法将三类模型进行综合, 取长补短, 形成一个能全面反映SARS传播规律的模型。

《4.1.1 解析模型》

4.1.1 解析模型

解析模型是用数学解析方式对SARS数据进行分析和预测的模型。假定SARS疫情的发展符合某种函数关系, 并以某种方法建立微分方程组, 再用现有数据验证其有效性, 最终求得SARS的数学模型。

目前国内已经建立了多个SARS的解析模型, 其中包括四类人微分方程模型、七类人微分方程模型、logistic[11] 模型等。以四类人微分方程模型为例, 它将人群分为四类:健康易受感染者, 用S表示健康者在人群中的比例;处于潜伏期者, 这些人尚未发病但将要发病, 用E表示他们在人群众的比率;病人, 用I表示病人在人群中的比例;退出者 (包括被治愈者和死亡者) , 用R表示他们在人群中的比例。在此基础上分析大量疫情数据, 结合各变量之间的关系, 列出四类人的微分方程:

dS/dt=-λ1ΙS,dE/dt=λ1ΙS-ε1E+LΡ-LE,dΙ/dt=ε1E-qΙ,dR/dt=qΙ,

S0, I0, R0, E0为初值。

又如Logistic生长模型[11], 此模型表现形式一般为N-t空间中呈现不同形式的S型曲线,

dΝ/dt=rΝα[1-(Ν/Κ)β]γ,

对应初始缓慢增长、加速、减速和稳定四个阶段, 反映了一般生命历程, 但是不存在解析解。

这类模型从数值上反映了SARS疫情的增减情况, 但不能反映影响SARS发展的众多其他因素, 如天气、气候、人文、地理环境、人口流动等, 这些模型都可成为SARS决策支持系统的成员。

《4.1.2 数据模型》

4.1.2 数据模型

在数据模型中, 用神经网络方法、支持向量机方法作为模型库。这些方法都能够根据当前的数据集合自动形成预测模型。另外, 还可以运用粗糙集模型从大量的数据中自动组织形成推理的规则。

神经网络由神经元模型构成, 每个神经元具有单一输出, 并且能够与其他神经元连接;存在多重输出连接方法, 每种连接方法对应于一个连接权系数, 具有并行分布结构。每个神经元由多个输入xi, i = 1, 2, …, n和一个输出y组成, 中间状态由输入信号的权和表示

yj(t)=f(i=1nwjixi-θj)

神经网络是通过研究过去的数据记录来进行训练的, 当一个神经网络训练完成后就能够根据当前的SARS疫情数据来进行预测。

《4.1.3 推理模型》

4.1.3 推理模型

在推理模型中, 采取模糊可拓规则, 把专家的经验抽象成模糊与可拓规则的规则库。

模糊可拓推理是基于专家对实施的判断的初模糊判断句、基于专家对事实因果关系的判别得出模糊推理句, 再以模糊真的推理句作依据构造出模糊逻辑推理, 经过推理, 得出结论。句型“xa”的陈述句称为判断句, 句型“若xa, 则yb”的陈述句称为推理句[5]

《4.1.4 模型的综合》

4.1.4 模型的综合

对模型的综合采用FGR方法。即模糊、灰色、关联系统, 它是定量研究技术进步对经济增长的影响的模型, 其性能远远优于Cobb-Douglas函数。

对模型的综合包含两方面的综合。一方面每类模型内部多个模型的综合, 每类模型都可以有多个具体模型, 比如解析模型目前已提出的就有四五种, 他们之间具有互补性, 采用WAS系统对各模型分配不同的权重, 最后每类模型综合成一个模拟结果。假设在某次分析中采用四类人模型和七类人模型作为解析模型的两个具体模型, 根据FGR方法, 解析模型部分表示为

SARS(α11α12)

其中α11α12分别为四类人模型和七类人模型的权重, 由WAS模型确定。

另一方面是三类模型之间的综合。上述的三类模型从不同角度描述了SARS发展的规律, 为了对SARS发展规律做全面描述, 对其也要进行综合。利用FGR对三类模型进行综合的结构可表示为

SARS(α1α2α3)

其中, αi为各模型的权重, 根据选择不同权重, 可以调节各个模型的预测结果在最终结果中所占的比重。

用此模型进行预测时, 首先要制定一定的指标体系, 对SARS疫情进行全面细致的描述。然后在指标体系的指导下采集SARS疫情数据, 并输入系统。三类模型分别用各自的算法对输入数据进行计算得出自己的分析结果。采用WAS系统对3个模型的输出结果进行加权综合, 形成最终的预测结果。综合模型的预测过程如图3所示。

需要指出, 各个模型的权重αi对预测结果影响很大。假设解析、数据和推理三类模型的预测结果矩阵分别为R1, R2, R3, 则预测的综合结果为

R=α1R1α2R2α3R3

其中⊕表示三者结果的抽象组合。αi (i=1, 2, 3) 取{0, 1}, 是把αi当成选择器:当α1 =1, α2 =α3 = 0时, 综合系统退化为解析模型;当α2 =1, α1 =α3 = 0时, 综合系统退化为数据模型;当α3 =1, α1 =α2 = 0时, 综合系统退化为推理模型。解析模型比较适合于采集到的数据良好, 而且比较丰富, 数据具有比较自然的模型特征的情况下把解析模型的参数α1的比重加大;而数据模型适合于数据不完备、信息量少而且具有相当噪声的信息, 则应该把α2的比重加大;推理模型是结合专家的经验, 把人和机器看作一个统一的系统, 因此α3决定了专家所占的权重。因此, 合适地分配三者权重, 达到很好的综合目的。

在三类模型内部的各模型之间, 其权重αij与三类模型综合的权重情况相似。

《图3》

图3 FGR预测子系统过程图
Fig.3 FGR forecast subsystem structure

图3 FGR预测子系统过程图 Fig.3 FGR forecast subsystem structure  

《4.2 模拟子系统》

4.2 模拟子系统

通过获得的数据和推理规则建立计算机模拟模型。在这里, 选用元胞自动机[12] 的模型方法来分析SARS疫情的传播。

元胞自动机 (CA, cellular automata) 也称为细胞自动机、点格自动机、分子自动机或单元自动机, 是时间和空间都离散的动力系统。散布在规则格网 (lattice grid) 中的每一元胞取有限的离散状态, 遵循同样的作用规则, 依据确定的局部规则作同步更新。大量元胞通过简单的相互作用而构成动态系统的演化。

4.2.1 元胞自动机模拟子系统的构成 一个元胞自动机系统最基本的组成包括元胞、元胞空间、邻居及规则四部分, 另外, 元胞的状态也是其重要部分。简单讲, 元胞自动机可以视为由一个元胞空间和定义于该空间的变换函数所组成。

1) 元胞又称为单元或基元, 是元胞自动机的最基本的组成部分。元胞分布在离散的一维、二维或多维欧几里德空间的晶格点上。在SARS模拟子系统中把空间进行离散化, 把实际的空间分成若干的细胞, 这些细胞就构成了元胞自动机系统中的元胞。

2) 状态可以是{0, 1}的二进制形式, 或是 {s0, s1, …, si, …, sk} 整数形式的离散集。元胞自动机的元胞一般只能有一个状态变量, 但在实际应用中, 往往将其进行扩展。在SARS模拟子系统中离散化的空间 (元胞) 包含与SARS相关的许多信息 (状态) , 为了方便模拟, 只取其中有限的状态集来对元胞进行描述。这些有限的状态不仅能反映出疫情的传播状态, 而且还能反映该细胞所代表的实际点的人口分布情况、地理状况等信息。

3) 元胞空间是元胞所分布在空间网点集合。元胞空间的几何划分有很多种方式, 考虑到SARS传播的各向同性的特点, 采用六边形网格, 使模型更加自然而真实。

4) 邻居元胞及元胞空间只表示系统的静态成分, 为将“动态”引入系统, 加入演化规则。在元胞自动机中, 这些规则定义在空间局部范围内, 即一个元胞下一时刻的状态决定于本身状态和它的邻居元胞的状态。定义一定的邻居规则, 明确哪些元胞属于该元胞的邻居。常用的邻居定义有冯·诺依曼 (von Neumann) 型、摩尔 (Moore) 型、扩展的摩尔 (Moore) 型和马哥勒斯 (Margolus) 型等, 可采用扩展的摩尔型, 其数学定义为

ΝΜoore={vi=(vix,viy)||(vix-vox|+|viy-voy|r,(vix,viy)Ζ2}

5) 规则根据元胞当前状态及其邻居状况确定下一时刻该元胞状态的动力学函数, 即状态转移函数。某一地区SARS的发展情况取决于其周边地区的SARS情况。而具体的SARS传播规则的内容, 可以从现有的微分方程模型中得到启发。

S. Amoyoso 将元胞自动机表示为一个四元组

A=(Ld,S,Ν,f)

其中A代表一个元胞自动机系统;L表示元胞空间;d是正整数, 表示元胞自动机内元胞空间的维数;S是元胞的有限的、离散的状态集合;N表示一个所有邻域内元胞的组合 (包括中心元胞) , 即包含n个不同元胞状态的一个空间矢量, 记为

Ν=(s1,s2,s3,sn)

n是元胞的邻居个数, siZ, i ∈{1, …, n}, f表示将Sn映射到S上的一个局部转换函数。所有的元胞位于d维空间上, 其位置可用一个d元的整数矩阵Zd来确定。

将各地采集的SARS数据以元胞状态的形式输入元胞自动机系统, 整个离散的空间就会动态的演化起来, 这种动态的演化反映了实际疫情在空间和时间上的分布情况。

《5 诊治子系统》

5 诊治子系统

一旦出现SARS疫情, 就须对SARS病人进行隔离诊治。对于不同的病人 (疑似病人) , 需要对病人自身情况进行分析以制定出适合不同病人的独特的治疗方案。中医讲究辨证论治, 因时、因地、因人而异, 同一种病在不同地区、不同季节、不同人群, 中药处方不一样;同一个处方, 有的人服了有效, 对另外一些人就可能有害。因此在治疗SARS病人的过程中, 不可以治疗方案一成不变, 例如在感染“非典”的病例中, 绝大多数是成年人, 主要是二三十岁到六七十岁, 儿童的病例还比较少, 由于其不同的年龄结构, 所伴随的治疗方案也不一样。这实际上是将具体的病人病情和治疗方案进行匹配的过程, 以提高治疗效率。

匹配的方法有著名的匈牙利算法, 要求每项工作的考核数据必须明确给出, 并且在匹配过程中往往只考虑单一因素。面对SARS防御宏观复杂大系统, 这种匹配方法就显得不足, 但是在一些细节问题上人们为了降低处理问题的复杂度, 又不影响诊断效果时, 这种方法还是有用的。对于复杂的匹配问题, 可以选择Vague匹配[13] 和集对匹配[14]

将事物分为正反两方面, 分别用正隶属度μt, 负隶属度μf 表示。利用Vague二分图分解定理[13]

Gt=λt[0,1]λtGλt,Gf=λf[0,1]λfGλf

引入集对思想后, 考虑同隶属度μa, 异隶属度μb, 反隶属度μc, 集对二分图分解定理[14]

Ga=λa[0,1]λaGλa,Gb=λb[0,1]λbGλb,Gc=λc[0,1]λcGλc

Vague匹配和集对匹配中的阈值λi由WAS系统确定, 从而对事物有一个综合的评价, 供人们选择。

SARS诊治调控框图见图4。

《图4》

图4 SARS诊治调控框图
Fig.4 SARS treatment control subsystem structure

图4 SARS诊治调控框图 Fig.4 SARS treatment control subsystem structure  

《6 二次防御子系统》

6 二次防御子系统

二次防御子系统有2个功能:从当前SARS疫情的状况自动学习一些经验结果;评估出当前疫情对整个社会经济状况产生怎样的影响。第一种功能可以通过使用机器学习、知识发现[15] 等技术来完成, 系统自动地利用这次学习到的经验进行下一场疫情的防治。而当前疫情对社会经济的影响可通过FGR系统来分析。

二次防御子系统的基本过程为图5。

《图5》

图5 二次防御子系统结构图
Fig.5 Second recovery subsystem structure

图5 二次防御子系统结构图 Fig.5 Second recovery subsystem structure  

《7 展望》

7 展望

讨论了建立防御SARS的智能决策支持系统的基本方法, 这套方法不仅仅能够应用到SARS疫情的决策支持上, 对于其他的传染性疾病包括禽流感, 或者突发性的社会范围的灾难如地震等也是有效的。通过智能决策支持系统的建立, 人们可以更加客观、科学地进行决策。而相关预决策软件的设计、实现和部署也将是一个复杂的系统工程, 考虑到各个子系统之间有交叉环节, 可采用面向对象的系统设计思想, 把VGES, FHW, FGR, WAS系统和消错系统作为各子系统的公用系统即为类, 把在子系统中的具体应用作为对象;并对VGES算法、FHW算法和FGR的软件等核心部分做了深入的探索和研究, 取得了预期的效果, 整个系统的设计与规划在进一步的研究当中, 恳请各界领导、医疗机构和科研部门参与开发, 谢谢。