《1 引言》

1 引言

复杂系统与复杂性是21世纪的核心科学问题之一, 已列入国家重点基础研究发展规划。复杂系统涉及范围广, 包括自然现象、工程、生物、经济、管理、军事、政治、社会等各个方面。例如, 经济系统中的金融证券市场的运行涉及到交易者的行为、交易者的交互、国家企业的经济形势、国家政策等诸多因素。正是由于诸多因素的随机性和交叉性, 经典的金融市场理论对市场的行为难于进行解释, 并对某项经济政策或者调整措施可能造成对金融市场的影响进行可信度的预测。经济观察报报道, 由于股评家胡乱推荐而上套的股民占29 %, 推荐股的有效性低于50 %。同样, 战场对抗也是典型的复杂系统, 敌我双方的作战单位、战略意图、战役战术思想、武器装备相互制约、各种因素的影响程度难于正确描述和确定, 其宏观行为难以进行推测。由此可见, 研究复杂系统对国家的社会经济发展和军事技术具有重要的意义。

对于复杂系统的复杂性研究存在着两类方法[1] 。第一类为朴素的还原论法, 其基本观点为:复杂系统的运动形式和规律与物理系统运动形式和规律相似。可以按照物理系统建模来构造复杂系统的模型框架。例如, 忽略很多因素的人口模型、经济发展预测模型、股评模型等。第二类方法为归纳推理方法, 或称行为仿真方法。它把仿真目标定位在行为一级, 根据复杂系统诸多因素的交互关系去建立系统同态模型, 观测因素的个体行为来研究复杂系统的复杂行为趋向。由于复杂系统具有涌现 (emergence) 、非线形和复杂的关联性等特点, 难于从上而下建立传统的数学分析模型。20世纪80年代, 在诺贝尔物理学奖获得者盖尔曼 (Marray Gell-Mann) 和安德逊 (Philip Anderson) 、经济学奖获得者阿诺 (Kenneth Arrow) 倡导下, 企图通过科学融和的方法自下而上地从个别到整体、从微观到宏观来研究复杂系统的复杂性。具有代表性的有美国桑培菲研究所的仿真平台Swarm[2], Source Forge的Repost[3] , 芝加哥大学社会与经济动态性研究中心的Ascape[4] , 麻省理工大学媒体实验室的StarLogo[5] , Sandia国家实验室的Aspen[6] 项目等。

随着回路仿真技术的发展, 形成了系统仿真、人工智能和分布计算相结合的分布智能仿真 (distributed intelligence simulation) 。相比之下, 上述复杂系统平台结构比较简单, 大多属于基于下一事件调度 (Swarm-like) 算法的单机系统, 适用于规模不大的系统。为此, 有必要对复杂系统计算机仿真进行基于分布智能仿真技术的新的研究与设计。

《2 复杂系统及其特点》

2 复杂系统及其特点

所谓系统, 我国著名科学家钱学森给出了系统描述性定义, 即“系统是由相互作用和相互依赖的若干组成部分结合成的具有特定功能的有机整体”。其中包含了三个要素:

1) 系统由若干元素组成;

2) 元素相互作用相互依赖;

3) 具有特定功能的有机整体。

系统的复杂性演变有三个方向:首先, 系统组成的元素数量从少量、大量、巨量到无限;其次, 元素相互作用相互依赖的关系从线性、非线性到随机性;第三, 整体的特定功能可以从元素功能直接描述、间接有组织描述和无组织不可描述 (如图1所示) 。

《图1》

图1系统复杂性

图1系统复杂性  

Fig.1 The systematic complexity

由此可见, 复杂系统不存在严格的定义。所谓复杂系统是指系统组成的元素数量巨大, 它们之间依存关系具有非线性和随机性, 系统整体功能不可能通过系统的局部特性来形式化描述或抽象描述。

金融证券市场无疑是一个复杂巨系统。组成该系统的元素有:普通证券参与者 (包括散户、大户、机构) 、证券公司、上市公司和企业、监管机构、国家金融、国内外政治经济形势等。上述诸因素都各自独立而又相互依存。以散户卖股票为例, 户主一定根据其获利的意图, 自己投资经验和操作手段, 对股市的形势分析和所知的其他信息来判断, 慎重地做出反应和决策。整个金融股票的形势决不取决于个别的散户, 而取决于系统的涌现, 但又与散户的决策行为有关。如果用神经元网络模型来描述复杂系统的元素微观行为, 则如图2所示。

《图2》

图2复杂系统的神经元网络模型

图2复杂系统的神经元网络模型  

Fig.2 The neural network model of complex systems

输入感知函数

Sumi=n=1ΝWniXi-Οi

输出决策函数

Οi+1=ξ(Sumi,C)

其中:Xn是诸元素, Wni是权函数, ξ是智能函数。由此可见, 复杂系统有如下特征:

1) 开放性 复杂系统组成的元素非常庞大而种类繁多, 研究系统不能孤立封闭地进行, 对诸元素采用聚集/突现的方法, 通过元素聚集或类来简化复杂系统, 并忽略与研究目标联系小的元素, 来突现对整体性能具有涌现的元素。

2) 关联性 复杂系统中每个元素都是独立存在的, 它们之间相互作用, 伴随着作用的信息流影响或者改变整个系统的行为或状态。

3) 自主性 复杂系统中每个元素具有自治性, 不存在全局控制, 大多以自主的方式规划自己的行为。

4) 不可计算性 复杂系统的不可计算性是指无法用纯数学的方式来描述复杂系统的行为, 复杂系统的整体行为不等于各个元素行为的总和。

《3 复杂系统分布智能仿真平台》

3 复杂系统分布智能仿真平台

《3.1单机自适应Agent仿真平台》

3.1单机自适应Agent仿真平台

具有重大影响的美国桑培菲研究所提出了用于复杂系统的自适应Agent仿真平台Swarm[2] , 如图3所示。平台由单机中若干进程或者线程组成的不同功能智能主体Agent, 包括控制时间推进和对象管理及通信的全局或局部Agent、人机交互的显示/控制Agent、完成网络交互的交互Agent以及具有自适应能力的反应Agent。

《图3》

图3单机自适应Agent仿真平台框架结构

图3单机自适应Agent仿真平台框架结构  

Fig.3 The framework of adaptive agent simulation platform on single machine

自适应反应Agent的结构框架同样在图中给出, 它由信息接口MI、信息缓冲MB、反应体 (规划、状态、智能控制) 和行为输出MO组成。MI和MB负责感知环境, 反应体根据感知作出行动决策。例如, 普通的证券交易人员 (散户) 的交易原则十分简单, 仅有:

——如果证券价格呈上升趋势, 则出售上升趋势若干倍的证券;

——如果证券价格呈下降趋势, 则买进下降趋势若干的证券。

《3.2分布智能仿真 (DIS) 平台》

3.2分布智能仿真 (DIS) 平台

随着分布计算机和人工智能技术的发展, 桑培菲的Swarm自适应仿真平台变得相对落后, 特别受到仿真规模和慎思智能的限制。为此, 设计了复杂系统的分布智能仿真 (DIS) , 它的物理结构在图4中给出[8]

图4中Agent支撑库主要支撑Agent结构的创建和仿真结果统计分析;仿真支撑软件提供系统时钟同步和消息组播技术。整个分布智能仿真平台中, 只有一个面向全局服务Agent, 它的主要功能是提供各Agent全局唯一的Agent标识, 创建和消除Agent, 提供Agent的物理位置和特征查询。每个结点机 (Node) 上有一个局部控制Agent, 它负责时间推进、对象管理、所有权变更和结点内部通信。

《3.3基于HLA/RTI的分布智能仿真平台》

3.3基于HLA/RTI的分布智能仿真平台

《图4》

图4分布智能仿真平台框架结构

图4分布智能仿真平台框架结构  

Fig.4 The framework of distributed intelligent simulation platform

分布智能仿真平台实质上包括了两大组成部分:一部分具有智能的主体 (自适应Agent以及显示/控制Agent) , 它代表金融证券市场的散户、机构、公司、国家等复杂系统的基本元素;另一部分是完成基本元素关联的交互Agent、局部Agent和全局Agent等。后者实际上是分布交互仿真高层框架协议HLA/RTI (IEEE1516) 所规范的内容。其结构如图5所示。

《图5》

图5基于HLA/RTI的分布智能仿真平台框架结构

图5基于HLA/RTI的分布智能仿真平台框架结构  

Fig.5 The framework of HLA/RTI-based distributed intelligent simulation platform

《4 智能主体和HLA/RTI功能》

4 智能主体和HLA/RTI功能

《4.1智能主体》

4.1智能主体

分布式人工智能的研究目标是创建描述自然和社会系统的概念模型[9] , 并构造表现出一定的智能行为的主体 (Agent) 。这正是复杂计算机仿真所需的基石。分布式人工智能一般分为分布问题求解 (distributed problem solving, DPS) 和多主体系统 (multi-agent system, MAS) 。前者是纯粹分布式问题求解, 将问题分解为任务, 并分布执行, 这是一种自上而下的设计系统;后者符合自下而上的设计系统。在原理上, 分散自主的主体首先被定义, 主体之间可能的交互是协作、竞争甚至是敌对。所以计算机仿真复杂系统理所当然地将智能主体作为首选研究对象。

凡是被称为主体Agent的软件或者硬件都具有以下特征:

1) 自治性 (autonomy) 主体运行时, 除非外部强迫控制, 它对自己的行为和内部状态有一定的控制权;

2) 交互能力 (connection) 主体能够通过某种主体语言 (agent communication language) 与其他主体交互信息;

3) 反应能力 (reactivity) 主体可以感知它所处的环境, 并做出基于目标的反应, 通过它的行为来影响环境。

智能主体可以分为慎思主体 (deliberative agent) 和反应主体 (reactive agent) 。德国Fischer, Muller和Pischel将反应、慎思和协作能力结合起来[9] , 构成混合主体。最著名的混合结构智能主体是MAPE混合结构, 如图6所示。

《图6》

图6MAPE混合结构

图6MAPE混合结构  

Fig.6 The structure of MAPE

MAPE智能主体除了要保持对紧急情况的及时反应, 还要使用一定的策略对其行为做出规划, 进而通过对世界的其他主体的建模分析预测未来的状态, 以及通过通信实现和其他主体的协商, 以达到做出慎思决策。以证券市场为例, 在股市大起大落时, 买卖股票要当机立断, 及时作出反应。而在股市平稳时, 有时间比较全面了解形势, 甚至与相关单位协商, 评估预测, 再作出行动决策。

《4.2HLA/RTI功能》

4.2HLA/RTI功能

RTI是HLA框架的核心, 其目的是将仿真应用与底层通信及基础功能相分离[10] 。如图7所示, 在复杂系统仿真过程中, 所有的智能主体按照HLA接口规范所要求的方式同RTI进行数据交换, 实现主体之间互操作。

《图7》

图7HLA/RTI功能

图7HLA/RTI功能  

Fig.7 The functions of HLA/RTI

综合管理提供六大服务功能:

1) 全局管理 主要提供全局服务, 包括创建、动态控制、修改主体执行等;

2) 声明管理 提供智能主体声明, 希望提供和接收的交互信息;

3) 数据分发管理 目的是限制网络上交互的流量, 通信时采用组播技术;

4) 主体管理 提供主体的控制服务;

5) 属性管理 对主体对象属性所有权控制、迁移;

6) 时间管理 目的是保证以适当的方式和顺序进行时间推进。

《4.3基于HLA/RTI的多Agent分布仿真平台》

4.3基于HLA/RTI的多Agent分布仿真平台

多主体仿真环境需要的大部分功能都可以由HLA框架中的RTI服务提供, 包括主体控制、信息分发、事件处理和时间推进。其中对实体状态更新和明确的事件处理有强大的支持, 时间管理机制也相当灵活[11] 。采用HLA/RTI作为MAE支撑环境, 可以充分利用HLA的建模范型以及RTI的强大功能, 使分布主体仿真环境更加通用和灵活。多Agent仿真环境的功能需求和RTI服务的功能对应如表1所示。

表1多Agent仿真环境需求与RTI服务对照表

Table 1 The relationship between the requirementof multi-agent simulation and RTI services

《表1》


多Agent仿真环境
的需求
RTI服务

主体控制:
主体的加入、退出
联邦管理FM/对象管理OM
注册 (register) / 发现 (discover) 类

信息分发:
Agent的信息
环境信息
数据管理DM/数据分发管理服务DDM:
发布 (publish) / 订购 (subscribe) 对象类
更新 (update) / 映射 (reflect) 属性

事件处理
数据管理DM/数据分发管理服务DDM:
发送 (send) / 接收 (receive) 交互

时间
时间管理服务TM

通信语言 (ACL)

从Agent的角度看, 完全采用HLA/RTI服务作为多Agent仿真平台还不完备, 其中最重要的是缺少对Agent之间通信的支持。基于Agent的应用需要跟踪远程Agent的能力和状态, Agent之间需要支持特定通信。在Agent的决策过程中, Agent之间的通信服务十分重要, 这时Agent不必关心这些事件具体是什么, 因此利用HLA/RTI中的数据订购不能满足Agent之间的通信需求。这些Agent之间的通信, 需要Agent通信语言 (ACL) 来定义 (见图8) 。而在HLA/RTI框架中, 无法进行具体描述。

《图8》

图8在RTI基础上增加ACL层

图8在RTI基础上增加ACL层  

Fig.8 Adding a ACL layer to RTI

要解决上述问题, 可以采用在Agent和RTI软件之间增加中间层 (ML) 的办法 (见图9) 。中间层ML的作用, 是对所有作为HLA仿真邦元加入到仿真环境中的自适应Agent之间的通信进行封装和解释, 从而在HLA/RTI仿真环境中增加了对Agent之间的通信以及对ACL的支持。

《图9》

图9利用数据分发管理控制数据流量

图9利用数据分发管理控制数据流量  

Fig.9 Controlling the data by data flow distribution management

由于经过中间层封装的消息, Agent邦元之间的数据流通量可能会有所增加, 这时可以采用RTI的路由空间限制联邦中数据分发的数量。在RTI中通过定义对发送或接收数据的约束, 邦元能保证只得到需要的信息。例如, 一个电台的邦元在不同的频段发出和接收信息, 路由空间可以通过所使用的频段来约束发出的信息, 只有在这个频段上接收的邦元能接收到相关信息。

为限制消息, 联邦中每个Agent可以使用其邦元ID作为约束参数创建一个路由空间。若发送者想要所有Agent接收到消息, 则不使用路由空间的概念。

综上分析, HLA/RTI功能特征适用于多Agent分布仿真环境, 如果是HLA/RTI进一步扩展, 可以方便地构建多Agent分布仿真平台。

《5 结语》

5 结语

复杂系统与复杂性的研究对于我国的经济、军事等各个方面都具有重要的意义。笔者从复杂系统计算机仿真的角度, 对目前的单机自适应仿真平台、分布智能仿真平台做了介绍和分析, 结合复杂系统、智能主体以及HLA/RTI的特点, 提出了一种基于HLA/RTI框架的复杂系统的多智能主体模糊计算机仿真的方案。