《1、 引言》

1、 引言

格雷克的《信息简史》开宗明义:信息是我们这个世界赖以运行的血液、食物和生命力[1]。随着信息系统的类型和数量越来越多、遍及范围越来越广、连通程度越来越高、协同需求越来越强,人们对于信息系统,特别是对于众多信息系统组成的系统之系统,或称之为体系的洞察和把握越来越难。体系是一组面向任务的系统的集合,其提供的功能和性能超过了构成系统的简单总和。这些特别复杂的信息系统体系在其运行过程中,由于受到种种内、外部不确定性因素的影响,其动态行为的演化可能偏离其最初设定的目的,甚至会出现不稳定现象。同时,这样的信息系统体系建设和应用中如果只强调秩序而忽视活力就必然导致系统的僵化,只强调活力而忽视秩序有必然导致系统的混乱[2]。人们十分渴望能够运用一整套信息系统动力学方法(类似于传统动力学)指导大型机械系统工程,引领和规范大规模信息系统体系工程的设计、研发、应用和评价。

事实上,信息动力学的研究已经存在多年,尽管大多数是在定性层面上,且缺乏定量规律[35]。例如,应用信息熵作为唯一的指标来衡量信息的有效性,这使得分析复杂的体系变得困难。对信息系统动力学的研究也已经进行了多年。Flory和Kouloumdjian [7]以信息系统动力学的名义研究了一个数据库模型,这与动力学的传统目标相去甚远。Bounfour和Batra [8]研究了信息技术和信息系统对商业模式、人力资源和社会组织的影响,但没有应用数学指标作为研究的基础。

尽管有这些努力,但由于缺乏具有普遍意义的坚实理论基础[9],一个合理的信息系统动力学研究范式尚未开启。此外,尽管近年来信息技术的发展和应用进展迅速,但一个全面、严谨和完整的信息系统动力学理论基础尚未建立。主要原因可以总结如下。

第一,对于信息空间缺乏科学合理的框架结构。信息空间是信息运动和作用的客观实在,信息系统是其中运用信息服务人类的基本载体。一般而言,输入-行为-输出是适用于任何系统过程的描述方式[10]。但是对于纷繁复杂的信息空间和信息系统,这种模式显然过于简单,不足以普遍支持系统的研究分析。若迷惘于信息空间的千变万化,则又可能被各种繁琐细节所拘泥而不能自拔。迫切需要以一览众山小的总体格局,抽丝剥茧,去繁就简,对信息系统的基本组成进行合理分类,描绘整个信息空间的框架结构,才能支持形成信息系统动力学的理论体系。

第二,对于信息概念缺乏普遍公认的数学基础。年发表《通信的数学理论》,其被视为信息论的开山之作,揭示了通信过程的本质就是减少不确定性,并且由于具有一定概率分布的随机事件的不确定性可以表示为熵[11],因此有人认为信息就是“负熵”。但由于信息的应用远远超出通信的范围,信息系统的形态也远非通信系统所能涵盖,用“负熵”解释信息完全不能满足当代信息科技发展特别是信息系统工程的实践之需。事实上,至今人们对信息的认知远未形成共识[1213],这就自然难以运用严谨精深的数学工具建立完备细致的信息系统动力学理论体系。

第三,对于信息价值缺乏明晰丰富的度量体系。据我们所知,香农的信息熵是唯一被广泛采用的信息度量指标[1416]。然而,由于信息系统已经演变成具有远超过通信的复杂结构和不同功能[17],因此基于熵的度量指标无法全面衡量各种信息系统的复杂动力学[78]。尽管还有其他关于信息测量的研究存在[1821],但它们缺乏严格的数学定义和系统性,这使得建立用于研究信息机制的基础、基本参考框架变得困难。

第四,对于信息作用缺乏清晰明了的功效分析。动力学机制描述了目标对象在特定领域内如何相互影响。例如,在牛顿力学中,通过测量和分析速度、能量和功率的效率来建立机械动力学的理论体系[22]。这种方法论也已被应用于其他领域,如化学动力学[23]和经济动力学[24]。然而,尽管信息在日常生活中无处不在,但缺乏一个系统性的方法来测量和分析信息系统的不同效能。显然,只有通过建立一个完整的信息效能分析体系,我们才能准确地分析复杂大规模信息系统中的动力学模式。

为了解决这些基础性的挑战,许建峰等[25]提出了一个名为“客观信息论”的数学理论,该理论将信息的概念从一个一般的任意概念简化为现实世界中的一个客观概念,定义信息为从现实世界中的对象到信息空间中的对象的数学映射。这种方法进一步被用于解释空中交通管制系统的行为,证明了应用客观信息论来研究信息系统的可行性[26]。

在本文中,我们通过引入“可还原信息”的概念进一步修改和完善了客观信息论。因为信息的可还原性确保了数学同构,这为完成客观信息论提供了一个重要的前提条件,从而我们可以将度量指标从9个扩展到11个,以更加全面地衡量信息。此外,为了应用这11个度量指标来测量和分析信息系统的运行和功效机制,我们提出了一个名为“动力构型”的分析模型,以便于分析信息系统的各种功效。综合来看,信息空间的框架结构、客观信息论、动力构型以及用于分析信息系统各种功效的方法构成了具有普遍意义的信息系统动力学的基础理论框架。本文所提出的信息系统动力学理论已经在中国智慧法院体系工程中得到应用和验证,为分析、设计、开发和评估各类大规模复杂系统提供了参考。

《2、 信息空间的框架结构》

2、 信息空间的框架结构

互联网和移动互联网[2728]、物联网[29]、大数据[30],云计算[3132]、超级计算[3334],人工智能[35]和区块链[36]等一系列信息技术和系统的广泛应用,深刻改变着人类的生产生活方式。特别是,元宇宙的出现,全面整合了信息技术的成就,比以往各项信息技术成果具有更加广阔的涵义[37]。因此,从现实世界、人类社会和信息系统的整体视角建立一个信息空间框架,以全面研究信息运动和利用的原理,是至关重要的。

《2.1 现实世界中的信息空间》

2.1 现实世界中的信息空间

控制论的创始人维纳(Wiener)指出,“信息就是信息,而不是物质或能量”[38],这暗示了它具有客观的性质。受到维纳理论的启发,我们将信息限制在客观范畴内,并将物质、能量和信息视为客观世界的三大构成要素。其中,信息以现实世界中的物质和能量为媒介,客观反映现实世界中的事物及其运动状态。在这里,我们采用了英国哲学家波普尔的“三个世界”理论,该理论在归纳物理状态和过程的世界(世界1)以及心理过程的精神世界(世界2)的同时,将知识以其客观意义归属于世界3——一个第三方、客观真实的本体范畴[39]。

可见,亘古以来现实世界中就存在信息空间。自然界中声、光无不向观察者提供着信息,语言、图像等也在向人们表达着信息,这些都是现实世界中信息空间的内容存在,概属于Popper“三个世界”中的世界1和世界3,某种程度上,这两个世界本身都是信息的载体,可以看成是现实世界中信息空间的集合。但是,这些信息的作用范围和功效都非常有限,以至于今天人们反而容易忽视它们的存在。

《2.2 信息时代的信息空间》

2.2 信息时代的信息空间

在信息时代,各种各样的信息系统不断涌现。通过数字化,现实世界中的信息被转化为信息系统内的信息,从而反映客观世界。在这种情境下,客观世界包含了基于信息系统的信息空间。例如,数字孪生用于在信息空间中构建数字对象,以表示现实世界中相应的物理对象,利用信息空间的内核反映现实世界的外壳。

此外,信息空间与现实世界之间的互动有助于在概念、技术和文化层面之间达到平衡。可以想象,在元宇宙中,人类个体将在信息空间里拥有自己的虚拟数字身份(avatar)。通过这些虚拟身份,人们能够将社交活动扩展到信息空间,这种场景在一些大型多人在线角色扮演游戏等视频游戏平台上已经实现[37]。这些虚拟身份将能够自学习、自适应、自交互、自进化,甚至获得更多的幸福感并将这样的感受和体验带回到现实世界,以积极(或消极)的方式改变现实世界。通过这种方式,生命也可能在信息空间中从生理有限扩展到数字无限。

总体而言,信息空间横跨现实世界中的“世界1”和“世界3”,信息系统显然被包括在内。特别是,在信息系统中信息是以数据的形式存在的,涵盖信息采集、传输、处理和作用的全过程。

《2.3 信息空间框架结构》

2.3 信息空间框架结构

构建信息空间框架结构是发展信息系统动力学理论体系的重要前提。一个信息空间框架结构应该充分整合现实世界和信息系统、考虑信息科学和技术的成就、覆盖所有信息处理过程、展示信息流的作用,并支持信息系统的研究、分析和评估。这些考虑可以通过以下四个原则来总结:①信息空间的框架结构应该是现实世界和信息系统的全面融合;②信息空间的框架结构依赖于信息的充分流动和驱动作用彰显蓬勃生机;③信息空间的框架结构必须包含信息运动的所有重要流程环节;④信息空间的框架结构必须包容信息技术的一系列重要成果。

基于上述准则,提出信息空间框架结构如图1所示。其中,橙色区域为现实世界中的主观世界。完整的蓝色区域为承载信息空间的所有载体,既涵盖现实世界中的客观物理世界和客观知识世界,也涵盖由外向内自第二环开始的信息采集/作用、信息传输、信息处理、数据空间等所有信息系统。穿梭于各个环节的箭头表示运动于现实世界和信息系统中的各种信息流,自现实世界由外向内历经信息采集、信息传输、信息处理三环,最后汇聚淀积到核心区域——数据空间,然后又逆向由内而外,经过信息处理、信息传输、信息作用三环,作用于现实世界。由于信息采集和信息作用直接面向现实世界,所以我们将信息采集/作用表现在同一环路,仅用颜色深浅和信息流不同指向加以区分。理论上,信息系统都是现实世界的组成部分,但由于其对于信息、信息流和信息空间的特殊作用,并且其也是信息系统动力学的主要研究对象,因此在信息空间框架结构中将其与现实世界分开,中心成为我们关注和研究的主体。图中所有信息流的总和构成元宇宙,驱动实现现实世界与信息系统的各种交互作用。

《图1》

图1 信息空间框架结构。MR:混合现实;VR:虚拟现实;AR:增强现实;AE:电磁采集;TA:温度采集;PA:功率采集;AA:音频采集;DP:数据功率;OA:光学采集;COMM:通信;DN:数据网络;PN:专用网络;TC:传统计算;DI:数据信息;TI:文本信息;AuI:音频信息;ImIn:图像信息;VI:视频信息;GI:图形信息;KG:知识图谱。

图1所示,主观世界指向信息系统发送并从其中接受信息,自身并不存储信息,只包含意识、认识、知觉、知识等主观内容,这样符合信息只属于客观范畴的基本定位。客观物理世界包含自然物体和人造物体等两大组成部分。客观知识世界包含图画、书籍、语音和视频等知识产品。无论客观物理世界还是客观知识世界,都既能够产生或接收信息,也能够存储信息,因而也是信息空间的重要载体。

信息采集/作用环直接面向现实世界。信息采集通过光学采集、音频采集、动力采集、温度采集、电磁采集等各种方式和途径从现实世界采集到各类信息后,将其发送到信息系统其他组成部分。信息作用则逆向行之,从信息系统其他组成部分接收到信息后,通过语言文字、图像影像、数据、动力、温度、虚拟现实、增强现实、混合现实等各种方式反馈作用于现实世界。信息传输环主要运用通信、专用网、互联网、移动互联网、数联网、物联网等方式,实现信息系统内部各种类型信息端到端传输或相互之间的信息交换。信息处理环主要运用传统计算、超级计算、云计算、大数据、人工智能、区块链等方式以及还可以进一步细分为若干具有特定功效的子方式和算法,对信息系统中的各类信息按照业务需求进行各种必要的处理,以满足各类用户的信息需求。

数据空间是信息系统的核心。现实世界中的各类信息经过数字化采集、传输、处理等环节后,转换形成类型丰富、规模庞大、关联密切的巨量数据,以数据信息、文本信息、音频信息、图形信息、图像信息、视频信息、知识图谱、数字孪生等方式汇聚到数据空间,足以形成表征现实世界的全息镜像。这样的全息镜像与现实世界自身相比,显然在传输和处理上具有很多无可比拟的条件和便利,能够使得人们几乎随心所欲地加以利用,反哺作用于现实世界,推动人类的文明进步。所以一定程度上,信息系统的中心任务就是构建能够表征现实世界全息镜像的数据空间。

《3、 信息度量的数学基础》

3、 信息度量的数学基础

信息的数学定义是推断信息属性和度量的基础。一个坚实完备的数学体系是信息系统动力学指导信息系统体系工程实践的关键部分。

《3.1 信息的模型》

3.1 信息的模型

受维纳对物质、能量和信息的观点启发[25],客观信息理论起源于这样一种哲学观点:信息是客观和主观世界中对象及其运动状态的客观反映。本文研究所提出的信息空间框架结构也体现了这一信息哲学观点,即现实世界是信息空间的本质,提供了信息的来源;反过来,信息空间反映了现实世界,并通过在物理上难以开展的对实体和运动的模拟和推导来反馈现实世界。在客观信息论中,客观信息论的数学模型如下:

I:fo,Thgc,Tm(1)

式中,I表示客观信息;o表示本体(即在现实世界中产生信息的对象);c表示载体(即在现实世界中传输和维持信息的对象);Th表示发生时间;Tm表示反映时间。本体o属于客观世界或主观世界,因此数学上o2OS。载体c仅属于客观世界,因此c2O。发生时间Th和反映时间Tm都处于时间域内,即Th2TTm2T。这里,O表示一个包括“世界1”和“世界3”中基本对象的客观世界集合;S 表示一个包括“世界2”中基本对象的主观世界集合;T表示信息行为持续时间的时间集合。OST中的元素可以是连续的或离散的,可以根据论域的特定要求进行合适的具体划分。此外,fo,Th表示oTh上的一个非空集合,被称为状态集合;gc,Tm表示cTm上的一个非空集合,被称为反映集合。

公式(1)亦可表达为:

Ifo,Th=gc,Tm(2)

因此,信息I在数学上便是从状态集合fo,Th到反映集合gc,Tm的满映射。附录A中提供了一个解释性示例,以进一步说明信息的数学模型。

由于信息I也记为I=o,Th,f,c,Tm,g,这个信息的数学定义也称为信息的六元组模型。在之前的客观信息论研究中,信息可以是单值映射和多值映射,以适应最广泛的可能情况[25]。然而,多值映射难以理解,相应的实际应用也难以找到。因此,在本研究中,我们将信息限制为单值映射,这可以在不影响大多数(甚至所有)应用的情况下,为后续的研究带来显著的便利。

通过六元组模型,我们对信息概念进行了三项重要解构。一是对于信息主体的二元解构:根据信息的反映特性,利用本体o和载体c的二元结构描述信息的主体;二是对于信息的时间维解构:针对信息的时变特性,引入状态发生时间Th和反映时间Tm两个参量,支持从时间维开展信息运动的分析研究;三是对于信息内容的形态解构:引入状态集合fo,Th和反映集合gc,Tm两个因变集合,以此容纳所有的信息内容和形态。通过此三项重要解构,使得我们能够除信息量之外,还能对信息进行更加深刻、全面的剖析,也为建立科学有效的信息系统动力学提供坚实的数学基础。

《3.2 信息的基本性质》

3.2 信息的基本性质

通过信息六元组模型,我们可以数学推导出信息的五个主要基本属性:客观性、还原性、传递性、组合性和关联性。

《3.2.1. 客观性》

3.2.1. 客观性

在信息六元组模型中,对本体o和载体c的区分是对信息I主体的二元解构。基于这种解构,信息I可以通过反映集合gc,Tm,即cTm上的状态集合来体现。在这里,c属于客观世界;因此,信息I可以通过客观世界来感知,这就是客观信息论以信息的客观性命名的原因。

由于信息的客观性,人们可以使用各种技术手段来收集、传输、处理、聚合和应用信息。实际上,诸如人工智能、类脑系统和脑-计算机接口等新兴技术的快速发展,就是由模拟人类思维并将人类的主观过程转化为可以由信息系统处理的客观信息的进展所驱动的。因此,我们认为客观信息论在信息系统和技术的分析和研究中起着基础性的作用。

《3.2.2. 还原性》

3.2.2. 还原性

作为一种在数学上定义的映射,信息I可存在一个逆映射I-1。这里,如果cTm上的状态gc,Tm可以通过I-1还原为oTh上的状态fo,Th,我们称信息I是可还原的,也就是信息的还原性。在这里,fo,Th也被称为信息I的还原态,其详细的数学推导在附录A中呈现。此外,如果存在一个映射J使得Jgc,Tm=f˜o˜,Th̃,其中,o˜称为反映本体(o˜2OS)Th̃称为反映发生时间(Th̃2T),并且f˜o˜,Th̃o˜Th̃上的某个状态集合,那么J则称为I的反映,f˜o˜,Th̃I基于J的反映状态。当J=I-1时,f˜o˜,Th̃I的还原态。

需要指出的是,可还原信息的状态集合和反映集合之间的同构具有重要意义。通过同构,相同的数学方法可以应用于两个不同的信息集合——本体状态和载体状态——这些集合中的对象具有相同的属性和处理方法。这使得针对一个集合建立的命题也可以为适用于另一个集合,为使用丰富的数学理论来开展信息科学领域的广泛研究提供了极大的便利。

《3.2.3. 传递性》

3.2.3. 传递性

信息I通过复合映射I´Ifo,Th实现了由oc再到c´、由ThTm再到Tm´、由fo,Thgc,Tm再到g´c´,Tm´的传递,这就是信息的传递性。其详细的数学推导在附录A中呈现。可以说,正是因为信息具有传递性,才能实现在采集、传输、处理、汇聚和作用等各个环节的运动。特别是串行信息传输是信息系统中信息流的极为常见的形式,因此分析串行信息传输链的机制对于构建信息系统动力学理论体系具有重要意义。

《3.2.4. 组合性》

3.2.4. 组合性

在等式(1)中,fo,Thgc,Tm是数学集合。因此,信息I自然可以被分解或组合成不同的新集合;从而信息具有组合性。详细的数学推导在附录A中呈现。信息的组合性决定了信息可以灵活地拆分和任意组合,这为人们根据实际需要确定信息处理对象创造了充分条件。

《3.2.5. 关联性》

3.2.5. 关联性

信息的关联性至少表现在三个方面。首先,对信息I=o,Th,f,c,Tm,gocThTmfo,Thgc,Tm都成对出现,特别是fo,Thgc,TmI作为fo,Thgc,Tm的满映射,建立了oc这样一对事物所处状态之间的特定联系。并且由于传递性,信息还能将更多的事物联系在一起,这便是信息关联性的一个重要体现,据此人们常言信息是万物联系的桥梁。

其次,因为信息可以分解为若干子信息,所以不同信息之间可能存在包含与被包含的关系,或者共同包含于另一信息的关系。由此可见信息之间能够建立起各种相互关系,这将是信息关联性的另一种体现形式,据此人们可以分析和利用信息之间的各种关系。

再次,分析信息的内部结构,还能发现信息关联性的最重要体现在于其能够反映其还原态内部的各种关系。可以证明,可还原的信息能够完全保留其还原态的内部关联结构,这就为人们对信息内部结构的处理、分析和利用提供了重要前提。

《3.3 信息的度量》

3.3 信息的度量

客观信息的哲学观点和与之相关的客观信息论的信息六元组模型提供了一个强大而灵活的工具,用于推导各种信息度量。这些信息度量既可以受到理论研究的启发,也可以受到实践经验的启发。为了指导和规范信息度量的推导,我们提出了以下原则:

·溯源性原则——从信息的定义模型出发,形成各种度量的具体定义和数学表达;

·完整性原则——从信息的实际内涵出发,形成与其价值密切相关的完整度量体系;

·普适性原则——从信息的广泛类型出发,形成普遍适用于信息获取、信息传输、信息处理、信息应用及其组合所成的各类信息系统,而不仅限于某一特定领域的度量定义;

·实用性原则——从信息的应用要求出发,形成具有实用性和可操作性、能够指导信息系统分析研究的度量体系。

·开放性原则——从信息的复杂特性出发,人们很难完全认清信息的度量体系,需要根据理论研究和工程应用需求,合理补充、修正、完善信息的度量体系。

基于上述原则,我们定义了以下11个信息度量指标。需要强调的是,所有度量指标都基于可还原信息。此外,我们还对之前客观信息论研究中的部分度量指标进行了修正[25]。

《3.3.1. 信息的容量》

3.3.1. 信息的容量

g(O×T)是客观世界和时间域上包含g(c,Tm)的一个状态集合,(g(O×T),2gO×T,σ)构成测度空间,其中,σ是空间中的测度。则信息I关于测度σ的容量volumeσI就是g(c,Tm)的测度σg(c,Tm),即

volumeσI=σg(c,Tm)(3)

在信息系统中,信息的容量通常以比特为单位,是人们最易理解的信息度量。在实践中,(g(O×T),2gO×T,σ)的测度σ可由论域决定。所以,这里定义信息的容量并不唯一,而是可以依据不同的需要作出不同的定义。同样的理由,下述各项度量定义也都可以随关注点的变化而改变。本文对信息容量的定义根据之前的工作进行了修正[25],其推导过程在附录A中呈现。

《3.3.2. 信息的延迟》

3.3.2. 信息的延迟

信息的延迟反映了载体对本体状态的响应速度。因此信息I=o,Th,f,c,Tm,g的延迟delayI就是其反映时间上确界与发生时间上确界之差,即

delayI=supTm-supTh(4)

需要强调的是,延迟的定义允许其具有正负性,特别是当supTm<supThdelayI<0时。这表示载体在本体状态发生时间Th之前,对未来相关状态的预测。比如信息系统中预测相关物体的运动、相关事件的发生等。例如,在信息系统中可以预测目标对象的运动和感兴趣事件的发生。本文对信息延迟的定义根据之前的工作进行了修正[25],其推导过程在附录A中呈现。

《3.3.3. 信息的广度》

3.3.3. 信息的广度

设(OS,2OS,σ)(OS)上的一个测度空间,σ为集合(OS)上的某种测度。根据OS的定义,本体σOS中的元素,即o2OS。则信息I关于测度σ的广度scopeσI就是o的测度σo,即

scopeσI=σo(5)

《3.3.4. 信息的粒度》

3.3.4. 信息的粒度

对信息对II´,若I´I的真子信息,且不存在任何I的其他真子信息I使得II´,则称I´I的原子信息。

在此处,设(OS,2OS,σ)是一个测度空间,σ为集合(OS)上的某种测度,信息I中所有原子信息的集合记为A=Iλ=oλ,Thλ,fλ,cλ,Tmλ,gλλΛΛ是指标集。设μ是指标集Λ的测度且μ(Λ)0,则信息I关于测度σ的粒度granularityσI就是A中所有原子信息本体测度的积分对指标集Λ的测度之比,即

granularityσI=Λσ(oλ)dμμ(Λ)(6)

式中,μ通常取计数测度最为适宜。本文对信息粒度的定义根据之前的工作进行了修正[25],其推导过程在附录A中呈现。

《3.3.5. 信息的种类》

3.3.5. 信息的种类

对于信息I,设R是状态集合fo,Th上的等价关系,fo,Th中的元素关于R的等价类组成的集合为[fo,Th]R,则信息I关于R的种类varietyRI就是集合[fo,Th]R的基数,即

varietyRI=[fo,Th]R¯(7)

需要说明的是,可还原信息能够将状态集合内部的等价关系传递到状态反映集合之中,因此载体的状态反映集合完全能够反映信息的种类度量。

《3.3.6. 信息的时长》

3.3.6. 信息的时长

信息I的时长 durationI就是Th的上确界与下确界之差,即

durationI=supTh-infTh(8)

式中,infTh是发生时间Th的下确界。

《3.3.7. 信息的采样率》

3.3.7. 信息的采样率

对于信息I,若infThsupTh,设{Uλ}λΛ是一族两两不相交的连通集合,且满足:对于任何λΛ,都有UλinfTh,supTh,ThUλ=,其中,Λ是指标集。则信息I的采样率sanmple rateI就是Λ的基数与U=λΛUλ的Lebesgue测度|U|之比,即

sanmple_rateI=Λ¯|U|(9)

特别地,若infTh=supThU的Lebesgue测度U=0,则定义sanmple_rateI=。这表示信息I的状态集合在时间上是完全连续的。

《3.3.8. 信息的聚合度》

3.3.8. 信息的聚合度

对于信息I,设集合fo,Th的基数fo,Th¯0,ℛ是状态集合fo,Th上所有元素之间关系的集合,则I的聚合度clusteringI就是集合ℛ的基数与集合fo,Th的基数之比,即

aggregationI=¯fo,Th¯(10)

聚合度表征了状态集合fo,Th内部元素之间关系的密切程度。一般情况下,状态集合fo,Th内部元素之间的关系越密切,也就是聚合度越高,信息的价值越高。

《3.3.9. 信息的遍及度》

3.3.9. 信息的遍及度

对于信息II´,若存在逆映射I-1I´-1,使I-1gc,Tm=I´-1g´c´,Tm´=fo,Th,则称两个信息II´互为副本。设Iλ=oλ,Thλ,fλ,cλ,Tmλ,gλλΛ是包含可还原信息I=o,Th,f,c,Tm,g及其所有副本的集合,Λ是指标集,μ是指标集Λ上的测度,σ是可测集c上的测度,则信息I关于测度σ的遍及度coverageσI就是所有cλ的测度之积分:

coverageσI=Λσ(cλ)dμ(11)

《3.3.10. 信息的失真度》

3.3.10. 信息的失真度

对信息I和其反射J,设I的状态集合fo,Th和基于J的反射态f˜o˜,Th̃都是距离空间,d中的元素,其中d上的距离,则称信息I的反射J在距离空间,d中的失真度distortionJ(I)就是f˜o˜,Th̃fo,Th的距离,即

distortionJ(I)=d(f,f˜)(12)

可见,失真度就是反射态与还原态之间的偏离程度。当且仅当失真度distortionJ(I)=0时,信息I的反射态就是其还原态。

《3.3.11. 信息的失配度》

3.3.11. 信息的失配度

设目标信息I0=o0,Th0,f0,c0,Tm0,g0为可还原信息,对可还原信息I=o,Th,f,c,Tm,g,设o0oTh0Thf0fc0cTm0Tmg0g分别都是集合PoPThPfPcPTmPg中的元素且I0I都是距离空间(Po,PTh,Pf,Pc,PTm,Pg),d中的元素,则信息I对目标信息I0的失配度mismatchI0I就是两者在距离空间(Po,PTh,Pf,Pc,PTm,Pg),d中的距离,即

mismatchI0I=dI,I0(13)

需要指出的是,所有这些度量指标都是使用基础数学工具(如集合和测度)来定义和推断的,这使它们能够适应各种经典的信息理论或原则。例如,香农信息熵是用于测量传输消息的通信系统容量度量的一个特例。实际上,对于上面的每一个度量指标,都可以在经典或常见的信息科学理论或原则中找到一个相应的例子(表1 [4046])。

《表1》

表1 针对不同信息度量的经典信息科学理论对应实例

《4、 信息系统的度量功效和动力构型》

4、 信息系统的度量功效和动力构型

动力学在本质上是空时中运动和变化的规律与机制的数学表达,其与实验科学中的测量及其度量密不可分[6]。可见,“数学化表达形式”和“计量”是研究特定对象动力学机制的必要条件。客观信息论对于信息数学表达、基本性质和度量体系的研究为我们能够深刻、定量地进行信息系统的动力学分析奠定了坚实的数学基础。

《4.1 信息系统的度量功效》

4.1 信息系统的度量功效

任一信息系统都可以简化为接收输入信息,施加各种作用,最后产生输出信息的基本过程。由此可见信息系统的主要意义就在于,其施加于输入信息的各种功效通过输出信息得以表现。如果不能对这些功效进行全面分析、合理解构和定量表达,就难以深刻理解信息系统的运行机理和内在规律,也就无法构建能够引领信息系统建设和发展的信息系统动力学理论体系。所以准确理解信息系统的各种功效,对于深入研究信息系统动力学具有决定意义。

任何一种功效都不能离开度量指标进行定量表达,而任何一种度量背后必定存在实际的作用功效,所以运用度量体系全面定量地描述、分析信息系统的主要功效,是水到渠成之举。由此我们可以通过前述的11类度量建立信息系统可能具有的11类度量功效,即容量功效、延迟功效、广度功效、粒度功效、种类功效、时长功效、采样率功效、聚合度功效、遍及度功效、失真度功效和适配度功效。关于信息系统功效的详细阐述在附录A中呈现。

图2集中反映了信息系统及其各个环节具有的度量功效分布,★所在位置表明其所在环表示的信息系统环节具有其所在扇区的信息度量功效,信息采集和信息作用处于最外围的相同环中,利用深浅两种颜色加以区分,深色为信息采集环节,浅色为信息作用环节。由此可以通过度量功效分布解构整个信息系统的功能和性能指标,为系统设计、分析、测试和集成提供充分、定量的依据。

《图2》

图2 信息空间各环节度量功效分布。

《4.2 信息系统动力构型》

4.2 信息系统动力构型

图3更为直观地展现了信息系统各环节,即信息采集、信息传输、信息处理、数据空间和信息作用,在信息流作用之下的运行和功效机制分布,可以称之为信息系统的完整动力构型。由图3可见,完整动力构型既包括所有的信息运动环节,也包括各环节之间可能出现的信息流。一般而言,只要对象系统保持信息流程的连续性,我们就能够利用各种环节的功效分析整个系统的功效,这就是提出信息系统动力学并以此指导信息系统规划、设计、研发和集成的本意所在。

《图3》

图3 信息系统完整动力构型。

图3中,信息系统的每一个环节都能影响整个系统的度量功效。一般情况下,各个环节的同类功效必然具有相互叠加或相互约束的效能。比如各个环节的延迟功效显然能够相互叠加形成整个系统的延迟功效。前续环节的容量指标显然形成了对后续环节的容量要求,若后续环节不能满足,必然影响整个系统的容量功效。

另一方面,不同功效之间也存在着相互影响的效能。比如容量功效显然影响系统的失真度功效,容量不足的情形下,必然会对状态反映集合的元素有所舍弃,从而导致增加信息的失真度指标。按顺序排列的前十种度量功效几乎都会影响到整个系统的失配度指标。因为失配度反映了信息系统输出信息偏离特定用户需求的程度,容量、延迟、广度、粒度、时长、种类、采样率和聚合度等指标显然都与具体用户的需求密切相关,并非性能越高越好。而遍及度指标则需要随着用户的意愿而调整,为控制信息知悉范围,有时需要采取很多措施充分降低信息的遍及度,所以遍及度指标并不与适配度指标单向相关。失真度指标也并不与失配度指标正相关,因为对于加密信息系统中,往往越高的失真度对特定用户而言就是越低的失配度。

在工程实践中,人们并不总需要全面关注信息系统的完整动力构型。因为在很多场景,信息系统的部分环节未必决定或影响整个系统的关键功效,此时就可以省略考虑相对次要的部分环节,形成信息系统的一系列简化动力构型,如只包含处于同一环中信息采集和信息作用两个环节的单环动力构型,包含信息采集、信息传输和信息作用环节的三环动力构型,包含信息采集、信息传输、信息处理和信息作用环节的三环动力构型等。研究信息系统各种构型或场景之中的度量功效作用机理,揭示信息系统的内在运行规律,就为信息系统动力学提供了非常广阔而实用的发展前景。

《4.3 中国智慧法院信息系统体系工程》

4.3 中国智慧法院信息系统体系工程

从2013年以来,中国法院运用信息系统动力学的原理和方法,在全国范围推进智慧法院建设,成效非常显著,使我国在世界司法人工智能领域处于领导地位[47]。

《4.3.1. 中国智慧法院体系工程概述》

4.3.1. 中国智慧法院体系工程概述

中国智慧法院建设涉及3000多个法院、10 000多个派出法庭、4000多个协同部门,各地法院同时运行、相对独立的基础支撑、业务应用、数据管理、网络安全和运维保障等信息系统数量达到13 000多个,系统规模巨大,空间分布广阔,存续时间参差,技术体制异构,功能任务各异,协同部门众多,共享联动密切,是一项十分浩繁的信息系统体系工程[48]。

智慧法院信息系统中,智慧服务、智慧审判、智慧执行、智慧管理和司法公开等系统是直接面向广大用户,担负信息采集和信息作用任务的信息系统,如表2所示。其中,智慧服务系统包括中国移动微法院、人民法院调解平台、诉讼服务网、12368诉讼服务热线、电子送达、在线保全、在线鉴定等平台,智慧审判系统包括审判流程管理、电子卷宗流转应用、智能审判辅助等平台,智慧执行系统包括执行指挥、执行案件流程信息管理、执行查控、失信惩戒、网络司法拍卖、一案一账户案款管理、移动执行等平台,智慧管理系统包括网上办公、审判监督和电子档案等平台,司法公开系统包括中国审判流程信息公开网、中国庭审公开网、中国裁判文书网、中国执行信息公开网等平台。互联网、法院专网、移动专网和外部专网是将法院内、外用户连成一体,担负信息传输任务的信息系统。电子卷宗自动编目、案件信息自动回填、法律知识服务、类案智能推送、庭审音视频智能巡查、裁判偏离度智能分析、卷宗材料一键归档等是担负信息处理任务的信息系统。司法大数据管理和服务平台汇聚了全国法院的审判执行数据、司法人事数据、司法行政数据、外部数据、司法研究数据和信息化运行数据,是反映全国法院审判执行和运行管理状态的核心数据空间。

《表2》

表2 中国智慧法院信息系统体系的主要组成系统

《4.3.2. 智慧法院信息系统体系关键功效》

4.3.2. 智慧法院信息系统体系关键功效

智慧法院信息系统体系的建设和应用的总体成效取决于所有信息系统集成一体所产生的各种信息功效。虽然几乎每一个系统、每一个信息都会作用并影响到部分用户的使用感受和效果,但部分重点系统的关键性能指标会对整个体系的11类度量功效产生更为重要的影响。实践中我们基于11类信息功效形成了智慧法院信息系统体系关键度量指标体系(表3),并通过这些关键指标的变化情况,不断提升整个智慧法院信息系统体系的运行质效。

《表3》

表3 智慧法院信息系统体系关键功效分布

《4.3.3. 智慧法院信息系统体系效能分析》

4.3.3. 智慧法院信息系统体系效能分析

图4反映了近年来智慧法院信息系统部分关键度量指标的变化情况。

《图4》

图4 中国智慧法院信息系统体系关键功效指标。

其中,图4(a)反映了司法大数据平台数据资源总量体现最高法院汇聚全国法院司法大数据的容量,其稳定上升显现了司法大数据资源的积累越来越丰厚;图4(b)反映了法院办公平台平均响应延迟指标,自2020年11月开始此项指标下降到0.8 s以下,直接关系到几乎所有用户的体验,赢得了用户的一致好评;图4(c)反映了至2021年11月以来,全国视频网络稳定连通全国93%以上的科技法庭,视频网络覆盖率体现了全国法庭视频信息的广度指标。

图4(d)显示从2015年8月开始,全国法院案件覆盖率基本达到并一直稳定在100%,充分说明对于全国法院司法信息管理的粒度已经达到非常精细的程度;图4(e)反映自2013年12月司法大数据平台正式上线运行以来,信息种类稳步增加,基本实现对所有信息类型的汇聚、管理和应用,司法大数据平台汇聚信息的种类体现了信息管理的完整性;图4(f)反映自2018年3月以来,法院信息系统的平均无故障时间基本稳定在700 h以上,个别时段由于出现明显下降,必然导致相应时段实时采集信息时长的缩短,信息系统平均无故障时间体现了实时采集信息的平均时长。

图4(g)反映了法眼平台实现对全国法院信息系统运行质效的监控管理,其信息采样率需要根据监控对象的具体特性合理设置,显示现有53%的监控信息采样率高于每小时1次,73%的监控信息采样率高于每天1次,体现了法眼平台的采样密集性;图4(h)反映了司法大数据平台数据聚合度,体现了其内部数据的关联程度,显现自2019年1月以来,信息聚合度一直高于80%,表明信息的关联处理和应用处于良好水平;图4(i)反映了信息系统输出信息的遍及度可以由其访问量表征,显示自2020年2月以来,中国移动微法院这一服务社会公众的统一窗口的月度访问量稳步上升,至2021年12月已超过1亿次,充分表明了其便利大众的显著成效。

图4(j)反映了数据置信度是信息失真度的负向表达,显示自2018年1月以来,司法大数据平台司法统计数据的置信度一直高于97%,目前已长期稳定在99%以上,也就是其失真度低于1%,由此才为各种大数据分析和服务奠定了可信基础;图4(k)反映了用户满意度也是信息系统输出信息失配度的负向表达,显示自2020年1月以来,信息系统的用户满意度一直高于98%,充分表明智慧法院信息系统体系工程取得的显著成效。

《5、 小结》

5、 小结

尽管在过去的几十年里信息技术取得了迅速的进展,但由于缺乏用于描述信息的数学基础和用于评估信息系统的分析框架,仍然缺乏可以指导大规模信息系统体系设计、开发、应用和评估的信息系统动力学。本文提出了信息空间的框架、信息的模型和性质、信息综合度量体系、信息系统的度量功效和动力构型,构成了信息系统动力学的基础理论体系。本文提出的信息系统动力学的数学基础是集合论、测度论、关系代数和拓扑学。虽然较为抽象,但与人们广泛使用的统计、计算方法之间具有直接明了的对应关系。同时,基于本文研究形成的信息动力学基础,还可以从信息度量与各种信息技术经典原理的符合性、信息度量功效之间的相互作用关系、信息系统动力构型的细化分解等方面进行补充和丰富。

任何一种理论都只有在实践中才能体现其价值并不断得到完善,信息系统动力学的完备性和实用性也将在后续大量应用中得到检验和修正。本文提出的信息系统动力学理论和方法在中国智慧法院信息系统体系工程实践中得到应用和验证。关键效能指标的实证分析表明,本文所提出的信息系统动力学理论方式是帮助我们持续提高中国智能法院信息系统体系运行质量和效率的关键。同时本文所提出的信息系统动力学理论方法也适用于其他目前正引发相当大关注的大规模信息系统体系(如电子政府和智能城市)的分析、设计、开发和评估。