《1 引言》

1 引言

专家系统是一个能以人类专家水平完成专门任务的智能计算机系统, 它模仿人类专家如何应用其知识与经验来解决所要解决的问题。因此, 专家系统的建造是一个知识工程的建造[1,2,3]。专家系统应具有四个基本特征:

1) 启发性 人类专家在科学实验和生产实验中积累起来的知识, 很多是经验性知识, 往往是某一现象或某一结果多次出现使其成为一条值得注意的经验, 这就是启发性知识。人类专家知识为主要组成部分的专家系统, 不仅能使用严格的逻辑性知识, 而且也要能使用启发性知识。

2) 透明性 专家系统必须能释化其推理过程, 并且对有关知识的询问作出回答, 即回答用户为什么和怎样做, 以此增加用户的信任程度, 有助于知识检查和更新。

3) 灵活性 人类的知识在不断更新, 特别是经验知识。一个专家系统在运行中如果发现问题, 应该很容易地修改和加入新的知识对象。因此, 专家系统必须具有灵活性。

4) 智能性 专家系统是人工智能的一个分支, 它必须具有智能性。就是要有相对独立的解决问题的能力, 成为独立的对象。

专家系统第一个重要组成部分是知识库, 要存储从专家那里得到的关于某个领域的专门知识和解决某个问题的专门数据。为了建造知识库, 需要解决如何储存知识和获取知识的问题。专家系统的第二个重要组成部分是推理机能, 专家系统的很多能力来自平时所储存的大量专家知识和恰当地应用有效的推理技术, 它除了具有依据一定策略进行推理的能力, 即能够根据提供的知识归纳、学习和推理规则, 而不是简单地去搜索现成的答案外, 还包括和使用者进行对话的能力及解释的能力。

近年来, 波兰华沙理工大学Z.Pawlak教授等一批科学家提出了用粗集理论研究不完整数据、不精确知识的表达、学习、归纳等方法[4,5,6]。这套方法以对观察和测量所得数据进行分类的能力为基础, 从中发现、推理知识和分辨系统的某些特点、过程、对象等。粗集理论不仅为信息科学和认知科学提供了新的科学逻辑和研究方法, 而且为智能信息处理提供了有效的知识表达和处理技术。因此, 基于粗集理论的数据知识表达和推理方法, 为智能专家系统奠定了重要的基础, 建立一个基于粗集理论的智能专家系统已成为智能信息处理中的重要研究任务。

《2 基于粗集方法的智能专家系统结构》

2 基于粗集方法的智能专家系统结构

基于粗集理论的智能专家系统见图1。其中包括:知识获取子系统, 知识数据库, 推理、学习子系统, 信息处理子系统, 解释、输出结果子系统。知识获取子系统, 知识数据库, 推理、学习子系统, 构成智能专家系统的学习系统;知识获取子系统, 知识数据库, 信息处理子系统, 解释、输出结果子系统构成智能专家系统的应用系统。

《图1》

图1 一个基于粗集方法的智能专家系统
Fig.1 An intelligent expert system on rough sets

图1 一个基于粗集方法的智能专家系统 Fig.1 An intelligent expert system on rough sets  

知识获取子系统和知识数据库是智能专家系统信息处理的公用系统, 它和其他智能数据处理系统一样。该系统的功能主要是获取系统处理需要的知识数据、领域专家与知识工程师的经验知识, 采集系统数据, 并对定性和定量数据进行归一化处理, 然后根据要处理的问题建立知识数据库, 该子系统还要负责管理和修改、删改和添加知识库中的知识, 维持知识库的一般性、完整性。知识数据库存储数据包括采集的原始数据、归一化处理数据、系统简化知识表达数据 (即系统特征表达数据) 、专家经验知识及系统处理规则。

基于粗集理论的智能专家系统的新颖之处主要在于, 以对观察和测量所得数据进行分类的能力为基础, 通过对不完整数据、不精确知识进行一种简化表达, 并从数据中学习、归纳系统的某些特点, 从中发现知识、推理系统的规则。下面主要介绍基于粗集理论的智能专家系统的知识表达方式及学习推理方法。

《3 基于粗集理论的知识表达方式及学习推理方法》

3 基于粗集理论的知识表达方式及学习推理方法

基于粗集理论的观点, 可以将要进行处理的系统数据表达为一个知识系统, 知识表达系统的基本成分是研究对象的集合。关于这些对象的知识通常是通过指定对象的属性和它们的属性值来描述的。

假设给定知识库K= (U, R) 表达存储一组数据, 其中U代表研究的论域, R代表研究的论域中存在一个等价关系, R在知识库中可以是属性集, 也可以是系统规则集。若论域中存在子集XU, 根据关系R定义的基本集合 (Yi, i=1, ..., n) 的描述来划分集合X, 为了准确地说明某些YiX中对象的隶属度情况, 这里考虑两个子集:

R-X=∪{YiU|R:YiX} (3.1)

R-X=∪{YiU|R:YiX≠>} (3.2)

分别称为XR下近似和R上近似。

可见, R-X是根据知识R, U中所有一定能归入XYi的元素的集合, R-X是根据知识R, U中可能归入XYi的元素的集合。

下面, 利用上述粗集概念, 根据某些学生高考数、理、化成绩与升学的情况调查, 分析高考数、理、化成绩与升学的关系。

下面是某些学生高考数、理、化成绩与升学的情况调查:

研究对象高考数理化成绩升学情况 张 中未上大学 王 良上大学 李 优上大学 赵 差未上大学 刘 优上大学 黄 中上大学

令研究对象U={张, 王, 李, 赵, 刘, 黄}, 定义高考数、理、化成绩情况R={中, 良, 优, 差}={Y1, Y2, Y3, Y4}, 则Y1={张, 黄}, Y2={王}, Y3={李, 刘}, Y4={赵}。

定义升学的情况X={上大学, 未上大学}={X1, X2}, 则X1={王, 李, 刘, 黄}, X2={张, 赵}。

R-X1=Y2Y3={王, 李, 刘};RˉX1=Y2Y3Y1={王, 李, 刘, 黄, 张}

R-X2=Y4={赵};RˉX2=Y4Y1={黄, 张, 赵}。

根据上述分析和粗集定义的下近似、上近似概念, 得到高考数、理、化成绩与升学的关系如下:

根据R-X1:If高考数、理、化成绩 (优良) , then一定 (能上大学) 。

根据R-X1:If高考数、理、化成绩 (优良) or (中等) , then可能 (上大学) 。

根据R-X2:If高考数、理、化成绩 (差) , then一定 (未能上大学) 。

根据R-X2:If高考数、理、化成绩 (差) or (中等) , then可能 (未能上大学) 。

利用粗集方法定义的关系R的集合描述X中对象的隶属度情况还可表达为

αR(X)=(|U|-|R¯(X)-R-(X)|)/|U|(3.3)

这里||代表集合中元素的数目, 即集合的基数card ( ) , αR (X) 可以作为机器学习的学习质量判别指标。

建造专家系统的常用推理策略, 有数据驱动的从开始状态出发的正面推理、目标驱动的从目标状态出发的逆向推理和混合式的双面推理。要使推理能有效地进行下去, 一定的推理策略是必不可少的。

根据粗集理论中知识与分类的联系观点, 基于粗集理论方法的智能专家系统采用有导师学习推理策略。在机器学习中, 静态的有导师学习是一种从例子中学习。导师、专家具有某一论域U的知识, 能够对论域的元素进行分类。导师所划分的类别是学习者、智能网络学习的概念, 学习者的任务是学习导师的知识。静态有导师学习就是从决策表导出决策算法, 在决策表中条件属性就是学习者的属性, 决策属性就是导师的属性。动态推理学习就是进行知识推广。

假定论域U是闭合的, 导师对于该论域的知识是完备的, 即导师能对论域中的每一对象进行分类, 且学习者能区分论域中各分类对象的某些属性。

给定一个知识表达系统U和一个对象的子集YX。通过研究导师的知识 (决策属性C) 与学习者的知识 (条件属性R) 之间的依赖程度, 不仅可以了解条件属性在分类中的重要性, 而且还可以得出机器学习的学习质量。因此, 学习过程如下:可以通过计算判别指标αR (X) , 利用判别指标作为选择属性的准则, 可以选择C中适当的属性子集去构成对于某一类Y的决策规则。对于知识表达系统中包含的每一概念, 导师一步一步向学习者提供论域中每一对象及概念代表的信息, 学习者根据概念的全部例子, 找出每一概念的有用特征, 这是一个知识简化和系统简化的过程, 可以反复应用相同的过程去导出决策规则。这是基于粗集理论方法的智能专家系统的一种推理方法。

基于粗集理论方法的智能专家系统的另一种推理方法是, 在保持知识库中初等范畴的情况下, 根据不可分辨性, 利用简化和核的概念, 并根据算法相容性, 先进行条件属性简化, 再消去冗余基本范畴, 最后导出决策规则。

所谓知识的不可分辨性, 就是指研究的对象在某种定义下的不可分辨关系。

R为一等价关系族, 当用R描述U中对象之间的等价关系时, 可用U/R表示, 对于子集X, YU, 若根据关系R, XY由属性R不可分辨时, 用[X]R表示。不可分辨关系是物种由属性集P表达时, 在论域U中的等价关系。

若存在某一子集PR, 且P≠>, 则称为P上的不可分辨关系, 记为ind (P) 。例如, 属性集PR, 对象XYU, 对于每个aP, 当且仅当f (X, a) =f (Y, a) 时, XY是不可分辨的, 即:ind (P) ={ (X, Y) ⊆U:所有的aP, f (X, a) =f (Y, a) }。

对于某一子集PR, 且P≠>, 则P中全部等价关系的交集也是一种等价关系:

[X]ind(Ρ)=[X]R(3.4)ΡR

要进行知识的简化, 首先是条件属性的简化。需要从原始数据中, 根据不可分辨性, 去掉某一些属性, 来考察没有该属性和分类会怎样变化。也就是说, 如果去掉某些基本属性不影响分类, 则这些基本属性就是不重要的属性, 可以去掉它;如果去掉某些基本属性将严重影响分类, 则这些基本属性就是系统的有用属性。

对于属性集R, 若某一属性rR, 当存在不可分辨关系ind (R) =ind (R-{r}) 时, 则属性r为属性集R中可省略的, 否则rR中不可省略的。R中所有不可省略关系的集合是R的所有简化族red (R) 。R的所有简化族的交称为R的核, 记作core (R) 。即

core(R)=red(R)(3.5)

这里red (R) 是R的所有简化族。

根据数据的协调关系[7], 在保持知识库中初等范畴的情况下, 根据算法相容性, 考察数据块, 再消去冗余数据块和某些基本范畴。

通过条件属性的简化和消去冗余基本范畴后, 由这些有用属性和基本范畴表达的系统就是一种简化的知识表达系统, 化简后的知识表达系统具有与化简前的知识表达系统相同的功能, 化简后的知识表达系统所描述的条件属性和决策属性之间的关系就是决策规则。因此, 这种智能专家系统的推理方法的步骤如下:

1) 首先把智能数据进行归一化处理, 然后将数据用知识表达属性表的表格来实现[3]

2) 去掉重复信息, 即消去知识表达属性表的重复的行。

3) 利用不可分辨性, 计算每一规则的核, 进行条件属性的简化, 即从知识表达属性值表中消去某些列。

4) 对于消去冗余的属性值后, 得到的全部有用属性或特征, 再针对每一决策规则, 同样利用数据协调性消去冗余基本范畴, 得到系统的简化属性核值表。

5) 根据简化后的属性核值表, 选择不同的组合规则方式, 得到对应的最小决策算法及简化规则。

上述两种基于粗集理论的智能专家系统的一种推理方法虽然不同, 一个是通过研究导师的知识 (决策属性C) 与学习者的知识 (条件属性R) 之间的依赖程度, 研究其属性的重要性, 去掉不重要的属性, 保留重要的属性, 进行知识简化和规则推理。另一个是根据不可分辨性和数据协调性关系[7], 去掉某一些冗余知识, 保留系统的有用属性, 进行知识简化和规则推理。但两种方法的简化、推理的本质思想是一样的。其推理的决策规则可能是确定性的, 也可能是非确定性的。

X={x1, x2, …, xm}和Y={y1, y2, …, yn}分别表示U上的对象集合的学习者分类和导师分类, 对于每一导师分类yi的决策规则的集合{rij}可表示为:

{rij:Des(xi)}Des(yj)|xiyj>xiX,yjY}(3.6)

这里Des (xi) 和Des (yj) 分别代表学习者分类xi和导师分类yj的唯一描述。

xiyj=xi时, 决策规则rij是确定性的;当xiyjxi时, 决策规则rij是非确定性的。

《4 结束语》

4 结束语

开发一个成功的专家系统要经历准备、研究问题、建立模型系统、改进和扩充系统, 测试与评价、商品化等几个阶段。但其中最重要的两个组成部分是知识表达和推理学习。基于粗集理论方法的智能专家系统具有全新的知识表达方式, 并充分利用了粗集理论处理不完整数据、不精确知识的表达、学习、归纳等方法的特点, 这不仅更符合现实生活的情况, 而且更有利于信息的机器处理。基于粗集理论方法的智能专家系统具有全新的规则推理方法, 以从数据中推理出的科学逻辑为依据, 对问题进行科学的处理和解释, 这两点为智能专家系统处理智能信息开拓了一条新路。