《1 引言》

1 引言

粗糙集理论 [1,2] (RST, rough set theory) 是一种处理含糊和不精确性问题的新型数学工具。Pawlak提出的RST所处理的对象为信息系统 [2] (IS, information system) , 然而按照Zadeh的观点:现实世界中绝大部分知识不是精确的, 而是模糊的, 因此在IS中有可能存在模糊知识 (如气象观测信息系统) , 所以对于模糊信息系统 [3] (FIS, fuzzy information system) 的研究是必要的。再者, 由于数据测量的误差、对数据理解或获取的限制等原因, FIS中也可能存在数据遗漏等不完备 [4,5,6]、不确定的情况, 因此有必要将模糊等价关系 [7] 弱化为其他类型的二元模糊关系, 以对论域中的对象进行合理分类。文献[8]已对不完备模糊信息系统 (IFIS, incomplete fuzzy information system) 进行了初步的探讨, 主要研究了其中的知识获取方法。

首先, 将传统RST中的不可分辨关系 (等价关系) 推广为其他较弱的二元关系 (如容差关系 [4]、相似关系 [5]等) , 论域覆盖 [9]中的元素是清晰的;而在IFIS中, 模糊关系所产生的模糊信息粒是一个模糊类。其次, 对于IS中的不确定性度量 [10,11] 问题往往从知识和集合的不确定性两方面来考虑, 所以笔者在IFIS中分别建立了2种新的模糊粗糙熵来度量上述概念。最后, 已有学者对模糊关系数据库系统中的模糊函数依赖 [12,13,14] 及其公理化问题进行了研究, 笔者主要讨论IFIS中的部分模糊知识依赖问题, 定义了一种新的度量方法来研究部分模糊知识依赖的强度, 并进行了相关性质的证明。

《2 不完备模糊信息系统》

2 不完备模糊信息系统

一个FIS为二元组S =〈U, AT〉, 其中U是一个非空有限对象集合, 称为论域, U上的模糊子集族记为F (U) , AT为模糊属性集合。对于∀aAT, 有a:UVa, Va表示模糊属性a的值域;对于∀xU, a (x) 表示x在模糊属性a上的取值, 即为Va的一模糊子集;对于∀vVa, a (x) (v) [8]表示x在模糊属性a上取值为v的可能性程度且a (x) (v) ∈[0, 1]。

定义1 对于一个模糊信息系统S=〈U, AT〉, 当且仅当至少存在一个不确定值d使得a (x) (v) =d, 其中aATxU, 称为不完备模糊信息系统 (IFIS) 。

由于模糊信息系统中出现了数据不完备的情况, 因此模糊等价关系 [7] 将不再适用于论域中对象的分类, 取而代之的可能是其他模糊关系或仅满足自反性的一般二元模糊关系。

给定一个IFIS, 对常用的逻辑连接词采用如下的函数表示, 这种函数表示的方法曾被Stefanowski用于定义量化容差关系 [5]

定义2 逻辑非 (否定) 函数:N:[0, 1]→[0, 1], 要求N (0) =1, N (1) =0。通常将逻辑非函数表示为N (x) =1-x

定义3 T-norm函数为一个连续非降函数T (x, y) :[0, 1]2→[0, 1], 要求T (x, 1) =xT-norm函数代表合取, 常用以下3种表示方式:

1) 最小值 T (x, y) =min (x, y) ;

2) 乘积 T (x, y) =xy;

3) Lukasiewicz T-norm T (x, y) =max (x+y-1, 0) 。

定义4 T-conorm函数为一个连续非降函数W (x, y) :[0, 1]2→[0, 1], 要求W (0, y) =yT-conorm函数代表析取, 常用以下3种表示方式:

1) 最大值 W (x, y) =max (x, y) ;

2) 乘积 W (x, y) =x+y-xy;

3) Lukasiewicz T-conorm W (x, y) =min (x+y, 1) 。

定义5 I (x, y) 是x蕴涵y的程度函数I (x, y) :[0, 1]2→[0, 1]。函数I (x, y) 需满足条件:

Ι(x,y)=W(Ν(x),y)xyΙ(x,y)=1

定义6 设IS为一IFIS, 对于∀aAT, 由a决定的一个二元模糊关系表示为Ra, 即对于∀x, yU, 有

Ra(x,y)=WvVa{Τ(a(x)(v),a(y)(v))}

其中a (x) (v) =da (x) (v) =1。a (x) (v) =da (x) (v) =1表示x在模糊属性a上确实有可能取值为v, 只是由于某些原因目前无法确定这种可能性有多大, 所以假设这种可能性程度为1。关系Ra (x, y) 表示对象xy在模糊属性a上取值的相似程度。对于∀x, yU, 有Ra (x, y) ∈[0, 1]。容易验证Ra满足自反性和对称性, 但并不一定满足传递性, 因此称Ra为一个模糊相容关系。同时, 选择不同的逻辑表示函数可以定义满足不同语义需求的模糊相容关系。

定理1 设IS为一IFIS, 其中AAT, 对于∀x, yU, 有RA (x, y) =TaAT{Ra (x, y) }。

定理2 设IS为一IFIS, 对于∀x, yU, 如果BAAT, 那么就有RB (x, y) ≥RA (x, y) 。

定义7 设IS为一IFIS, 若AAT, 则由模糊属性A决定的模糊相容矩阵表示为MA=[rij], 其中rij=RA (xi, xj) , (xi, xjU) 。

由于模糊相容关系具有自反性和对称性, 因此模糊相容矩阵是一个对角线上元素都为1的对称矩阵, 即在矩阵的计算过程中, 只需计算矩阵的上三角或下三角即可。

对于模糊粗糙 [3,15] 模型的建立有很多不同的方法。根据新建立的模糊相容关系, 分别定义IFIS中模糊粗糙上、下近集的似隶属度函数如下所示。

定义8 令IS为一IFIS, 其中AAT, 对于∀FF (U) , F的下近似和上近似隶属度函数分别定义为

μRA¯(F)(x)=ΤyU(Ι(RA(x,y),μF(y)))μRA¯(F)(x)=WyU(Τ(RA(x,y),μF(y)))

RA¯(F),RA¯(F)F的一对模糊粗糙集合。

定义8中的模糊粗糙集合是基于模糊相容关系的, 当然也可以将这种定义方法推广到其他的二元模糊关系中。此外, 亦可以将模糊粗糙集与概率相结合, 定义概率模糊近似空间中的模糊粗糙集模型。

《3 模糊覆盖》

3 模糊覆盖

定义9 设IS为一IFIS, 对于∀xU, 如果AAT, 那么x基于模糊相容关系RA的模糊类记为δRA (x) 且δRA(x)=yURA(x,y)/y

对于∀xU, 有RA (x, x) =1, 因此δRA (x) 是一个自反模糊信息粒。很明显, 在IFIS中, 所有的δRA (x) 构成了论域上的一个覆盖, 即对于∀xU, 有

δRA(x)xUδRA(x)=U

因此将其称为模糊覆盖。若用U/RA表示U上基于模糊相容关系RA的模糊覆盖, 则

U/RA={δRA(x):xU}

U/RA={{x}} (xU) 时, 表示对于∀x, yUxy, 有RA (x, y) =0, 即论域中的所有元素在现有模糊知识A下都可以被完全分开, 所以形成最细粒度的覆盖。

U/RA={U}时, 表示对于∀x, yU, 有RA (x, y) =1, 即论域中的所有元素在现有模糊知识A下都不可分开, 所以形成最粗粒度的覆盖。

不同的模糊覆盖具有不同的粒度层次, 并非细粒度覆盖好于粗粒度覆盖, 反之亦然。在实际问题求解的过程中, 应根据不同的需要建立不同粒度层次的模糊覆盖。

定义10 给定一IFIS, ψ1, ψ2分别表示论域U上的2种不同模糊覆盖, 若对于∀φ1ψ1, 必定∃φ2ψ2使得φ1φ2, 并且对于∀φ2ψ2, 必定∃φ1ψ1使得φ2φ1, 则称模糊覆盖ψ1ψ2更为精细, 或者说ψ2ψ1更为粗糙, 表示为ψ1ψ2ψ2ψ1

定理3 设IS为一IFIS, 如果BAAT, 那么U/RAU/RB

证明 由定理2, 因为BAAT, 所以RA (x, y) ≤RB (x, y) , 其中x, yU。再由定义9可得到δRA (x) ⊆δRB (x) 。又因为x为论域中任意取得, 所以上述结果满足定义10中所需条件, 即U/RAU/RB成立。

推论1 设IS为一IFIS, 如果BAAT, 则对于∀MU/RA, 必定∃NU/RB使得MN, 反之亦然。

定义11 设IS为一IFIS, 若A, BAT, 则U/RA, U/RB表示论域U上的2个模糊覆盖, 可分别定义运算如下:

(U/RA)={Ν(δRA(x)):xU}U/RAU/RB={Τ(δRA(x),δRB(x)):xU}U/RAU/RB={W(δRA(x),δRB(x)):xU}

其中Ν(δRA(x))=yUΝ(RA(x,y))/yΤ(δRA(x),δRB(x))=yUΤ(RA(x,y),RB(x,y))/yW(δRA(x),δRB(x))=yUW(RA(x,y),RB(x,y))/yyU

定义11中, ~表示取模糊覆盖中的每个元素的补集;⨂表示对任意2个处于不同模糊覆盖中的模糊集合的隶属度进行T-norm函数的操作;⊕表示对任意2个处于不同模糊覆盖中的模糊集合的隶属度进行T-conorm函数的操作。这3种运算形式达到了使得模糊覆盖在不同粒度层次上变换的目的, 运算结果都形成了新的模糊覆盖。

定理4 设IS为一IFIS, 其中A, B, CAT, 则模糊覆盖上的运算满足下列性质:

交换律 U/RAU/RB=U/RBU/RA,

U/RAU/RB=U/RBU/RA

结合律

(U/RAU/RB)U/RC=U/RA(U/RBU/RC)(U/RAU/RB)U/RC=U/RA(U/RBU/RC)

分配律

U/RA(U/RBU/RC)=(U/RAU/RB)(U/RAU/RC),U/RA(U/RBU/RC)=(U/RAU/RB)(U/RAU/RC)

德摩根律

(U/RAU/RB)=(U/RA)(U/RB)(U/RAU/RB)=(U/RA)(U/RB)

双重否定律 ~ (~ (U/RA) ) =U/RA

定理5 令IS为一IFIS。如果A, BAT, 那么就有

U/RAU/RBU/RAU/RAU/RBU/RBU/RAU/RBU/RAU/RAU/RBU/RB

上述定理说明运算⨂减小了模糊覆盖的粒度层次, 而⊕却增大了模糊覆盖的粒度层次。

引理 设IS为一IFIS。如果a, bAT, 那么就有U/R{a, b}=U/RaU/Rb

证明 对于∀x, yU, 由定理1可得R{a, b} (x, y) =T (Ra (x, y) , Rb (x, y) ) 。根据定义9及定义11, 可推出

Τ(δRa(x),δRb(x))=yUΤ(Ra(x,y),Rb(x,y))/y=yUR{a,b}(x,y)/y=δR{a,b{(x)

其中xU。又因为x为论域中任意取得, 所以U/R{a, b}=U/RaU/Rb

定理6 设IS为一IFIS, 若AAT, 则

U/RA=U/Ra1U/Ra2U/Ram=i=1mU/Rai=aAU/Ra

其中aiA (1≤im) 。

定理7 设IS为一IFIS。如果A, BAT, 那么就有

U/RAB=U/RAU/RB

证明 由定理6可做以下形式的推导:

U/RAU/RB=(aAU/Ra)(bBU/Rb)=(aA-ABU/Ra)(aABU/Ra)(bB-ABU/Rb)(bABU/Rb)=U/RAB

《4 不确定性度量方法》

4 不确定性度量方法

《4.1模糊知识的不确定性》

4.1模糊知识的不确定性

在IFIS中, 模糊知识的不确定性可以由知识的模糊粗糙熵来表示, 并且模糊知识的不确定性表示了IFIS的稳定程度 [10]

定义12 设IS为一IFIS, 若AAT, 则模糊知识A的模糊粗糙熵记为E (A) 且

E(A)=-xU{(|δRA(x)|/|U|)lb(1/|δRA(x)|)}

其中|F|表示模糊集合F的基数, 即对于FF(U)|F|=xUμF(x)

U/RA={{x}} (xU) 时, E (A) 达到最小值0, 此时IFIS的不确定性最大;当U/RA={U}时, E (A) 达到最大值lb|U|, 即IFIS没有不确定性。

定理8 设IS为一IFIS, 若BAAT, 则E (A) ≤E (B) 。

推论2 设IS为一IFIS, 如果A, BAT, 那么

E(AB)min(E(A),E(B))E(AB)max(E(A),E(B))

由定理8可以看出, 模糊知识越丰富, 模糊粗糙熵就越小。

《4.2模糊集合的不确定性》

4.2模糊集合的不确定性

在Pawlak提出的RST中, 集合的不确定性是由粗糙度来表示的。在IFIS中, 对于∀FF (U) , 若RA¯(F)=F=RA¯(F), 则称模糊集F是基于RA粗糙可定义的, 否则是不可定义的, 因此模糊集合的不确定性亦可用粗糙度来度量。

定义13 设IS为一IFIS, AAT, 对于∀FF (U) , F的模糊精确度αA (F) 和模糊粗糙度ρA (F) 分别定义为

αA(F)=|RA¯(F)|/|RA¯(F)|ρA(F)=1-αA(F)

定理9 设IS为一IFIS, 对于∀FF (U) , 如果BAAT, 那么

αA(F)αB(F),ρA(F)ρB(F)

证明 由定理2, 因为BAAT, 所以RB (x, y) ≥RA (x, y) 。对于∀xU, 因为W是一个连续非降函数且I (x, y) =W (N (x) , y) (N (x) =1-x) , 故必有

Ι(RA(x,y),μF(y))Ι(RB(x,y),μF(y))

其中yU。再由定义3可知T为一个连续非降函数, 所以μRA¯(F)(x)μRB¯(F)(x), 即RA¯(F)RB¯(F)。同理可以证得RA¯(F)RB¯(F)。综上所述, αA (F) ≥αB (F) , ρA (F) ≤ρB (F) 成立。

定理9说明了模糊集的模糊粗糙度随着模糊知识的增加而单调减少, 即模糊知识越充分, 模糊集合的不确定性越小。然而在有些情况下, 粗糙度并不能客观地度量集合的不确定性 [10], 因为一模糊集合有可能在不同的模糊知识表示下具有相同的模糊粗糙度, 引入一种新的模糊粗糙熵来对模糊集合的不确定性进行更为精确的度量。

定义14 设IS为一IFIS, 其中AAT, 对于∀FF (U) , F的模糊粗糙熵EA (F) 定义如下所示:

EA(F)=-xU{(|δRA(x)F|/|U|)lb(1/|δRA(x)F|)}

由定义14可以看出, 模糊集的模糊粗糙熵仅与对象的模糊信息粒有关, 而无需求得集合的粗糙度和知识的粗糙熵, 因而大大降低了计算量。

定理10 设IS为一IFIS, 对于∀FF (U) , 若BAAT, 则EA (F) ≤EB (F) 。

证明 对于∀xU, 类似于定理3的证明, 可得δRA (x) ⊆δRB (x) , 于是就有

-{(|δRA(x)F|/|U|)lb(1/|δRA(x)F)}-{(|(δRB(x)F|/|U|)lb(1/|δRB(x)F|)}

扩充这个不等式就可以得到EA (F) ≤EB (F) 。

推论3 设IS为一IFIS, 对于∀FF (U) , 如果A, BAT, 那么

EAB(F)min(EA(F),EB(F))EAB(F)max(EA(F),EB(F))

定理11 设IS为一IFIS, 如果AAT, 那么对于∀F, GF (U) 且FG, 有EA (F) ≤EB (G) 。

推论4 设IS为一IFIS, 如果AAT, 那么对于∀F, GF (U) , 有

EA(FG)max(EA(F),EA(G))EA(FG)min(EA(F),EA(G))

《5 模糊知识依赖》

5 模糊知识依赖

粗糙集理论中的知识依赖概念, 实质上表示的是一种高阶规则 [16]。在IFIS中, 由于存在的是模糊知识, 因此, 研究模糊知识之间的部分依赖关系, 可为挖掘IFIS中的高阶规则进行模糊知识推理建立一定的理论基础。为简便起见, 使用如下方式来定义IFIS中的模糊知识依赖。模糊知识依赖的相关性质可以参考文献[12,14]中的模糊函数依赖公理。

定义15 令IS为一IFIS, A, BAT, 模糊知识之间的依赖关系可表示为AB当且仅当对于∀x, yU, 有RA (x, y) ≤RB (x, y) 。

定义16 令IS为一IFIS, A, BAT, 模糊知识之间的等价依赖关系可表示为AB当且仅当对于∀x, yU, 有RA (x, y) ≤RB (x, y) 且RA (x, y) ≥RB (x, y) , 即RA (x, y) =RB (x, y) 。

知识的部分依赖性表明知识推导也可以是部分的, 即有部分知识B是可由A推导的。在经典RST中, 知识的部分可导性可用知识的正域 [1,2] 来表示, 然而在IFIS中, 使用满足模糊知识依赖的对象组的数量相比, 对于模糊知识的正域来说具有更为直观的意义。

定义17 令IS为一IFIS, A, BAT, 模糊知识B以程度k依赖于模糊知识A, 表示为AB (k) , 其中k=|{{x, y}: RA (x, y) ≤RB (x, y) }|/|U|2 (x, yU) 。

定理12 令IS为一IFIS, 若BAAT, 则AB

定理13 令IS为一IFIS, A, B, CAT, 若AC (k1) 且ABC (k2) , 则k1k2

证明 令Γ={{x, y}: RA (x, y) ≤RC (x, y) }且Δ={{x, y}: RA∪B (x, y) ≤RC (x, y) }。由定理1可知RA (x, y) ≥RA∪B (x, y) , 所以ΓΔ, 即k1k2

定理14 令IS为一IFIS, A, B, CAT, 若AC (k1) 且ABC (k2) , 则k1k2

证明 令Γ={{x, y}: RA (x, y) ≤RC (x, y) }且Δ={{x, y}: RA (x, y) ≤RB∪C (x, y) }。由定理1可知RC (x, y) ≥RB∪C (x, y) , 所以ΓΔ, 即k1k2

定理13和定理14说明, 当部分模糊知识依赖的前提和结论发生变化时, 模糊知识依赖的强度也会发生相应的变化, 此可用以研究模糊知识动态变化情况下的部分模糊知识依赖。

定理15 令IS为一IFIS, A, B, CAT, 若AB, BC (k1) , 则有AC (k2) 且k1k2

证明 因为AB, 所以对于∀x, yU, 有RA (x, y) ≤RB (x, y) 。若令Γ={{x, y}: RB (x, y) ≤RC (x, y) }, 则必定∃x, yU使得RA (x, y) ≤RC (x, y) , 所以AC (k2) 成立。令Δ={{x, y}: RA (x, y) ≤RC (x, y) }, 则有可能存在{x, y}使得{x, y}∈Δ且{x, y}∉Γ, 所以ΓΔ, 即k1k2

定理16 令IS为一IFIS, AB, CAT, 若有BC (k1) , 则有AC (k2) 且k1k2

证明 令Γ={{x, y}: RΒ (x, y) ≤Rc (x, y) }, 因为ΑB, 所以对于∀x, yU, 有RA (x, y) ≥RB (x, y) 。换言之, 可能存在{x, y}∈Γ使得RA (x, y) ≤RC (x, y) , 即AC (k2) 成立。若令Δ={{x, y}:RA (x, y) ≤RC (x, y) }, 则有ΓΔ, , 即k1k2

定理15和定理16讨论了知识部分依赖的度量在知识传递过程中的变化。

《6 实例分析》

6 实例分析

表1是一个气象模糊信息系统, 共有6个对象oi (1≤i≤6) , 分别代表6个不同的日期;模糊属性集合AT={Outlook, Temperature, Humidity}, 记a={Outlook}, b={Temperature}, c={Humidity};Va={Sunny, Overcast, Rain};Vb={Hot, Mild, Cool};Vc={High, Normal}。由于表1中有不确定值d存在, 因此这是一个不完备模糊信息系统。用定义6中的模糊相容关系进行对象分类, 为简便起见, T-norm函数取最小值表示方式, T-conorm取最大值表示方式。

表1 不完备模糊信息系统

Table 1 Incomplete fuzzy information system

 

《表1》

 
Outlook
Temperature Humidity

Su
Ov Ra Ho Mi Co Hi No

o1
0.9 0.1 0.0 0.9 0.1 0.0 0.8 0.2

o2
0.1 d 0.2 d 0.1 0.1 0.9 d

o3
0.9 0.1 d 0.8 d 0.1 0.9 0.2

o4
0.0 1.0 0.0 0.0 0.1 d d 0.9

o5
0.8 0.2 0.0 0.0 0.4 0.6 0.0 1.0

o6
0.0 0.1 0.9 0.0 0.2 0.9 0.1 0.9

 

 

δRa(o1)=1/o1+0.1/o2+0.9/o3+0.1/o4+0.8/o5+0.1/o6δRa(o2)=0.1/o1+1/o2+0.2/o3+1/o4+0.2/o5+0.2/o6δRa(o3)=0.9/o1+0.2/o2+1/o3+0.1/o4+0.8/o5+0.9/o6δRa(o4)=0.1/o1+1/o2+0.1/o3+1/o4+0.2/o5+0.1/o6δRa(o5)=0.8/o1+0.2/o2+0.8/o3+0.2/o4+1/o5+0.1/o6δRa(o6)=0.1/o1+0.2/o2+0.9/o3+0.1/o4+0.1/o5+1/o6

这6个模糊信息粒组成了模糊覆盖U/Ra

δRb(o1)=1/o1+0.9/o2+0.8/o3+0.1/o4+0.1/o5+0.1/o6δRb(o2)=0.9/o1+1/o2+0.8/o3+0.1/o4+0.1/o5+0.1/o6δRb(o3)=0.8/o1+0.8/o2+1/o3+0.1/o4+0.4/o5+0.2/o6δRb(o4)=0.1/o1+0.1/o2+0.1/o3+1/o4+0.6/o5+0.9/o6δRb(o5)=0.1/o1+0.1/o2+0.4/o3+0.6/o4+1/o5+0.6/o6δRb(o6)=0.1/o1+0.1/o2+0.2/o3+0.9/o4+0.6/o5+1/o6

这6个模糊信息粒组成了模糊覆盖U/Rb

根据上述计算结果, 再由定理7可求得由模糊知识A={Outlook, Temperature}所产生的模糊覆盖如下:

δRA(o1)=1/o1+0.1/o2+0.8/o3+0.1/o4+0.1/o5+0.1/o6δRA(o2)=0.1/o1+1/o2+0.2/o3+0.1/o4+0.1/o5+0.1/o6δRA(o3)=0.8/o1+0.2/o2+1/o3+0.1/o4+0.4/o5+0.2/o6δRA(o4)=0.1/o1+0.1/o2+0.1/o3+1/o4+0.2/o5+0.1/o6δRA(o5)=0.1/o1+0.1/o2+0.4/o3+0.2/o4+1/o5+0.1/o6δRA(o6)=0.1/o1+0.1/o2+0.2/o3+0.1/o4+0.1/o5+1/o6

从这一分析可以看出, 已知由部分模糊属性所形成的模糊覆盖, 可以求得由全部模糊属性所形成的模糊覆盖。作为模糊覆盖的一种合成方法, 运算⨂揭示了IFIS中不同层次的粒度结构之间的关系, 并且这种不同层次的粒度结构是由所拥有的不同知识决定的。

由定义12求模糊知识AT的模糊粗糙熵E (AT) , 例中E (AT) =2.256。若有模糊集合F=0.6/o1+0.3/o4+0.7/o6, 则由定义14可求得F在模糊知识AT下的模糊粗糙熵EAT (F) =-0.347。

进行部分模糊知识依赖的计算, 可得到:

ab (0.61) , {a, b}→c (0.94) , 满足定理13;

ac (0.72) , a→{b, c} (0.61) , 满足定理14;同理亦可以验证定理16的正确性。

《7 结语》

7 结语

IFIS是一种既具有模糊知识又具有不确定性信息的特殊信息系统。笔者在IFIS中对RST的一些基本概念给出了新的定义。在此基础上, 用一些新方法对IFIS中的模糊覆盖、不确定性度量及部分模糊知识依赖进行了研究, 取得了一些重要结论。下一步的工作是利用所建立的模糊相容关系在IFIS中设计相关的知识约简算法以获取模糊规则, 进行决策分析。