基于复杂类型数据的发现特征子空间模型(DFSSM)的研究
北京科技大学信息工程学院,北京 100083
下一篇 上一篇
摘要
探讨围绕知识发现领域中较为宏观、较为重大的问题。首先,根据复杂类型数据(包括Web数据、多媒体数据、空间数据、时间序列数据等)所具有的非线性动力学性质和特征,采用模式(定义为Hilbert空间中的矢量)来定量地表征复杂类型数据的多变性及具有的不确定状态和行为,并用模式的变化来刻画其整体知识发现过程的发展和演变规律;其次,以知识发现系统内在机理的研究为基础,构造了复杂类型数据知识发现系统的总体结构模型——发现特征子空间模型DFSSM;最后,用基于Web的文本挖掘系统和基于图像信息(气象云图)的知识发现系统作为实例进行了验证,结果表明DFSSM方法对于非结构化的文本数据及图像数据类型的知识发现过程具有指导性作用。因此,该结构模型具有较好的实用性与普适性,有望拓展到其他复杂类型数据的知识发现过程中。
参考文献
[ 1 ] 杨炳儒, 王建新, KDD中双库协同机制的研究 (I) [J].中国工程科学, 2002, 4 (4) :26~32 链接1
[ 2 ] 杨炳儒, 王建新, KDD中双库协同机制的研究 (Ⅱ) [J].中国工程科学, 2002, 4 (5) :34~43 链接1
[ 3 ] PiatetskyShapiroG , FrawleyWJ.Knowledgediscoveryindatabases[M ].AAAI/MITPress, 1991, 166~175
[ 4 ] FayyadUM , PiatetskyShapiroG , SmythP , etal.Advancesinknowledgediscoveryanddatamining[M].AAAI/MITPress, 1996.20~32
[ 5 ] PiatetskyShapiroG , FayyadU , SmithP .Fromdataminingtoknowledgediscovery:anoverview[A].InFayyadUM , etal.AdvancesinKnowledgeDiscoveryandDataMining[C].AAAI/MITPress, 1996.1~35
[ 6 ] YangBingru.KD (D&K) anddouble basescooperatingmechanism[J].JournalofSystemEngineeringandElectronics, 1999, 10 (1) :12~18
[ 7 ] 张德政.基于相似模式知识发现方法的研究与应用[D].北京:北京科技大学, 2002
[ 8 ] 唐 菁, 杨炳儒.基于Web的文本挖掘[J].计算机工程与应用, 2002, 36 (20) :32~38 链接1