基于非线性数据变换的离群点检测算法

徐雪松,张谞,宋东明,张宏,刘凤玉

中国工程科学 ›› 2008, Vol. 10 ›› Issue (9) : 74 -78.

PDF (728KB)
中国工程科学 ›› 2008, Vol. 10 ›› Issue (9) : 74 -78.

基于非线性数据变换的离群点检测算法

作者信息 +

Outliers detection algorithm based on nonlinear data transformation

Author information +
文章历史 +
PDF (745K)

摘要

为了提高高维数据集合离群数据挖掘效率,在分析了传统的离群数据挖掘算法优点和缺点的基础上,提出了一种离群点检测算法,首先将非线性问题转化为高维特征空间中的线性问题,然后利用非线性数据变换进行维数约减,对所得数据对象每个投影分量逐个判断数据点是否是离群点,通过实验证明该算法不仅可用于线性可分数据集的离群点检测,而且可用于线性不可分数据集的离群点检测,表明了算法的优越性。

Abstract

The data dimension reduction is the main method that can enhance the outliers mining efficiency based on higher-dimension data set. A novel outlier detection algorithm is proposed after analyzing the advantages and disadvantages of the classical outlier mining algorithm in the paper.In this paper, we can transform nonlinear large-scale data into linear data in the feature space,and introduce a nonlinear data transformation to reduce data dimension. On the basis of each resulting vector,it determins whether the data is outlier data or not one by one. This paper shows that the algorithm is not only used to detect linear separable outlier data,but also used to detect nonlinear inseparable outlier data. This indicate that the algorithm has its obvious superiority.

关键词

维数消减 / 核函数 / 主成分 / 离群数据

Key words

dimension reduction / kernel function / principal component / outliers

Author summay

徐雪松(1975-),男,江苏南京市人,南京理工大学博士生,主要研究方向为离群数据发现技术、信息安全

引用本文

引用格式 ▾
徐雪松,张谞,宋东明,张宏,刘凤玉 基于非线性数据变换的离群点检测算法[J]. 中国工程科学, 2008, 10(9): 74-78 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (728KB)

27

访问

0

被引

详细

导航
相关文章

AI思维导图

/