您现在正在浏览:首页 > 职教文章 > 职教论文 > 特征向量的归一化比较性研究

特征向量的归一化比较性研究

日期: 2011-6-1 15:56:50 浏览: 0 来源: 学海网收集整理 作者: 佚名

摘要:特征提取和分类器的参数优化是提高分类准确率的主要途径,对公用数据库UCI 的相关数据进行特征向量的归一化处理,采用KNN、PNN 和SVM 进行分类。讨论了特征归一化对分类准确率和分类器参数的影响。实验结果表明:归一化能有效提高分类器的分类准确率,SVM 尤为明显,且参数的寻优范围缩小,缩短训练周期。
   关键词:归一化;特征向量;参数优化;支持向量机
  
   1 前言
   归一化处理在模式识别中应用十分广泛,其用途主要分为两类:一类是归一化作为特征提取前的预处理技术;另一类是归一化对特征提取后的特征向量进行特征变换。归一化作为数据预处理技术常用于特征的产生和提取,如人脸识别、虹膜识别、车牌识别和手写字体识别等,其主要作用为统一识别对象的大小和尺寸[1-2]。由于归一化预处理的好坏直接影响特征生成和提取的效果,所以归一化预处理技术始终是研究者讨论的热点。从广义上讲,特征向量的特征归一化是一种特征变换。由于识别对象的不同,其特征向量的特征分量在数量级上有较大的差别。在代价函数中,大值特征分量比小值特征分量的影响更大,但并不能反映大值特征分量更重要,所以需要对特征进行数量级统一,即特征归一化。由于未采用特征归一化的特征向量能得到较为满意的结果,所以特征归一化往往容易被忽视,讨论特征归一化对识别率影响的研究相对较少。但从提高识别率的角度看,特征归一化是值得讨论的。归一化后的特征向量在特征空间中的分布将发生相应的改变,一方面,不同的分类器对该变化都有不同的响应,即分类器的识别准确率发生不同程度的变化,另一方面,相关分类器的参数优化范围也发生改
   变,这也将影响寻优时间。
   .......

返回顶部