基于L-GEM的特征选择方法(2008)

 原文链接

1.简介

机器学习中常用的特征选择方法有过滤式,包裹式等等。过滤式只是间接地考虑了训练误差,而包裹式则直接考虑了范化误差,但是包裹式每尝试选择一部分特征,就得重新训练分类器,故而时间花费较大。本文提出了一种基于L-GEM的特征选择方法,每次筛选一个特征的时候只需要训练一个分类器,大大提供了特征选择的效率。

2.基于L-GEM的特征选择方法RSMFS

3.RSMFS性质分析

4.实验

    实验部分的细节这里不做赘述,具体看原论文。这里主要介绍下原论文都做了哪些实验,以期给自己写论文做实验时能有一些启发。
    论文实验部分在各种不同的数据集(大/小数据,多/少特征)上,进行了对比实验。由于论文这里并没有对特征选择的数量进行了探讨,故论文比较的是不同特征选择方法(similarity, separability, correlation coefficient, mutual information, and leave-one-out)在选择不同比例/数目特征下分类器的测试准确率及T检验值。同时,论文也可视化比较了在不同特征选择方法所选择出的最相关的两/三个特征下的不同类别样本在空间上的区分度。除此之外,论文还对RSMFS在RBFNN使用不同初始化方法下的鲁棒性进行了探讨。