摘要

作为一种降维技术,变量筛选在超高维数据分析中发挥至关重要的作用,并且在过去十年间许多文献对其进行了讨论.无论响应变量是连续的还是离散的,大部分的现有变量筛选方法均明示或暗含着一个假设,协变量是连续的.Huang,Li&Wang(2014)[37]首先提出了一种基于Pearson卡方统计量的变量筛选方法(PC-SIS).该方法解决了在分类问题中如何筛选超高维离散变量,虽然这是一个常见的实际问题,却很少在以往文献中进行讨论.当不同协变量的分类个数不同时,变量筛选方法采用原始筛选统计量或其p值调整值的筛选表现均欠佳.本论文的主要工作具体如下:在一个分类问题中,本文发展了一种全新的且无模型假设的变量筛...