摘要

考虑超高维部分线性变系数模型,其中线性部分的协变量的维数随着样本容量以指数阶的速度增长.考虑到超高维协变量间存在相关性,提出贪婪的profile向前回归(greedy profile forward regression,GPFR)方法对超高维的线性部分的协变量进行变量筛选.并在一定的正则条件下,证明了所提出GPFR方法的筛选相合性.GPFR方法得到一系列嵌套的模型,为确定是否将某个候选的解释变量选入模型,用EBIC准则选择"最优"的模型.通过数值模拟和实例分析研究了GPFR算法的有限样本性质,发现在变量间存在高度相关和信噪比较低时,所提的GPFR方法优势明显.