摘要

为使最大信息系数(MIC)适用于多变量数据集,给出了一种方法,该方法首先将数据集中的多个变量合并为两个变量,并且穷尽所有的合并方式.然后使用MIC来评估降维后的双变量数据集的非线性相关性.最后将所有可能的合并方式下产生的MIC值的最大值作为最终结果.由此,即得到了一种评估多变量数据集中非线性相关关系强度的新方法.理论分析表明,该方法能够有效反映原始数据集中非线性相关性强度.此外,相较于非线性相关信息熵(NCIE),该方法能够给出更明确的结果,从而是一种更优异的非线性相关性测度.

全文