摘要

[目的/意义]机器学习中的成员推理攻击是指对于任意给定样本是否能够推断出它是否属于目标模型的训练数据集。由于训练数据集中包含隐私信息,成员推理攻击及其防御属于重要的隐私保护问题。[方法/过程]首先介绍了成员推理攻击的定义和造成攻击的原因,接着从攻击原理、敌手能力和攻击者的目标模型三个角度,详细地介绍了现有的攻击算法,最后按照不同方法的分类,描述了成员推理攻击的防御途径。[结果/结论]对成员推理攻击相关内容进行了全面且清晰的描述,对近年来的相关文献进行了整理和总结。帮助研究者更好地理解成员推理攻击及其防御,为进一步降低训练数据集的隐私风险、更好地取得模型效用和隐私安全之间的平衡性,提供了一定的参考内容。