摘要

发布未经保护的人口普查统计数据有泄露居民个人隐私信息的风险。基于差分隐私的人口普查数据保护方案已经得到研究者的广泛关注。现有方法解决人口普查统计数据的地理区域之间的一致性约束,具有更复杂层次性一致性约束的关联多属性数据在现有方法下面临无法在单棵层次树中构建的挑战。本文提出了一种基于差分隐私的人口普查区域内部关联多属性统计数据最优一致发布方法,该方法能够实现复杂一致性约束统计数据的高效发布。首先将复杂的关联多属性之间的一致性约束划分为相对独立且易于求解的多重一致性约束,然后根据人口普查关联多属性数据的结构特性,通过数学分析在现有方法的基础上做进一步效率优化,最后结合多重一致性约束问题的逼近方法实现最优一致发布。在真实的人口普查数据集和合成数据集上的实验表明,本文提出的方法能够在效率表现上优于同类方法一至两个数量级的同时保持与同类方法一致的精度。