摘要

随着存储技术的发展,数据的规模和来源日益丰富。商业银行各支行具有相同或相似的业务规划,但各支行对公贷款的违约情况存在明显的异质性。本文基于分布式计算构建对公贷款风险用户识别模型,并首次将处理分布式异质数据的隐私保护模型应用于信用风险评估中。区别于现有的分而治之模型,本文采用先导抽样和一步更新算法,在保护客户隐私的同时,能够有效地融合不同数据源的异质性数据信息,进而使得一步更新估计量具有与全样本估计量相同的收敛速度和渐近方差。模拟表明,不同数据源的异质性越强,本文所提出的一步更新算法的优势就越显著。最后将本文方法应用于我国西南某商业银行的违约用户识别问题,显著提高了预测的准确性。

全文