摘要

充分利用药物大数据平台和临床资源,运用数据分析方法预测抗乳腺癌候选药物的ADMET性质和抗乳腺癌活性,为实验室研制抗乳腺癌新药过程提供参考方向。针对1974种化合物的分子描述符变量数据,分别构建以ADMET性质和pIC50值为因变量的随机森林预测模型,模型的预测精度分别为88.7%和91.3%。基于随机森林模型求得的重要影响因子贡献率确定出4个变化显著的共同重要影响因子的取值范围,分别为MLFER_BH(0.56,2.65)、MLFER_S(1.30,4.41)、WTPT-5(0.00,10.01)和SdssC(-1.92,2.76),对实现抗乳腺癌药物的优化具有指导意义。