摘要

外源性化学品暴露是肝脏疾病的重要病因,有必要筛查肝毒性化学品并进行管理。定量构效关系(QSAR)模型,通过关联化学品的分子结构和毒性效应,可用于肝毒性化学品的有效筛查。本研究旨在构建性能优异的肝毒性化学品的QSAR筛查模型。以往基于机器学习算法的化学品肝毒性筛查模型数据来源单一,覆盖的化学空间有限。本研究搜集整理了4 014种化学品肝毒性的定性数据,使用多种机器学习算法,建立了肝毒性化学品的筛查模型。以PubChem指纹作为模型输入,应用随机森林算法所建模型的效果最优。十折交叉验证的准确率(RA)、敏感性(RSE)、特异性(RSP)和受试者工作特征曲线下的面积(AROC)分别为0.714, 0.596, 0.799和0.764;外部验证的RA,RSE,RSP和AROC分别为0.733, 0.620, 0.812和0.804。基于分子相似性原理,表征了模型应用域。分子中是否具有氮原子以及氮原子的数量,是决定化学品是否具有肝毒性的重要因素。筛查了《中国现有化学物质名录》中的化学品,612种化学品被预测为具有肝毒性。