摘要

近年来,以深度学习为代表的机器学习已成为新药设计的有力工具。计算策略用于从没有先验关系的原子构建块生成新的分子结构。循环神经网络能够捕获大量已知生物活性化合物的组成,使用简化的分子输入行输入系统的化学结构字符串表示来预测新化合物的期望性质。通过使用在NPL中广泛使用的Word2Vec方法设计语言模型,探索SMILES序列分子底层特征之间的联系,并将其整合到LSTM网络中,结果表明,该模型对药物的初始设计有更好的优化效果。

全文