世界人口老龄化、慢性病和传染病负担日益加重,以及新型病原体的出现,使得对新疗法的需求更加迫切。然而,发现一种新药并将其推向市场是一个漫长、艰巨且昂贵的过程,其标志是许多失败和很少的成功。
长期以来,人工智能一直被认为是克服其中一些障碍的答案,因为它能够分析大量数据、发现模式和关系并预测效果。
但是,尽管AI具有巨大的潜力,但它尚未兑现改变药物发现的承诺。
现在,由哈佛医学院生物医学信息学家MarinkaZitnik领导的多机构团队推出了一个平台,旨在通过开发更真实的数据集和更高保真度的算法来优化AI驱动的药物发现。
TherapeuticsDataCommons在NatureChemicalBiology最近的一篇评论中有所描述,它是一个开放访问平台,一方面充当计算机科学家和机器学习研究人员之间的桥梁,另一方面充当生物医学研究人员、生物化学家、临床研究人员和药物设计师之间的桥梁。另一端——传统上彼此孤立地工作的社区。
该平台在药物开发的所有阶段,从化合物鉴定到临床试验药物性能,为多种治疗方式(包括小分子药物、抗体以及细胞和基因疗法)提供数据集管理和算法设计以及性能评估。
她最近与哈佛医学新闻讨论了TherapeuticsDataCommons。
HMNews:药物发现的主要挑战是什么?人工智能如何帮助解决这些挑战?
Zitnik:从头开发一种既安全又有效的药物极具挑战性。平均而言,这需要11到16年的时间和10亿到20亿美元的资金。这是为什么?
很难及早弄清楚最初有希望的化合物是否会在人类患者身上产生与其在实验室中显示的结果一致的结果。小分子化合物的数量是10的60次方——但在这个天文数字般巨大的化学空间中,只有一小部分被研究用于具有药用特性的分子。尽管如此,现有疗法对治疗疾病的影响令人震惊。我们相信,结合自动化和新数据集的新算法可以找到更多可以转化为改善人类健康的分子。
人工智能算法可以帮助我们确定这些分子中哪些最有可能成为安全有效的人类疗法。这是药物发现开发面临的最终问题。我们的愿景是,机器学习模型可以帮助筛选和整合大量生化数据,我们可以将这些数据更直接地与分子和遗传信息联系起来,并最终实现个性化的患者治疗结果。
HMNews:人工智能离实现这一承诺还有多远?
Zitnik:我们还没有。有很多挑战,但我想说最大的挑战是了解我们当前算法的工作情况以及它们的性能是否可以转化为现实世界的问题。
当我们通过计算机建模评估新的AI模型时,我们是在基准数据集上测试它们。我们越来越多地在出版物中看到这些模型正在实现近乎完美的准确性。如果是这样,为什么我们没有看到机器学习在药物发现中得到广泛采用?
这是因为在基准数据集上表现良好与准备好过渡到生物医学或临床环境中的实际实施之间存在很大差距。训练和测试这些模型所依据的数据并不能表明这些模型在实际应用中所面临的挑战类型,因此缩小这一差距非常重要。