一位科学家使用Celium探索大型多维数据集,Celium是AbCellera开发的一种专有的人工智能驱动的交互式数据可视化软件。借助Celium,AbCellera的科学家和合作伙伴可视化抗体序列以及有关抗体来源、抗体基因使用和克隆关系的相应信息,以帮助为先导候选药物的选择提供信息。Celium在处理TB数据时可视化湿实验室的实验结果。因此,它不输出理论预测。它揭示了经过大自然优化和验证的分子。
很难准确确定生物技术行业人士所说的“人工智能”(AI)是什么意思。总的来说,他们似乎对一个可行的定义感到满意,该定义将人工智能描述为一种计算机程序,可以根据收到的数据集学习和预测结果。
鉴于人工智能的工作定义很模糊,因此人工智能在生物技术行业的地位也很模糊。例如,目前还不清楚人工智能是否被视为一种新的、革命性的东西。大众媒体的新闻报道有什么指导意义吗?其中包括关于AlphaFold(谷歌DeepMind开发的人工智能系统)如何准确预测数十万种蛋白质结构的令人惊叹的报告。
尽管AlphaFold是一项突破性技术,但它并不是生物技术领域人工智能的全部。生物技术领域与人工智能相关的挖掘工作正在多个领域进行。事实上,世界各地的生物技术公司一直在其管道中实施人工智能。
如果我们要澄清人工智能的地位,我们首先应该认识到生物技术领域的人工智能并没有突然成为主流。事实上,它已经成为主流。此外,它是多样化的并且准备好产生结果。在生物技术行业,准确、预测和高效的人工智能是触手可及的。对于实验室科学家来说,这种人工智能的价值将是其重量的一百倍。
人工智能就像人工智能一样
人工智能的模糊定义——从大数据集中学习的大算法——可能就是我们所需要的。真正重要的是人工智能系统的作用。人工智能系统的作用将取决于开发它们的人。
仪器和耗材公司安捷伦科技(AgilentTechnologies)已迈入人工智能领域,包括与Visiopharm合作开展人工智能驱动的癌症病理学研究。这些公司将这项工作视为不同方法的结合。
安捷伦公司的两位高管——计算生物学部门经理AnyaTsalenko博士和研究实验室主任StephenLaderman博士很好地描述了安捷伦的观点。他们证实,最先进的人工智能方法使用的是用大数据集训练的计算密集型模型。
“这些模型大致属于机器学习的范畴,包括不同风格的深度卷积神经网络,”他们说。“这些新方法的成功基于现代计算机力量的结合;收集、存储和访问大量数据的能力;以及计算机科学、数学和统计学的最新进展。”
“我完全理解人们对人工智能的定义不同,”AbCelleraBiologics的首席执行官CarlHansen补充道,该公司是一家总部位于温哥华的公司,利用人工智能来制造治疗性抗体。“我认为将人工智能作为一个类别来讨论确实很危险。实在是太抽象了。在我看来,人工智能在药物发现中有很多非常强大和有趣的应用。而且还有很多绒毛。”
Cellarity是一家位于剑桥的初创公司,专注于基于成像和机器学习的方法衍生的细胞疗法。他认为人工智能是对现有范式的补充,但它并不总是兑现过去的承诺。“我认为,今天人工智能主要用于改进现有方法,”他解释道。因此,绝大多数药物发现公司都会告诉你他们可以利用人工智能。通过使当前的发现范式更加高效,他们会告诉您他们可以使用人工智能来寻找新目标。
“我有与那些过去确实提出过他们无法支持的主张的人一起工作的经验。公平地说,并不是说他们没有算法。我认为[算法非常重要的想法]可能是对人工智能最常见的误解之一。人工智能的好坏取决于数据的质量。”
将人工智能融入图片中
数据集并不是具有生物学意义的模式的唯一来源。这种模式也可以在细胞、肿瘤和组织的图片中找到——即使这些图片是使用耗时、导致眼睛疲劳的强力方法进行分析的。为了更轻松地找到图像中的模式,研究人员可能会利用人工智能。Tsalenko和Laderman表示,人工智能图像分析可以增强基础研究和医学病理学。
“[我们]在活细胞显微镜和组织病理学方面拥有强大的地位,”他们解释道。“通过适当选择方法和模型训练,人工智能图像分析使人们能够定位、分类、计数和识别显微图像中的模式,包括那些人眼难以高效、全面和定量地看到的模式。
“这些属性是临床病理实验室基于显微镜的组织分析持续数字化转型的驱动力之一。例如,预计人工智能最终将提高癌症诊断和治疗的精确度。就活细胞成像而言,人工智能可以改善对所研究细胞的动态和进化的跟踪。”
简化发现和开发
StacieCalad-Thomson博士是BioSymetrics的首席战略官兼药物发现主管,BioSymetrics是一家总部位于波士顿和多伦多的初创公司,利用机器学习方法研究电子健康记录和体内数据。她相信人工智能可以用来简化药物发现和开发。
她强调了三种可能性:“首先,人工智能可以加快我们发现新疗法的时间,因为信息学和多参数优化可以帮助我们对要进行的实验做出更明智的决定。其次,人工智能可以帮助我们更好地了解生物学以及驱动疾病或可用于治疗疾病的潜在代码、信号和途径。第三,人工智能可以通过将疾病表型与基因和生物标志物等潜在代码联系起来,识别和定义特定治疗最有效的患者群体。”
“在短期内,人工智能的许多成功都集中在化学和分子设计上,作为一种效率游戏,”她继续说道。“但从长远来看,生物学是更难解决的问题,解决这个问题将减少人员流失并提高临床成功率。在药物发现之初使用人工智能获取和整合不同患者数据的能力将成为我们发现药物的规则,而不是例外。”
数据和药物的良性循环
“当你想到一种疾病时,你会想到功能失调的器官、功能失调的组织、功能失调的细胞,”乔拉基说。然而,他很快补充说,我们在如此丰富的背景下理解疾病的能力是有限的。
由于我们对疾病的理解受到限制,我们对如何开发治疗方法的概念也相应地减少了。“我们解决细胞故障的唯一方法就是找到目标,”乔拉基抱怨道。“如果你选择一个分子靶标,这就是你从一开始的假设。显然,它无法解决生物学的复杂性。当你沿着发展过程前进时,你会发现更高的物种,你会发现你之前所做的假设将不会得到证实。”
超越以目标为中心的药物开发方法,并像Cellarity那样采用细胞水平的方法,意味着收集和分析大量数据,并且质量至关重要。一般来说,高质量的数据和高质量的分析工作是相辅相成的。当Chouraqui被问及实验生物学的重要性是否会随着算法驱动的药物发现和开发的进步而减弱时,这一点得到了体现。
“不,我不相信这是真的,”乔拉基说。“它将始终是湿实验室和干实验室的结合体,因为它是一个循环。您绝对需要访问并生成高质量的资产。你需要测试人工智能生成过程的结果,然后将该测试的结果输入到你的人工智能过程中。”
向AbCellera的Hansen提出了同样的问题。他回答说:“我百分百同意这一点。那些能够从人工智能中获得最大影响力的公司也是那些拥有最强大实验能力的公司。”
人工智能难题的许多部分
有一段时间,AlphaFold似乎准备彻底消灭晶体学并永远改革分子相互作用研究。汉森说,事实并非如此。他解释说:“了解蛋白质结构并不意味着你一定能够比其他人更快地找到药物。我们已经[收集]结构很长时间了。[我们已在蛋白质数据库中输入]超过65,000个结构。我们没有公司会研究结构然后告诉你药物是什么。了解蛋白质结构和定义药物之间有很多步骤。”