创业公司Evozyne利用英伟达提供的预先训练好的AI模型,创造了两种在医疗和清洁能源领域潜力巨大的蛋白质。 今天发表的一篇联合论文描述了这一过程和蛋白质的氨...
创业公司Evozyne利用英伟达提供的预先训练好的AI模型,创造了两种在医疗和清洁能源领域潜力巨大的蛋白质。
今天发表的一篇联合论文描述了这一过程和蛋白质的氨基酸序列一种蛋白质用于治疗先天性疾病,另一种蛋白质可用于消耗二氧化碳以减少全球变暖
初步研究结果显示了加速药物研发的新方法。
革命性的人工智能模型
Evozyne用的是英伟达的ProtT5ProtT5是一个Transformer模型,它是——NVIDIA BioNeMo的一部分,NVIDIA BioNeMo是一个用于创建医疗AI模型的软件框架和服务
分子工程师弗格森的研究领域涵盖化学和机器学习,他说:BioNeMo非常强大它允许我们训练模型,然后用它以非常低的成本运行任务——几秒钟内可以生成数百万个序列
该模型是Evovyne ProT—VAE过程的核心ProT—VAE是一个将BioNeMo与一个作为过滤器的可变自编码器相结合的工作流
他说:几年前,没有人注意到蛋白质可以通过结合大型语言模型和变分自编码器来设计。
让模特向自然学习
就像人读成千上万本书一样,英伟达的Transformer模型会读取数百万个蛋白质的氨基酸序列该模型使用神经网络技术来理解文本,并学习自然界如何构建蛋白质的氨基酸序列
然后,该模型预测如何组装一种新的蛋白质,可以满足Evozyne的需求。
他说:这项技术正在帮助我们开展工作,实现十年前无法实现的梦想。
无限的可能性
机器学习有助于研究大量可能的氨基酸组合,这些组合的数量会达到200位数。
传统的蛋白质工程设计方法是一种缓慢而无计划的方法这种方法只能用于固定大小的蛋白质,一次只能改变其序列中的几项
Evozyne的ProT—VAE过程结合了NVIDIA BioNeMo中强大的变压器模型和可变自编码器。
相比之下,Evozyne的方法可以在短短一轮内改变任何大小的蛋白质中的数万个特定氨基酸。
他说:我们正在进行技术飞跃,这将带来巨大的进步。
计划使用云服务
Evozyne计划使用新技术来制造能够对抗疾病和气候变化的蛋白质。
此外,该公司还致力于帮助药物和能源研究人员通过未来的云服务使用他们的软件,以满足他们的应用需求。
根据Gartner的市场研究统计,到2025年,利用生成式AI技术系统开发的新药和新材料的比例将超过30%,现在这个比例为零。
英伟达如何提供帮助。
弗格森说:英伟达在这方面是一个优秀的合作伙伴。
Evozyne的数据科学家约书亚·穆勒说:我们通过将我们的工作扩展到多个GPU来加快训练速度从而将训练大型AI模型的时间从几个月缩短到一周
弗格森补充道:这样我们就可以训练原本不可能训练的模型,比如一些拥有数十亿可训练参数的模型。
未来会更加精彩。
利用AI加速蛋白质工程的前景非常广阔。
弗格森注意到了扩散模型最近的发展:这个领域的发展速度令人难以置信,我真的很期待未来的进一步发展。
没人知道五年后我们能走多远。