美国研究人员使用人工智能来设计超越自然界的新蛋白质。他们开发的机器学习算法,可生成具有特定结构特征的蛋白质,这些蛋白质可用于制造具有特定机械性能(如刚度或弹性)...
美国研究人员使用人工智能来设计超越自然界的新蛋白质。他们开发的机器学习算法,可生成具有特定结构特征的蛋白质,这些蛋白质可用于制造具有特定机械性能(如刚度或弹性)的材料,从而取代作为原料的石油或陶瓷。研究论文发表在最新一期《化学》杂志上。
麻省理工学院、IBM沃森AI实验室和塔夫茨大学研究人员采用了一种生成模型,其与DALL-E 2等AI系统中使用的机器学习模型架构相同,但研究人员调整了模型架构,以预测实现特定结构的蛋白质的氨基酸序列。
这一模型学习控制蛋白质形成方式的生化关系,产生超越自然界的新蛋白质,从而实现独特应用,例如,该工具开发的食品涂层可使农产品保鲜时间更长,同时保证食用安全。该模型还可在几天内就生成数百万种蛋白质,为科学家迅速提供可供探索的新可能。
研究人员此次构建了两个机器学习模型,以预测各种新氨基酸序列,这些氨基酸序列形成满足结构设计目标的蛋白质。一种模型在蛋白质的整体结构特性上起作用,另一种模型在氨基酸水平上起作用。两种模型都通过组合这些氨基酸结构来产生蛋白质。
这些模型与预测蛋白质折叠的算法相关联,研究人员使用该算法来确定蛋白质的3D结构。然后,他们计算其结果属性,并根据设计规范检查这些属性。测试显示,其与现有氨基酸序列存在部分重叠,在大多数情况下约有50%—60%,但也有一些全新的序列。相似程度表明,AI生成的许多蛋白质是可合成的。