新闻动态

首页 > 新闻动态 > 论文解读Vol.1 | 生物学大模型ESM3登Science封面,可推理蛋白质序列、结构和功能
2025-03-04

论文解读Vol.1 | 生物学大模型ESM3登Science封面,可推理蛋白质序列、结构和功能

自 2025 年 3 月起,超算互联网上线「AI4S 论文解读系列专题」,AI for Science(AI4S)前沿,尽在超算互联网。

640.jpg

《Science》封面

近日,由前 Meta 首席科学家 Alexander Rives 领衔的初创公司 EvolutionaryScale,推出一款多模态生成语言模型——ESM3,可以推理蛋白质的序列、结构和功能。
该模型不仅能够生成功能性蛋白质,还能够模拟超过 5 亿年的进化过程,生成与自然界已知蛋白序列不同的全新蛋白质。
研究人员使用 ESM3 设计了一种名为 esmGFP 的新荧光蛋白,它与已知最相似的荧光蛋白序列同源性仅为 58%,这在以往的人工设计中是极为罕见的。
相关研究以《Simulating 500 million years of evolution with a language model》为题,发布在《Science》上,并登上 Science封面
640-5.png
开源地址:https://github.com/evolutionaryscale/esm
论文链接:https://www.scnet.cn/ui/mall/search/goods?keyword=ESM3
蛋白质是生物体中重要的功能性分子,其形成过程历经数十亿年的自然选择和进化。
当前,科学家已经开发和评估了许多蛋白质序列的语言模型。研究发现,语言模型中出现的表征反映了蛋白质的生物结构和功能,并且无需任何监督即可学习这些属性,并随着规模的扩大而不断改进。
在此,研究人员提出了一种前沿的多模态生成语言模型 ESM3,使得可编程蛋白质设计成为可能。

640-1.jpg


欢迎大家入群交流,共同探讨 AI4S 发展,快速把握科研领域的热点资讯。

扫描下方二维码添加超算互联网小编企业微信,备注「AI4S 探讨」,即可获取论文解读稿全文原论文 PDF
640-6.png

论文原文及解读稿全文已上线超算互联网「论文研读」店铺,可点击文末”阅读原文”或访问下方链接获取:

https://www.scnet.cn/ui/mall/search/goods?keyword=ESM3