由 DeepMind 创始人兼首席执行官 Demis Hassabis 与 EMBL 合作开发的 AlphaFold 数据库,包含了人类已知的几乎所有蛋白质形状的 AI 建模预测。扩展数据库中储存了大约 2 亿种蛋白质(比如人体可产生的一整套蛋白质),几乎涵盖了地球上通过基因组测序进行编目的所有生物。
Demis Hassabis 表示:“AlphaFold 已成为全球数十万实验室和大学科学项目不可或缺的一款工具,这着实让我们感到惊讶”。
在去年首次推出时,AlphaFold 仅包含了一组 35 万个蛋白质结构预测,然后很快增加到了 100 万(最近该数字已至 2 亿)。
数据库中模拟了多种生物体的蛋白质,涵盖了植物、细菌、动物等生命形式。
截止目前,已有来自 190 个国家或地区的 50 万研究人员,在其工作过程中访问了 AlphaFold 。
自推出以来,来自 AlphaFold 的信息也有被超过 1000 篇论文所收录。
在尝试解决某些对人类来说相当紧迫的问题时,科学家们将极大地受益于此。
比如数据库中的 17 种蛋白质,就与某些“被忽视的热带疾病”有关 —— 而这些疾病,又影响着全世界超过 10 亿人的生活。
据“被忽视疾病药物倡议”(DNDI)组织预测,AlphaFold 可帮助研究人员较以往更快地发现有望用于此类疾病治疗的分子。
与此同时,DNDI 本身也在使用该数据库来应对“恰加斯病”(Chagas disease)和“利什曼病”(Leishmaniasis)。
随着 DeepMind 和 EMBL 决定免费开放该数据库,这对发展中国家的科学家和研究人员们来说也是一个巨大的利好。
某些地区可能受到了特定疾病“不成比例”的影响,而 AlphaFold 正好有望在此过程中提供力所能及的帮助,尤其是那些缺乏经费支撑的关键研究工作。
Accelerating scientific discovery The Alphafold project - DNDi(via)
DeepMind 研究科学家兼 AlphaFold 负责人 John Jumper 对此寄予了厚望,表示发布该数据库的初衷,就是希望其它团队也可在当前已取得进展的基础上再接再厉。
这是一个属于结构生物学的崭新时代,基于人工智能的方法将推动令人难以置信的进步。
此外许多其它 AI 研究组织现也进入了该领域,并正利用 AlphaFold 来创造进一步的突破。
关键词: AlphaFold数据库 AI建模预测 基因组测序 恰加斯病 人工智能