感谢AI,我们刚刚获得了令人惊叹的强大工具来解码生活。

成两半背部-到-背部上周论文,深度和华盛顿大学的科学家描述了基于深入的学习方法来解决蛋白质折叠 - 在我们的DNA中执行编程的最后一步,以及“一旦进入前进。“

蛋白质是生命的午集。它们形成了我们的身体,燃料的新陈代谢,是当今大部分药物的目标。他们从DNA翻译成一个简单的功能区,随后折叠成复杂的三维架构。类似于变压器,许多蛋白质单位进一步组装成大量的移动复合物,这取决于目前其功能需要改变它们的结构。

错误折叠的蛋白质可能是毁灭性的,造成健康问题镰状细胞性贫血癌症和老年痴呆症疾病。过去50年来的生物学的最挑战之一一直在破译,这是一种简单的一维色带状结构如何变成3D形状,配备峡谷,山脊,山谷和洞穴。就好像外星人正在笔记本上的大峡谷地图上阅读数百个地点的坐标,并将其重建为实际的3D全息图 - 没有铺设眼睛或知道它应该看起来像什么。

是的。这个很难(硬。“很多人都摔断了头,”John Moult博士在马里兰大学。

这不仅仅是一个学术练习。解决人类基因组为基因治疗铺平了道路,CAR-T癌症突破,臭名昭着克里普尔克基因编辑工具。解入蛋白质折叠必将照亮整个新的生物景观,我们无法学习或操纵。Covid-19疫苗的快速和激情的发展依赖于科学家解析病毒上的多种蛋白质靶标,包括疫苗靶向的尖峰蛋白。迄今为止导致癌症导致癌症的许多蛋白质都是出于毒品的障碍,因为它们的结构很难抓住。

有这些新的AI.工具,科学家可以解决困扰医疗奥秘,同时准备解决那些未知的人。它设定了更好地理解我们的生物学,告知新药物,甚至鼓励合成生物学的阶段。

“DeepMind团队设法实现的是奇妙的,将改变结构生物学和蛋白质研究的未来,”欧洲生物信息学研究所的杰科特·桑顿博士说。

“我从未想过我在我的一生中看到了这一生,”换羽。

蛋白质的诞生

图片生活作为视频游戏。如果DNA是背景基本代码,则蛋白质是其执行 - 您播放的实际游戏。DNA中的任何错误都可以触发程序中的崩溃,但它们也可能是良性的,并允许游戏像往常一样运行。换句话说,大多数现代医学,如游戏玩家,只关心最后的游戏 - 蛋白质 - 而不是导致它的源代码,除非出现问题。从糖尿病药物到抗抑郁药和潜在的生命延伸Senolytics.,这些药物通过抓住蛋白质而不是DNA来所有工作。

这就是如何解入蛋白质结构如此重要的原因:就像锁的钥匙一样,药物只能在特定斑点的蛋白质上停靠在蛋白质上。同样,蛋白质通常通过将组成复杂地绑定到努力来运行身体的函数 - 说,形成一个记忆或触发免疫发作对抗病毒。

蛋白质由称为氨基酸的构建块制成,其又由DNA编程。类似于罗赛塔石,我们的细胞可以容易地将DNA代码转化为蛤壳状结构内的蛋白质构建块,其吐出一系列一维氨基酸。然后将这些丝带通过整个细胞基础设施进行洗机,使蛋白质折叠成其最终结构。

回到20世纪70年代,诺贝尔奖获奖者博士基督徒Anfinsen博士着名称是一维序列本身可以计算地预测蛋白质的3D结构。问题是时间和力量:就像尝试用悬浮在3D空间中的数百个字符的密码,潜在的解决方案是天文学的。

但我们现在有一个工具,在寻找模式时击败人类:机器学习。

进入AI.

在2020年,深刻震惊整个领域随着它进入遗留两年期比赛。复制的Casp(蛋白质结构预测的批判性评估),数十年长的测试使用传统的实验室方法来确定蛋白质结构作为判断预测算法的基线。

基线很难得到。它依赖于可能需要数月甚至几年的艰苦实验技术。这些方法通常“冷冻”蛋白质,并使用X射线将其内部结构映射到原子水平。许多蛋白质不能在没有失去自然结构的情况下处理这种方式,但该方法是我们目前的最佳方法。然后将预测与该金标准进行比较以判断潜在算法。

去年深刻震惊了每个人的人,吹掉了其他竞争。当时,他们是一个戏弄,揭示他们的细节“令人难以置信的令人兴奋“匹配实验结果的方法精度匹配。但是30分钟的演讲激发了华盛顿大学的Minkyung Baek博士,培养了自己的方法。

Baek使用了类似的深层学习策略,概述了一篇论文科学本星期。该工具RosettaFold同时考虑三个级别的模式。首先看看蛋白质的氨基酸积木,并将它们与蛋白质数据库中的所有其他序列进行比较。

该工具接下来检查一个蛋白质的氨基酸如何通过检查两个远处建筑物块之间的距离在相同蛋白质内与另一蛋白质相互作用。这就像看着你的手脚一样完全伸展在背部,并在你“折叠”到瑜伽姿势中的那些四肢之间的距离。

最后,第三轨道看起来每个原子的3D坐标,其构成蛋白质构建块的块,如乐高块上的螺柱 - 以编译最终的3D结构。然后,网络在这些轨道之间来回反弹,使得一个输出可以更新另一轨道。

最终结果靠近深麦芽工具,alphafold2,它与实验中获得的结构的金标准相匹配。虽然Rosettafold与Alphafold2没有准确,但它似乎需要更少的时间和精力。对于简单的蛋白质,该算法能够在大约10分钟内使用游戏计算机解决结构。

RosettaFold还能够解决“蛋白质组装”问题,因为它可以通过简单地查看单独的氨基酸序列来预测由多个单元组成的蛋白质的结构。例如,它们能够预测免疫分子的结构如何锁定在其目标上。许多生物学功能依赖于蛋白质之间的这些握手。能够使用算法预测它们打开门以操纵生物过程 - 免疫系统,中风,癌症,大脑功能 - 我们以前无法访问。

黑客身体

由于Rosettafold于7月的公开发布,因此已经下载了数百次,允许其他研究人员回答他们的挡板蛋白质序列问题,潜在节省多年的工作,同时集体改善算法。

“当两年后有这样的突破时,每个人都在做它,如果不是比以前更好,”换羽说。

与此同时,DeepMind还释放了他们的alphafold2代码 - 这是一个灵感百科的人。

一个新的论文自然,DeepMind团队描述了他们的方法到了50年的神秘面纱。CRUX是集成多种信息来源 - 蛋白质的演变及其物理和几何约束 - 构建两步系统,以展示具有令人惊叹的高精度的给定蛋白质。

第一次在Casp会议上介绍,DepMind的创始人和首席执行官Demis Hassabis博士准备与世界分享代码。“我们承诺分享我们的方法并提供广泛的自由访问科学界。Today we take the first step towards delivering on that commitment by sharing AlphaFold’s open-source code and publishing the system’s full methodology,” he wrote, adding that “we’re excited to see what other new avenues of research this will enable for the community.”

通过两项研究,我们正在进入一个预测 - 随后的工程或改变建筑物的新世界。Andrei Lupas博士,Max Planck发育生物学研究所的进化生物学家,以及一家卡斯普法官,同意:“这将改变医学。它将改变研究,“他说。“它将改变生物工程。它会改变一切。“

图像信用:IAN HAYDON,华盛顿大学蛋白质设计研究所

Shelly Xuelai Fan是一个神经科学家转向科学作家。她在不列颠哥伦比亚省大学的神经科学中完成了博士学位,在那里她开发了新的神经变性治疗方法。在研究生物脑的同时,她对AI和所有东西都很着迷。毕业后,她搬到了UCSF,研究了恢复老年大脑的基于血液的因素。她是 ...

遵循搁置: