深度学习正在通过令人惊叹的速度解决生物学的最深秘密。

刚刚一个月前,深刻打破了一个50岁的大挑战:蛋白质折叠。一周后,它们产生了一个超过350,000个蛋白质结构的完全变化的数据库,包括98%的已知人类蛋白质。结构是生物学功能的核心。数据转储,设置为爆炸到130万在年底到年底,允许科学家们将前面的“暗物质” - 蛋白质看不见,未经人体的化妆。

最终结果没有革命性的缺点。从基本生命科学研究,开发新的药物,以与癌症这样的最艰难的疾病敌人,深入学习给了我们一个金色的键解锁新的生物机制 - 天然或合成 - 以前是无法实现的。

现在,AI Darling设置为RNA的相同。

作为“DNA至RNA至蛋白质”中央教条的中间孩子,RNA直到它的Covid-19疫苗贡献。但分子是一个双重英雄:它既携带遗传信息,又取决于其结构催化的生物学功能,调节哪种基因导通,调整免疫系统,甚至可能的疯狂通过“记忆”通过世代。

它也令人沮丧地难以理解。

与蛋白质类似,RNA也折叠成复杂的3D结构。据Drs称,差异。斯坦福大学的丽血Das和Ron Dror,是我们对这些分子的较少。有30次RNA,因为存在蛋白质,但与蛋白质相比,破碎的RNA结构的数量小于1%。

斯坦福球队决定弥合那个差距。在一个上周发布科学,它们描述了一种称为Ares(原子旋转等效读射器)的深度学习算法,其有效地解决了RNA结构,爆破了先前的水。

作者“在北卡罗来纳大学的北卡罗来纳大学凯文几周博士说,这位作者”已经取得了显着的进展。“

甚至更令人印象深刻,Ares仅在18个RNA结构培训,但能够在实验实验室中进一步测试的RNA折叠的大量“构建块”规则。ARE也是无症状的,因为它没有特别定制于RNA。

“这种方法适用于结构生物学,化学,材料科学等各种问题,”作者说。

遇见RNA.

这种生物分子对我们日常生活的重要性可能总结为“Covid疫苗,MIC下降”。

但是它更多。

与蛋白质一样,RNA从DNA转录。它还具有四个字母,a,u,c和g,抓住u和c系束至g.rna是一个整个家庭,具有最着名的类型是信使RNA或mRNA,其携带遗传指示构建蛋白质。但还有转移RNA或TRNA - 我喜欢将此视为一种运输无人机 - 抓住氨基酸,并将其捕获到蛋白质工厂,控制基因表达的MicroRNA,甚至陌生人堂兄甚至我们理解的陌生人。

底线:RNA是遗传医学或疫苗的强大目标和灵感。例如,在没有实际触摸它的情况下关闭基因的一种方法是杀死其RNA信使。与基因治疗相比,靶向RNA可能具有较少的意外效果,所有的同时保持我们的遗传蓝图完整。

在我的头上,RNA经常类似于纠结的耳机。它开始作为一个字符串,但随后将缠绕成像橡皮筋的环路脱循环。然后扭曲结构再次扭转周围环,形成三级结构。

与令人沮丧的令人讨厌的耳机不同,RNA以半可预测的方式扭曲。它倾向于沉降到几种结构中。这些都是像你的身体在一堆舞蹈中扭曲成的形状。第三节RNA结构然后缝合这些舞蹈一起进入一个“图案”。

“每个RNA可能具有不同的结构性人格,”几周。

这种表面上的简单让研究人员抓狂。RNA的构建模块很简单——只有四个字母。在变成更复杂的三级模型之前,它们也会折叠成半刚性结构。然而,“尽管有这些简化的特征,复杂RNA结构的建模已经被证明是困难的,”Weeks说。

预测难题

当前的深度学习解决方案通常以一个要求开始:一大吨的训练示例,使得每层的神经网络都可以开始学习如何有效提取允许的功能信息AI.做出坚实的预测。

这是RNA的禁令。与蛋白质结构不同,RNA根本没有足够的实验验证和真实的例子。

随着Ares,作者采取了眉头辐射的方法。该算法不关心RNA。它丢弃了我们已经了解分子及其功能的任何东西。相反,它仅集中在原子的排列上。

首次用以前的RNA结构中熟知的一小套主题培训。该团队还添加了一个相同结构的大量替代例子,这是不正确的。消化这些示例,ARES缓慢地调整了其神经网络参数,以便该程序开始了解每个原子和其放置如何有助于整体分子的功能。

类似于经典计算机视觉算法,逐渐提取特征 - 从像素到线条,形状-ARE相同。其神经网络中的层覆盖了精细和粗略的尺度。当用一组新的RNA结构挑战时,其中许多比训练更复杂,Ares能够蒸馏模式和新颖的主题,识别字母的结合方式。

“它完全从原子结构中学到,没有其他信息......并且它没有关于结构特征可能重要的假设,”作者说。它们甚至没有向算法提供任何基本信息,例如RNA由四个字母链组成。

作为另一个基准,球队接下来挑战了RNA谜题。2011年被启动,RNA拼图是结构生物学家对已知实验RNA结构的预测算法测试其预测算法的社区挑战。ares吹走了比赛。

几周,平均分辨率“已经保持顽固地陷入顽固地卡住”少10倍。ares提高了大约30%的准确性。这是一个看似小的步骤,但是一个生物学最顽固的问题的巨大飞跃。

RNA结构代码

与蛋白质结构预测相比,RNA更加困难。目前,ARES仍然无法达到药物发现努力所需的准确性水平,或者在可以调整生物学的RNA分子上找到新的“热点”。

但是,ARE是一个强大的一步,即“刺穿RNA的雾”,一个“准备转变RNA结构和功能发现”的一步。对算法的一个改进可以是将一些实验数据结合到进一步模拟这些复杂的结构。明确的是,RNA似乎有一个“结构代码”,有助于调节基因电路 - 某些东西和其下一代可能有助于解析。

RNA的大部分是生物学的“暗物质”。我们知道它在那里,但很难想象甚至更难学习。ARES代表了下一个望远镜进入该雾。“因为可以测量(深深)学习,并预测第三级RNA结构的细节 - 在生物机制中的各种新发现等待着,”周数。

图像信用:Neo Tam./Pixabay

Shelly Xuelai Fan是一个神经科学家转向科学作家。她在不列颠哥伦比亚省大学的神经科学中完成了博士学位,在那里她开发了新的神经变性治疗方法。在研究生物脑的同时,她对AI和所有东西都很着迷。毕业后,她搬到了UCSF,研究了恢复老年大脑的基于血液的因素。她是 ...

遵循搁置: