为了他们所有的简单性,病毒都是偷偷摸摸的小生命力。

服用SARS-COV-2,病毒在Covid-19背后。对人类免疫系统挑战,病毒逐渐重新洗脱其遗传物质,使人口中更容易传播。新菌株已经恐吓南非并关闭英国,最近在美国出现了。

一线希望是,我们现有的疫苗和抗体疗法仍有可能对新毒株有效。但情况并非总是如此。“病毒逃逸”是一个噩梦般的场景,病毒突变到足以让现有的抗体不再识别它。其后果是可怕的:这意味着即使你已经感染了病毒,或者从疫苗中产生了抗体,这些保护措施现在已经失效了。

从进化的角度来看,病毒突变和我们的免疫系统不断从事猫和而然的游戏。上周,由于完美意想不到的资源,我们现在可能有一条腿。弯曲发表的论文科学,一个团队开发了一种预测病毒逃脱的工具 - 来自自然语言处理(NLP),人工智能模仿人类语言的领域。

很奇怪,对吧?

该团队的重要见解是纯粹基于病毒的基因序列构建一种“病毒语言”。这种语言,如果有足够的例子,然后可以用NLP技术来分析,预测它的基因组变化如何改变它与我们的免疫系统的相互作用。也就是说,利用人工语言技术,有可能找到病毒基因组中的关键区域,当病毒发生突变时,这些区域会让病毒逃离漫游的抗体。

这是一个严重的Kooky想法。然而,当对我们的一些最大的病毒敌人进行测试时,如流感(季节性流感),艾滋病毒和SARS-COV-2,算法能够辨别关键突变,即“转换”每个病毒足以逃避我们的掌握免疫监测系统。

“病毒进化和逃逸的语言……为预测导致病毒逃逸的突变提供了一个强有力的框架。”国家健康研究所的Yoo-Ah Kim和Teresa Przytycka,他们没有参与这项研究,但是提供的视角在上面。

“这是缩小整个宇宙潜在突变病毒范围的非凡方法,”添加Benhur Lee博士在西奈山。如果进一步验证,该算法可以在有效的艾滋病毒疫苗或通用流感疫苗中进行抗衡杆菌尝试 - 而不是我们现在的零碎预测方法。它还可以提供深入了解新的冠状病毒如何进一步变异并将我们的免疫系统置于“检查”和反过来,让我们了解其逃脱计划并为所有人结束大流行。

一个有用的类比

使用NLP检查病毒的想法始于一个类比。去年冬天,研究作者布莱恩·Hie在麻省理工学院的雪地里漫游时,突然有了一个想法:是否有可能用分析语言的方式来解释病毒和免疫系统之间的相互作用?

这是一个超级书呆子的认识,需要几次信念的飞跃。但他越想越觉得有道理。语言包含语法和语义。第一个是相当不可改变的,在它建立一个句子的结构之前。但是第二个,语义学,只是句子的意思。改变一个单词可以立即改变意思到听众无法理解的程度,同时保持语法完整。换句话说,你完全有可能说你脑中出现了语法正确的胡言乱语,同时“逃离”了听者的理解。

这是比喻的飞跃。病毒也在两个主要的性状上运行以生存。两者都涉及他们与免疫系统的互动。首先是他们进入细胞的能力来复制更多自己。这种特质被称为“毒力”,需要保持半成一致性,以便病毒可以在主机内保持自身。

SARS-CoV-2。像大多数病毒一样,它是一种表面布满尖刺的气泡状生物。包裹在里面的是它的基因组序列。这些刺突蛋白是病毒与细胞“对话”、让病毒进入细胞所必需的。但正是病毒基因决定了刺突蛋白的形状。换句话说,如果病毒基因的改变也改变了刺突蛋白,这些突变就会改变病毒与我们的细胞和免疫系统的相互作用。

为了生存,任何给定的病毒都需要遵循自己的“语法”。这些基本序列在其基因组中捕获,允许其生存。用太多的突变打破语法,或关键斑点中的突变,病毒将不再能够进入细胞并复制,并将达到进化死胡同。底线:病毒需要保持其“语法”完好无损。

然而,语法只是理解的一半。另一个是语义学,即词语的意义。他认为,这是病毒有更多回旋余地的地方。把病毒想象成一个说话者,而我们的免疫系统则是一个倾听者。病毒基因组的突变可以替换“单词”,但保留语法完整,足以愚弄免疫系统的“听者”,使其不再理解病毒的语言,从而停止攻击。然而,由于病毒的语法仍然存在,它可以自由复制并造成破坏,不被免疫系统的防御系统所察觉。换句话说,如果变异允许病毒保留它的语法,但改变了它的语义,它也允许病毒逃逸。

问题是,我们如何预测这些噩梦突变?

输入算法

他的第二个想法是进入一个完全不同的领域:人工智能语言。

近年来,AI在人类语言中建立了语法和语义,无论没有任何事先知识或对内容的理解,AI都得到了极高的效率。拿GPT-3由Openai它写出了令人吃惊的类人散文,语法正确,而且基本切中主题。与学习语言学不同,这些NLP算法通过大量的以单词、短语、句子和段落排列的文本语料库进行学习。即使没有事先的训练,一个NLP算法也能够掌握人类语言的模式。忘记规则吧——它完全是模式识别。

现在想象一下,例子文本是病毒的“正常”基因组,而突变是替代的新短语;这样就可以使用NLP技术分析病毒的语言。以“语法”为例,即病毒基因组中使其进入细胞的序列。如果把NLP看作一种语言,它就可以开始掌握与病毒传染性相关的序列,而不需要任何微生物学知识。

类似的想法适用于病毒语义。可以系统地改变一种病毒遗传信。使用NLP,我们可以分析其“意义”中的突变杂散 - 例如,其行为。使用语言示例,将“CAT”交换为“猫”是一个微小的变化。随着“推土机”交换“猫”,产生了更大的差异。这些改变程度由数字而不是直觉捕获,并允许该算法判断病毒从原始形式中误入的速度。

利用流感病毒、艾滋病毒和SARS-CoV-2,该团队开始寻找允许病毒逃逸的基因突变:那些保留病毒的“语法”,但改变其“语义”的基因突变。研究小组用他们的算法对每个区域打分,发现了几个目标蛋白点——它们的基因蓝图——这大大提高了病毒逃逸的机会。请记住:算法以前从未遇到过任何与病毒生物学有关的远程数据。但是仅仅基于病毒的“语言”,它复制了先前导致流感逃逸的序列的实验室结果。

这并不往往是,无关的科学分支互相互相推动。和HIE不会停止。进一步进入语言类比,有些人可能会根据他们的历史,文化和经验来平息不同的句子。同样,我们的免疫系统并非所有相同的系统都有其自身的血清素,抗体和免疫细胞,以及整体“强度”。

Kim和Przytycka说:“观察所提出的方法是否能被适应,为病毒进化提供一种‘个性化’的观点,这将是很有趣的。”

图像信用:Vektor KunstPixabay

Shelly Xuelai Fan是一个神经科学家转向科学作家。她在不列颠哥伦比亚省大学的神经科学中完成了博士学位,在那里她开发了新的神经变性治疗方法。在研究生物脑的同时,她对AI和所有东西都很着迷。毕业后,她搬到了UCSF,研究了恢复老年大脑的基于血液的因素。她是 ...

跟雪莉: