去年春天,在与Covid-19的比赛中,23andMe发起了一项雄心勃勃的研究来回答大家心里的一个问题:谁可能会生病,或者病得很严重?

作为23andMe,他们寻找基因因素。

我们得到的答案上周。O型血(由abo基因决定)的人不太可能检测出Covid-19阳性。基因组的另一部分包含了与免疫系统和其他生物过程相关的基因,这可能是为什么有些人最终使用呼吸机,而其他人几乎不会咳嗽的原因。

结果很有趣。但23andMe是如何找到他们的,这让人兴奋。在短短一年的时间里,这项研究聚集了超过一百万人,目的是在我们的基因中寻找可能预示着易受感染的线索。这是以前科学家们做梦都想不到的规模。在挖掘与一种疾病相关的基因时,“规模是首要挑战,”亚当·奥顿博士领导了这项研究。

换句话说,消费者遗传学正在迅速改变对这些“基因搜寻”研究的期望,无论是在规模上还是在速度上。23andMe的竞争对手Ancestry也推出了类似的产品研究关于Covid-19基因的研究,前两周有数十万人参与。这些庞大的数据集,特别是那些来自不同祖先的人的数据集,建立了一个强大的基因蓝图库,等待着帮助应对下一次大流行或其他疾病。

他们做了什么?

该团队依赖于一种名为GWAS的大数据分析技术,即全基因组关联研究。这是一种非常流行的分析方法遗传学寻找与某种特定疾病相关的DNA链。

再解释一点:一个基因的字母可以有单一的变化,而不破坏它通常的作用。然而,DNA字母互换可能会产生一些后果——改变你眼睛的颜色、血型、患老年痴呆症或自闭症的可能性,以及抵御病毒感染的能力等等。这种被称为SNPs(单核苷酸多态性)的基因的细微变化是23andMe在分析你的DNA试剂盒时扫描的。

这就是GWAS的作用所在。它分析数据,看看DNA字母的变化是否与一种疾病有关。有了足够的数据,GWAS可以从我们的遗传物质中找出易受感染的部分。这是一种非常强大的技术,但远非完美。与机器学习类似,GWAS也非常贪婪,因为它需要大的数据集,最好是来自多个种族和遗传背景的人。

23andMe当然有一个庞大的数据库。2020年4月,随着Covid-19开始席卷全国,23andMe团队跟踪了病毒的地理流向,并招募他们参与Covid-19研究。其形式与该公司以前的研究工作类似,主要是在线问卷,但这一次是针对疫情量身定制的。

这些问题涉及人口统计学——年龄、社会经济地位和种族——以及有关Covid-19的具体问题。例如,他们是否被诊断,是否住院,以及他们如何评估自己的呼吸和其他因素。

总体而言,约有105万23andMe客户响应了这项研究,其中超过1.5万人报告自己被诊断为Covid-19, 1100人因该疾病住院。后一组是特别添加到研究中这样数据就不会太偏向那些能够回答问卷的人,也就是那些感染程度相对较轻的人。这确保了研究涵盖Covid-19应对的所有范围。

血型链接

在数以百万计的数据点的帮助下,研究小组询问是否基因变异可能会改变一个人感染Covid-19的容易程度以及疾病发展的严重程度。

一个特别紧密的联系出现了:决定一个人血型的基因。分析显示,ABO基因与Covid-19检测呈阴性的可能性密切相关。一个人的血型是由一个基因的变异决定的。研究小组发现O型血在感染检测中呈阳性的可能性比预期的要小,这表明,尽管不一定能证明,O型血可以更好地预防这种疾病。

这听起来像是伪科学,但基因对一个人对疾病的易感性有重大影响,包括像HIV-1这样的“大坏蛋”。例如,一种特定的基因类型使人对HIV-1和艾滋病具有天然免疫。假设某些基因类型也或多或少易受一种新病毒的影响是合理的。

23andMe的发现证实了早期的研究,即血型容易感染这种疾病。早在2020年6月,奥斯陆大学医院(Oslo University Hospital)的汤姆·海明·卡尔森(Tom Hemming Karlsen)博士也发现了O型血的保护作用,但研究样本要小得多,而且只针对意大利和西班牙的人。“它们进一步阐明了我们的数据只能隐约暗示的东西,”他说

该研究还确定了3号染色体上的一组基因,这些基因与患者的Covid-19严重程度相关,也就是说,他们是否有可能最终住进医院并出现呼吸问题。这个位置的一些基因与免疫系统有关,研究报告的作者Janie Shelton博士说:“我们正在研究确定具体的行为机制是什么。”

这项新研究的突出之处在于它的多样性。GWAS的研究通常是针对欧洲血统的人进行的,而这些结果是否能适用于其他人群,比如非洲人或亚洲人后裔,仍然是未知数。虽然这项新研究还没有反映出美国的多样性,但其中有“相当多”的人认为自己是黑人(近3%)或拉美裔(约11%)。作为背景,这两个群体在美国人口中的代表性是约13%和18%,分别。

这使得研究小组可以观察不同祖先群体之间的相似性。血型出现在每一个种族群体中,这暗示了一个特别强大的基因联系,无论背景如何,科学家仍然需要了解。此外,该团队还研究了2019冠状病毒病的非遗传风险因素,包括性别、社会经济地位和肥胖。

一个新的GWAS未来

这不是23andMe第一次在研究领域掀起波澜。使用类似的在线调查模型,这家公司已冒险进入帕金森病、睡眠和乳腺癌等方面的研究。消费者基因公司也正在与学术机构合作,分享他们的数据集和方法,以挖掘基因差异如何导致的新见解健康和疾病。

“我赞赏消费者团体将他们的一些资源用于这方面的工作,一切都将是有价值的,”罗伯特·格林博士是哈佛大学布莱根妇女医院的医学遗传学家。

在“数据就是力量”的时代,消费者基因公司正在铺设一条新的研究之路。但是,尽管他们的海量和更多样化的数据集支持GWAS,下一个问题仍然是一样的。为什么?为什么O型血似乎更有抗Covid-19的能力?这不仅仅是学术上的好奇——对于未来的流行病或其他疾病,回答“为什么”和“如何”是识别弱势人群的下一步。

“我们必须找出为什么[基因差异]如此显著——它之所以显著是因为它影响了血液凝块吗?”纽约大学朗格尼大学的詹妮弗·莱特博士引用了论文的早期版本。“除非我们找出其中的差异,否则我们不会针对治疗或[调整]一个风险类别。”

目前,23andMe正在迎头赶上这场大流行。血液与Covid-19易感性之间的联系令人感兴趣,但不会改变治疗方法。然而,随着它的数据库进一步增长,我们可以看到一个新的GWAS图景,由数百万数据点驱动,以极快的速度寻找有罪的基因,为挽救生命的治疗决策提供信息。

图片来源:皮特Pixabay

范雪来,神经科学家,科学作家。她在不列颠哥伦比亚大学(University of British Columbia)完成了神经科学博士学位,在那里她开发了神经退化的新疗法。在研究生物大脑的过程中,她迷上了人工智能和所有的生物技术。毕业后,她搬到加州大学旧金山分校(UCSF)研究让衰老大脑恢复活力的血液因子。她是…

跟雪莉: