释放的草稿人类基因组序列2001年是我们对人类基因组的理解的地震时刻,并为我们对人体生物学和疾病的基因组的理解铺平了道路。

但部分留下了未追断的,一些序列信息不正确。现在,二十年后,我们有一个完整的版本,作为预印出版(尚未经过同行评审)由一个国际研究人员联盟进行。

由于技术上的限制,人类基因组的原始草图只覆盖了基因组的“全染”部分,即92%的基因组,大部分基因都在这里被发现,在制造RNA和蛋白质等基因产物时最为活跃。

新更新的序列在大多数剩余间隙中填充,提供了我们的DNA代码的完整3.055亿基对(“字母”)。此数据已公开可用,希望其他研究人员将使用它进一步研究。

为什么需要20年?

许多新测序的物质是基因组的“异色”部分,它比单色基因组“紧密排列”,包含许多高度重复的序列,很难准确阅读。

这些区域曾经被认为不包含任何重要的遗传信息,但现在已知它们包含了参与基本重要过程的基因,如胚胎发育期间器官的形成。在2亿个新测序的碱基对中,估计有115个基因被预测与蛋白质的产生有关。

人类基因组的完成有两个关键因素:

1.选择一个非常特殊的细胞类型

使用从称为完整的非常罕见的组织衍生的人体细胞产生新出版的基因组序列瓦湿鼹鼠,当受精卵失去所有遗传物质时发生的遗传物质。

大多数细胞包含每个染色体的两个副本,一个来自父母双方,一个来自父母双方的染色体,每个染色体贡献不同的DNA序列。一个来自完整的葡萄胎的细胞只有父亲的两个染色体副本,而且每对染色体的基因序列都是相同的。这使得完整的基因组序列更容易拼接起来。

2.排序技术的进步

经过几十年的冰川进展,人类基因组项目通过开创了一种称为“霰弹枪测序”的方法实现了2001年的突破,其中涉及将基因组分成约200个碱基对的非常小的碎片,在细菌中克隆它们,解密它们的序列,然后像巨型拼图一样拼合它们。

这是原始草案仅涵盖了仅基因组的欧洲区域的主要区域可以使用该方法可靠地对这些区域进行可靠地进行测序。

使用两种互补的新DNA测序技术推导出最新序列。一种是由PACBIO开发的,并且允许更长的DNA片段以非常高的精度测序。由牛津纳米孔开发的第二种,产生超长延伸的连续DNA序列。这些新技术允许拼图碎片达到数千次甚至数百万的基对,使其更容易组装。

新信息有可能推进我们对人类生物学的理解,包括染色体如何运作和维持其结构。它还可以提高我们对遗传条件的理解,例如具有潜在染色体异常的唐氏综合症。

现在是基因组完全测序的吗?

好吧,没有。显而易见的遗漏是Y染色体,因为用于编译该序列的完全浑浊摩尔细胞含有两个相同的X染色体拷贝。然而,这项工作正在进行中,研究人员预计它们的方法也可以准确地序列,尽管它具有高度重复的序列。

尽管测序人类细胞的(几乎)完整的基因组是一种极其令人印象深刻的地标,但它只是对人类遗传多样性充分理解人类的几个关键步骤之一。

下一步工作是研究各种群体的基因组(完整的瓦尔膜细胞是欧洲)。一旦新技术已经成熟,常规地用于序列许多不同的人类基因组,从不同的人群中,将更好地定位对我们对人类历史,生物学和健康的理解产生更大的影响。

需要进行护理和技术的发展,以确保通过全面了解人类基因组的多样性,以防止通过限制对特定人群的发现来防止卫生差异的加剧。谈话

本文转载自谈话在创造性的公共许可证下。阅读来源文章

图像信用:arek socha/Pixabay

Melissa C. Southey教授,BSEY(荣誉,病理),Graddip(法律),是一个分子遗传学家(FHGSA),澳大利亚皇家病理学家(FFSC,RCPA)科学学院的创始人遗传学家。她是蒙纳士大学新生物管理总监维多利亚州的蒙纳士卫生学院临床科学学院的精密医学学院的临床科学学院。
蒙纳士大学高级研究员