书名:数字思维
作者:[葡]阿林多·奥利维拉
书号:9787521711684
格式:pdf-epub-mobi-txt-azw3
出版:中信出版集团
出版日期:1月 2020
大小:7.00MB
语言:中文
基因组测序
早在20世纪50年代早期沃森和克里克完成他们的开创性研究之时,人们就已经了解了DNA的结构及其在遗传学中的作用,但在此后大约20年的时间里,人们却一直无法解码任何生物基因组中的碱基序列。然而,人们从一开始就很清楚,解码人类基因组将给我们带来新方法,可用于诊断和治疗遗传性疾病,以及解决由个人基因组成决定的许多其他问题。
人类基因组测序是在DNA结构被发现后的几十年里开展的一项重要研究活动。1990年,对测定人类基因组序列的兴趣最终促成了人类基因组计划的诞生。该计划由詹姆斯·沃森领导,它的主要目标是测定构成人类DNA的化学碱基对序列,识别并绘制人类基因组中的数万个基因。最初,这项计划预计耗资30亿美元,耗时15年,由美国、中国、法国、德国、日本和英国的遗传学家组成的国际团队来承担测序工作。
1998年,克雷格·温特和他的塞雷拉基因组公司发起了一个类似的但由私人资助的计划,希望以更快的速度和以人类基因组计划的一小部分成本,完成基因组测序工作。两个计划使用的方法不同,但在2001年几乎同时达成了获取人类基因组的第一张草图的目标。
支撑人类基因组测序活动的测序技术,并未在2001年停下其以指数速度发展的势头,这是包括爆炸性发展的数字电路设计在内的其他任何领域都无法相提并论的。测序技术的迅猛发展促使基因组测序项目数量激增,21世纪初,完成全基因组测序的物种数量急剧增加。
测序技术的发展速度甚至超过了微电子技术。在人类基因组计划启动之时,DNA测序的平均成本是每个碱基对10美元。2000年,该成本降为原来的1%,此后也在不断下降(图7–1)。2015年,每个碱基对的测序原始成本约为10–6美分,并且继续下降,只不过降速比以前慢了。人类基因组计划的预算为30亿美元(每个碱基对约为1美元)。2007年,沃森在他自己的基因组测序中使用了一项新技术,共计花费200万美元。这个成本看似高昂,但它还不到人类基因组计划预算的千分之一。在我撰写本书时,人类基因组测序的成本正在接近1 000美元这个人们追求已久的目标。在15年里,每个DNA碱基对的测序成本降至原来的20万分之一,年下降速度超过50%,大大超出了摩尔定律预测的成本下降速度。根据摩尔定律,每两年成本就会减半。
尽管人们对用于测定DNA特定链中的特定碱基序列的方法越来越感兴趣,但在发现DNA之后的几年里,测序技术的起步速度非常慢。从发现DNA双螺旋结构到发明第一种测定DNA碱基序列的实用方法,历经了20年时间。由于不可能直接观察DNA链上的碱基序列,所以必须诉诸于间接的方法。在早期使用的方法中,最实用的一种是双脱氧链终止法,我们现在称之为桑格–库森法。这种方法依据的基本原理是,先利用特定的分子使脱氧核苷酸(DNA的基本成分)溶液中的DNA链终止生长,然后根据大小将DNA序列分解开,使读取碱基对序列成为可能。该方法先通过一个叫作变性的过程获得单链DNA,变性就是用加热的方式将DNA的双螺旋拆分为两条单链。然后,以单链DNA为模板,通过4个独立的物理反应,向其中添加A、C、T、G这4种标准的DNA脱氧核苷酸,从而创建出新的双链DNA。每个反应不仅会使用标准的脱氧核苷酸,还会使用一种经过修饰的脱氧核苷酸(即双脱氧核苷酸)溶液,后者有终止双链DNA生长的属性。每种链终止子都会附着在单链DNA的某个特定碱基(A、C、T或G)上,阻止DNA双链进一步生长。之后,让DNA单链流经凝胶,因为不同大小的DNA片段在凝胶中的流动速度不同,所以它们被分解开来。最后,根据DNA片段在凝胶中的位置,我们就能读出原始DNA片段中的碱基序列。