《Science》发布重大研究成果—PacBio单分子实时测序技术打造高质量大猩猩基因组-自主发布-资讯-生物在线

《Science》发布重大研究成果—PacBio单分子实时测序技术打造高质量大猩猩基因组

作者:天津生物芯片技术有限责任公司 2016-04-05T13:26 (访问量:3741)

Science》发布重大研究成果—PacBio单分子实时测序技术打造高质量大猩猩基因组

最新一期的Science杂志封面文章报道了采用PacBio单分子实时测序技术重新打造大猩猩参考基因组的研究。

来自University of WashingtonUniversity of California at Santa CruzWashington University的研究者与Pacific Biosciences公司合作,采用PacBio单分子实时测序技术(single-molecule real-time sequencing, 简称SMRT) 的长读长reads组装了全新升级版的大猩猩基因组。研究成果发表于最新一期的《Science》杂志封面文章。

该团队使用PacBio SMRT测序技术重新审视西部低地大猩猩,Gorilla gorilla gorillaDNA来自于一只名为Susie的雌性大猩猩。第一次发表的大猩猩基因组,采用短读长和Sanger测序数据,使用的DNA来自于一只名为Kamilah的雌性西部低地大猩猩,并首次报道与2012年的《Nature》杂志。

研究者称,他们可以填补大部分被认为存在于最初拼接结果中的丢失掉的参考外显子序列,同时提高了基因组拼接的整体连续性,包含更少更长的contigs

本文通讯作者,华盛顿大学的基因组科学研究者,Evan Eichler,在评论中提到:“作为医学研究人员,如果我们依靠短读长序列,就像我们的盔甲出现了裂缝。在大猩猩和人类基因组上的工作清楚证明了大片段的基因组变异是无法通过短读长的方法去发现的。长读长序列正在使我们可以达到以往难以企及的基因组变异研究的全新高度”。

正如早期的大猩猩基因组版本一样,人们希望升级版的“Susie3”组装结果可以作为资源用于研究大猩猩生物学,灵长目动物进化,与人类和其他灵长类动物区别的特征,比如语言能力,疾病易感性等等。

使用PacBioSMRT测序和最新的P6-C4试剂,研究人员得到了Susie基因组DNA75×覆盖率的数据,使用FALCON软件和已有的Quiver算法进行de novo 组装和纠错。

利用长读长进行de novo组装而非简单的将序列与人类参考基因组比对,可以填补序列缺口以及更细致的查看结构变异,重复序列以及逆转座子。

研究人员仍然遇到令人头疼的异染色质区,棘手的连续的片段重复序列,其中往往含有较短的组装contigs。但整体的组装效果看上去比最初的gorGor3参考基因组更加连续和完整。

在原来的大猩猩基因组组装结果中,最长的contig只有192kb,而最新报道的三代测序组装结果中,Susie3基因组中则包含超过36.2M个碱基的contigsContigs的数量从464,000个大幅下降至16,100个。

整体上,当把contigs排列到基因组中时,新的基因组变得更大,达到29亿个碱基,而原来只有27亿个。尽管如此,研究团队可以填补或缩小曾在gorGor3组装结果中存在的434,000个序列缺口中的90%以上。在gorGor3基因组中,被丢失掉的外显子中有87%被重新找回。

目前在他们的基因组分析中,研究人员获得了关于大猩猩种群历史的新线索,更详细的基因注释以及大猩猩基因组中的调控元件,发现了人类和大猩猩基因组中的差异序列,包括那些编码感知器官,皮肤角蛋白,免疫力,代谢及其他途径相关的组件的序列。

该团队还同样注意到,随着其他草图基因组组装(包括黑猩猩基因组)被更新,改善以及更多的注释,还会出现更多其他的进化和生物学线索。

Eichler和他的同事评价说:“这种方法将可以让常规的哺乳动物基因组组装达到人类参考基因组现有质量的水平。”

第三代测序技术也称为单分子实时测序技术。美国PacificBiosciences公司是目前唯一正式商业化的第三代测序仪厂商,已在全球范围内为多个基因组学中心提供PacBioRS II测序仪,并于201510月推出新产品Sequel测序仪。PacBio测序具有超长读长(平均读长10-15Kb,最长读长可超过40Kb)、无PCR扩增偏差的单分子测序、直接分析碱基修饰等技术优势,已经快速应用于基因组denovo组装、转录组学研究等领域,随着性价比的不断提高,第三代测序技术将在未来的2-3年内快速普及。
2013年天津生物芯片国内率先提供PacBioRS II三代测序服务,天津生物芯片已积累丰富的项目经验,目前应用该平台产出的各项结果均在国内遥遥**。其中,测序读长可达42Kbreads N50高达18Kb,每个SMRT Cell的数据量最高达1.4Gb

天津生物芯片技术有限责任公司 商家主页

地 址: 天津经济技术开发区宏达街23号

联系人: 王小姐

电 话: 022-66229515

传 真: 022-66226985

Email:tjbiochipmk@126.com

相关咨询
ADVERTISEMENT