当前位置: 首页 > 新闻 > 国际新闻
国际新闻
重启人类基因组
发布时间: 2015-07-09     来源:

 官方给出的人类基因组图并不能告诉你关于你基因的一切?那么关于基因组图的理论呢?

人类基因计划是人类最伟大的成就之一。但官方在2003年公布的基因组图,被称为“参考基因组”,已不适应目前的局势了。

所以科学家们正在规划一份新的通用的基因组图,结合上百甚至上千人的基因最终创造出一个能体现全人类的基因组图。

现有基因组图的问题是它仅代表了一个人的基因可被观测的一种方式。而新的基因组图,被称为“基因组图表”,或“泛基因组”,将利用数学方法来反应一个人的基因组可能出现的扭曲或转折,只因它周围盘旋着46条染色体。

“这是一项全新的技术,但五年内,每个人都将用到它”,Gabor Marth预测说,他是犹他大学的遗传学家。

该技术所用的数学理论正是图表理论。如果你知道“贝肯数”的游戏,那你对图表理论一定很熟悉了。每个演员是一个节点,如果他们在电影中共同行动,这是一个边缘。该游戏就是要找到达到Kevin的最小的边数。

在图表基因组中,目标将是通过遗传字母路径找到完全匹配你的基因组。每一个可能的路径代表——这是基因组图表的整体思路——它将使对基因组的解释更快,更便宜,更准确。

不超过25万人的基因组曾经被测序,但这一数字每年将翻一番的,因为在儿童医院和癌症中心,基因组测序成为诊断疾病的常规方式。一些人期待,最终每一个新生儿都会有它的解码基因组。

新基因组图表存在的意义正在于准确分辨某一基因组与另一基因组的差别。Marth的犹他实验室是研究基因组图表原型的学术团队之一,而该成果将于6月提交给标准组织。

这里仍存在着商业利益,基因公司——23andMe正在发展基因图表,而像Google这样的公司则对其虎视眈眈,Benedict Paten说,他是加州大学圣克鲁兹分校的研究人员。“每个人都希望拥有代表人类的一个基本的数据结构,”他说。

当前的问题不仅在于它还是有差距,或者说,它包括从十几匿名人士筛选出来的DNA。作为一个由三十亿字母组成人类基因的集合,它不能很容易的用来说明你的不同。

当使用快速机器,将DNA分解成数百万小单位,对一个新的基因组进行测序,麻烦就出现了。要重新装配这些,在无参考的情况下将其一字排开,就像用一个谜箱前面的图画作为指导。但通常情况下,约5%的人的DNA数据不适合任何地方。

David Mittelman­——生物信息学公司Tute Genomics,的首席科学官说,“你与参考基因的差别越大,各部分相匹配的难度就越大,”“你若找不到差别,你也看不到风险。”

这些“另类”的序列,其中许多与人体免疫系统相关,现在有150多个基因和超过360万的遗传字母。但这些脚注并不方便,而且在大多数情况下,很容易被忽略。

在许多情况下,它不会有差别。任何两个人,他们的绝大多数DNA字母是相同的,相似率超过99%。而参照基因组是能够改变基因内部DNA单字母,突出表示最常见的差异。

但它在某些情况下,对标记大段DNA无能为力,如当DNA丢失,增加或排序错乱时。可这些很重要:有的与孤独症相关(参见“解决自闭症之谜”),而另一些似乎是关于我们与类人猿差别的部分。

纽约西蒙斯基金会的首席情报官——Alex Lash,他在Santa Cruz.支援基因组图表的工作,说,在关于是什么使我们成为人类方面该图表显示了相当多的缺点。

Lash说,要建造基因组图表其实面临着高风险,因为数十亿美元都投入在软件和支持当前参考图表的科学努力,人们可能不希望这么做。

基因组图表究竟有多大的进步图表仍有待证明,eniz Kural说,他是七桥基因组学的首席执行官。他的公司已经通过使用DNA资料对70,000人,以及公众的工具进行分析,开发了基因组的图形表示。它正在测试使用使用基因组图表对基因组进行改装有多精确。

Kural说,在数学上描述人类基因组的每一个可能变化所需的数据量,可以适合在闪存驱动器;它只有大约一千兆字节。描述这些变化的意义是一个更广泛的任务,包括数以万计的科学文章。

参与图表方法开发的科学家说,他们希望他们的想法能最终胜出,即使这意味着把由原始人类基因组计划创建到深存储。 “将参考基因附加给每一个人是一种荒谬的事情,” Michael Schatz,他是冷泉港实验室的生物信息学研究人员。“拥有基因组图是一个巨大的里程碑,但现在我们试图超过它,是时候重新启动了。”

Partial

代理服务