加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

大数据推动基因测序产业化

(2014-07-21 15:34:32)
标签:

it

分类: 老鬼制造

在今年2月,叫停所有基因测序后,6月30日,国家食药监总局称,经审查,国家食药监总局批准两款二代基因测序仪和两款检测试剂盒注册。这意味着基因测序临床应用重新启动。基因体检是当前基因测序临床应用最主要的形式。

 

DNA是生物的遗传物质基因是具有遗传效应的基DNA单位基因组是所有基因的总集,包含全部DNA。DNA长链聚合物由以A、C、G、T为符号的四种脱氧核苷酸组成。如果将基因组视为一部书,那么书的所有章节都是用A、C、G、T四个字母写成。基因组测序就是测定DNA分子中A、C、G、T的排列顺序,相当于将遗传信息以四字母组成的文本形式读出。人类基因组测序已在2005年完成,科学界已在人类基因组中发现大量与健康相关的基因。

 

基因体检时首先需提供唾液,采用生物学方法可提取脱落在唾液中的细胞中的DNA,采用基因测序仪测得基因组A、C、G、T的排列顺序,生成数据文件。再将该数据文件与已知数据比对,在体检报告指出受体检者基因组中与健康或疾病相关的基因,并提供健康和医疗建议。第二代测序技术将每基因组测序成本从2001年的9526万美元下降到1000美元。

 

    2007年成立美国23andMe公司是最早的基因测序互联网公司,由谷歌投资,创始人沃西基是谷歌布林的妻子。体检者试管里吐了一口唾沫,盖上盖子,寄往23andMe。两周后会收到邮件:你的基因检测结果已经准备好。用户登录,便看到自己基因组上超过100万个位点的基因信息和所做的分析,包括对259种疾病患病率的风险预测祖先血统分析药物的反应预测等等。23andMe目前已有40万用户,测序价格已从创业时的999美元降为99美元。23andMe被称为“个人健康医疗领域的谷歌”

 

在解决测序成本以后,基因测序服务普及的最大瓶颈在数据处理。完全测序的人类个体基因组数据量为100GB-1000GB。科学界已知有3000个基因与特定疾病相关,大约每5天发现一个新致病基因,对已有致病基因的认识也在不断深化。数据量巨大,数据复杂、数据更新频繁,使得数据存储、解读、及共享已经成为基因测序业面临的最大挑战。而大数据和云计算已成为突破数据处理瓶颈的利器。

 

2011年,谷歌投资美国DNANexus公司,谷歌将和 DNAnexus 一道,利用谷歌的云计算和大数据平台,打造巨大的开放式DNA 数据库,美国国家生物技术信息中心的DNA数据也并入其中。

 

有”基因测序界苹果“之称的美国基因测序厂商Illumina2012年推出基因测序云计算平台——BaseSpace。每用户可免费存储1 TB测序数据、数百次运行结果的数据,用户可根据需要运行云端的基因数据分析应用程序,包括开源和第三方应用程序。Illumina是第二代基因测序仪的领导厂商,其测序仪可以和BaseSpace无缝联接,自动完成数据上传和存储分析。

 

在国内,2012年华大基因宣布了一个自主开发的云服务产品——EasyGenomicsTM。该平台集基因组学领域内的常用的和华大基因特有的数据及参数为一体,结合云存储和高性能计算技术,能够以更低的成本、更高的效率完成大量的基因数据处理及分析。华大基因目前已经拥有212 Flops的峰值计算能力,总内存容量已达到37.2 TB,总存储能力已达到17 PB。

 

老话说“上医治未病”意思是最高明的医生擅长防病。当癌症等重大疾病突然降临,人们往往哀鸣:“为什么是我?”基因测序服务为个性化健康管理提供科学依据。新一代测序技术与大数据、云计算共同发力,使大众”治未病“成为可能,一个庞大的基因测序市场即将形成。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有