大数据推动基因测序产业化
(2014-07-21 15:34:32)
标签:
it |
分类: 老鬼制造 |
在今年2月,叫停所有基因测序后,6月30日,国家食药监总局称,经审查,国家食药监总局批准两款二代基因测序仪和两款检测试剂盒注册。这意味着基因测序临床应用重新启动。基因体检是当前基因测序临床应用最主要的形式。
DNA是生物的遗传物质,基因是具有遗传效应的基本DNA单位,基因组是所有基因的总集,包含全部DNA。DNA是长链聚合物,由以A、C、G、T为符号的四种脱氧核苷酸组成。如果将基因组视为一部书,那么书的所有章节都是用A、C、G、T四个字母写成。基因组测序就是测定DNA分子中A、C、G、T的排列顺序,相当于将遗传信息以四字母组成的文本形式读出。人类基因组测序已在2005年完成,科学界已在人类基因组中发现大量与健康相关的基因。
基因体检时首先需提供唾液,采用生物学方法可提取脱落在唾液中的细胞中的DNA,采用基因测序仪测得基因组中A、C、G、T的排列顺序,生成数据文件。再将该数据文件与已知数据比对,在体检报告指出受体检者基因组中与健康或疾病相关的基因,并提供健康和医疗建议。第二代测序技术将每基因组测序成本从2001年的9526万美元下降到1000美元。
在解决测序成本以后,基因测序服务普及的最大瓶颈在数据处理。完全测序的人类个体基因组数据量为100GB-1000GB。科学界已知有3000个基因与特定疾病相关,大约每5天发现一个新致病基因,对已有致病基因的认识也在不断深化。数据量巨大,数据复杂、数据更新频繁,使得数据存储、解读、及共享已经成为基因测序产业面临的最大挑战。而大数据和云计算已成为突破数据处理瓶颈的利器。
2011年,谷歌投资美国DNANexus公司,谷歌将和
有”基因测序界苹果“之称的美国基因测序厂商Illumina于2012年推出基因测序云计算平台——BaseSpace。每用户可免费存储1
在国内,2012年华大基因宣布了一个自主开发的云服务产品——EasyGenomicsTM。该平台集基因组学领域内的常用的和华大基因特有的数据及参数为一体,结合云存储和高性能计算技术,能够以更低的成本、更高的效率完成大量的基因数据处理及分析。华大基因目前已经拥有212
老话说“上医治未病”意思是最高明的医生擅长防病。当癌症等重大疾病突然降临,人们往往哀鸣:“为什么是我?”基因测序服务为个性化健康管理提供科学依据。新一代测序技术与大数据、云计算共同发力,使大众”治未病“成为可能,一个庞大的基因测序市场即将形成。