忆非典时期对付sars的新药开发
标签:
sars病毒全基因组新药印度洋杂谈 |
分类: 夕花今撷 |
(作者姜洪军,原文刊登在《中国计算机用户》周刊上的《高性能计算机为人民服务》,本文是其中一部分)
2005年1月9日晚,记者参加在首都体育场举办的为印度洋海啸赈灾义演。一个外地来京打工兄弟在台上谈及捐款时的想法,这个憨厚的西北汉子拘谨地连说了两遍:“一方有难,八方支援。”这句话一下子把记者的思绪拉回到同样语境的2003年的非典时期。
在非典肆虐初期,记者在京城继续穿行完成自己本职工作的同时,心里也不免忐忑,期盼医疗和科研机构能早日撩开这疾病的面纱,并早日开发出对付sars的新药。后来华大基因完成sars病毒全基因组序列组装和分析,并完成临床检验试剂盒的研制。记者当时记住了华大基因的名字,也知道在华大基因成功的背后,一定会有高性能计算的身影,于是心里一直挂着这件事,这次专题报道使记者得以有机会梳理一下两年前漏过的细节。
当时,华大基因sars病毒测序项目的高效率完成,从立项到出成果只有两周时间,在很大程度上得益于一个高速运转的高性能运算环境,而在这些运算后面起支撑作用的就是高性能计算设备,这对sars病毒全基因组测序起到的关键性的作用。
当时的研究工作是从病毒取样开始,而当样品从测序仪上拿下开始,其余的分析、拼接、比对等工作都必须在具有高性能计算的服务器上进行。在非典的高峰期,这些服务器每天处理的基因组和蛋白组的原始数据高达60到70个g,分析后这些数据还要翻好多倍并需要储存起来。由于当时sars病毒测序非常迫切,所有的机器都是满负荷地运转,cpu和内存都发挥到极至,这对服务器的速度、存储能力、稳定性还有安全性是一次极限的考验。
正是由于高性能计算环境的高速、稳定的支持,华大基因在2003年5月6日就完成1株冠状病毒的全基因组测序。sars病毒全基因组测序对于确定sars病原,分析病毒转播和发病机理具有重要意义,还为开发诊断试剂、疫苗和预防治疗药物提供重要信息。
此外,人类基因组“中国卷”的研究过程中,华大基因也利用高性能服务器完成了人类基因组草图1%的任务。华大基因的诸多基因组学项目,如大规模基因组序列的组装和拼接、基因预测、基因组注释等与基因组学相关的工作以及与不同物种间基因组的比较、功能分析等,都需要高性能计算做后盾。
高性能计算不仅在基因分析上功绩卓著,在开发新药上也崭露头角。华北计算技术研究所魏梓栋高级工程师告诉记者,目前许多大型药厂和科研院所都在采用高性能计算作为开发新药的支撑。记者简单地查询了一下,中科院上海药物研究所、北京摩力可药业有限公司就有自己的高性能计算设备。
新药研制的核心之一是从大量的化合物样品库中发现有药理活性的化合物。通常从10000个化合物中筛选出有药理活性的化合物不到1个。只有建立庞大的供筛样品库,才能保证新药可以源源不断地开发出来,保证新药研发的可持续发展。国际上大医药公司通常有几十至上百万的化合物实物样品库,即使如此,一种新药从化学家头脑里的一个想法,到最后送到患者手中,一般要经历10到15年的时间,科研经费要8亿多美元。
随着竞争越来越激烈,只有花钱少、出结果快的公司才能生存下来。在这种情况下,必须利用高性能计算。高性能计算机可以同时模拟上万个化学反应,相当于一个万人实验室在工作,缩短了新药开发的时间。而我国可用于药物筛选的化合物相对缺乏,这会影响新药发现进程,利用高性能计算进行虚拟药物筛选是一条崭新的途径。
采访完,记者坐有电视的公交车回报社时,电视上正播放着我国向印度洋海啸受灾地区捐助药品的新闻,装卸车将一箱箱药品运上飞机。

加载中…