我国的高性能计算机从天河2号到神威·太湖之光已经连续三年登顶TOP500榜单三年。在刚结束的世界超算大会SC16上,神威·太湖之光不仅再次位居榜首,其上运行的“全球大气非静力云分辨模拟”应用还获得了“戈登·贝尔”奖,实现了我国高性能计算应用成果在这项超算大奖上零的突破。神威·太湖之光理论峰值性能为125
PFLOPS,运行LINPACK基准的性能达到93
PFLOPS,能效也达到创纪录的6 GFLOPS。这些目前在世界上都是领先的。神威·太湖之光有100万个核有强大的并行计算能力。本次“戈登·
贝尔”奖评选入围的6个项目中有三个是基于“神威·太湖之光”的:“全球大气非静力云分辨模拟”;“高分辨率海浪数值模拟”和“钛合金微结构演化相场模拟”。 所有这三个应用程序扩展到800万个核(接近全系统规模1000万个核)。波模拟和相场模拟应用程序显式方法(如波模拟和相场模拟)持续性能分别达到30和40Pflops次的性能。“全球大气非静力云分辨模拟”的隐式解算器可以扩展到800万核规模性能达到1.5Pflops,
对大规模问题具有良好的收敛速度。这项获得了本届“戈登·
贝尔”奖。“神威*太湖之光”采用的是自主研发的芯片-申威SW26010。
申威SW26010拥有260核CPU,采用28纳米工艺,有35亿只晶体管,芯片面积 600mm2,主频1.5GHz,性能达3TFLOPS。单片能效在10GFLOPS/W以上。
综上所述,我国的高性能计算已经初步形成了从芯片设计到应用的较完整的产业链。在《“十三五”国家科技创新规划》中提出“高性能计算。突破E级计算机核心技术,依托自主可控技术,研制满足应用需求的E级高性能计算机系统,使我国高性能计算机的性能在“十三五”期间保持世界领先水平。研发一批关键领域/行业的高性能计算应用软件,建立若干高性能计算应用软件中心,构建高性能计算应用生态环境。建立具有世界一流资源能力和服务水平的国家高性能计算环境,促进我国计算服务业发展”。为此,在科技部国家重点研发计划中设置了“高性能计算”重点专项“围绕E级高性能计算机系统研制、高性能计算应用软件研发、高性能计算环境研发等三个创新链(技术方向)部署20个重点研究任务,专项实施周期为5年,即2016年—2020年。”
2015年7月29日美国总统奥巴马签署发布行政命令(E.O.)
13702:创建一个国家战略计算计划(NSCI)。目的在于增强美国在高性能计算方面的优势以提高经济竞争和科学发现能力。美国政府通过科技发展计划推行其产业政策提高经济竞争能力已经成为国策。为此美国白宫科技政策办公室发布了一系列计划倡议,NSCI就是其中重要的一个。创建NSCI表面上看是应对来自中国的在高性能计算机方面的挑战,实际上有着更深的战略意义。当前IT业正面临巨大变革,统治计算机和集成电路50年的摩尔定律即将走到终点,后摩尔定律时代即将来临,IEEE成立了“重启计算”计划研究后摩尔定律时代采用非冯诺依曼结构和后CMOS工艺的新算法新机制,发展新一代计算。NSCI的出台是为了应对这一挑战,名称为“战略计算”原因在此。NSCI一方面要沿着More
Moore道路继续前行,基于冯诺依曼结构和CMOS工艺发展E级计算机,另外一方面研究后摩尔定律时代基于非冯诺依曼结构采用后CMOS工艺的新算法新机制发展新一代计算。
E级计算机由美国能源部E级计算计划ECP组织实施。对于E级计算机的目标性能不再是用简单的速度指标来衡量,而是要求比今天的20PFlops的高性能计算机的品质系数高50倍。更关心系统的综合性能。NSCI将高性能计算与大数据融合,寻求开发一个相干的平台用于建模、模拟和数据分析,发展更灵活和可重用的HPC的软件组合。这样不仅可以满足未来仿真计算与实际数据大数据分析结合的需求,更重要的是可以大幅度降低采购和运营成本。
NSCI作为国家计划强调的是“整体政府”行为,各个政府机关要统一配合。
要发挥相关的各个计划(Advanced Manufacturing
Initiative: BRAIN Initiative: Computer Science for All:
Materials Genome
Initiative: National Big Data R&D
Initiative: National Nanotechnology Initiative;Precision Medicine
Initiative)的作用,相互配合密切合作。建立与工业和学术界的公/私 合作伙伴关系。为此,ECP在2019年以前的研究开发阶段发布3个阶段招标书RFP,通过协同设计吸引工业界参加。2014年确定了两项(为期2年):
Fast forward 关注内存,处理器和存储技术和Design
Forward关注全集成系统设计和互联等关键技术。2016年6月进一步发布硬件的Path Foward
招标书RFP,目标是到2019年提出一个目标系统的建议。其中Fastfoward有NVIDIA, IBM ,Intel ,AMD
,WhamCloud等企业参加。参加企业不能关门自己搞而是要参加协同设计。所谓协同就是要来自供应商的专家,硬件架构师、软件堆栈开发者,领域科学家,计算机科学家、应用数学家和系统工作人员共同努力做出明智的关于硬件,软件和下面算法的设计的决定。E级计算的目标系统在并行度,灵活性和能效方面都有很高要求,尤其是能效有可能需要依靠More
Moore的进展,需要采用3D工艺GAA鳍式场效应晶体管和3D堆叠存储器来实现。上述机制保证能够正确地使用最新进展来实现目标机。虽然目前考虑的E级计算机是基于冯诺依曼结构和CMOS工艺,但也不排除使用量子计算或神经功能计算加速器的可能。NSCI的目标和机制提供了这种灵活性。
NSCI另外一个重点是研究后摩尔定律时代基于非冯诺依曼结构采用后CMOS工艺的新算法新机制发展新一代计算。为此与脑计划,纳米类技术计划等相关计划和其他政府机构NSF.DARPA等已经安排的项目在量子计算,神经功能计算,超导计算等方面展开密切合作。发挥整体政府的作用。在这些研究中PPP模式也将发挥重要的作用。
在欧洲,欧共体的云计算倡议中提出发展高性能计算生态系统,以协同设计方式发展两个E级高性能计算机。在日本设立“超级大数据”计划,发展高性能计算机与大数据人工智能融合的系统。一轮全球高性能计算竞争正在全面展开。
我国高性能计算取得了骄人的成绩名列世界前茅,但面在向未来的竞争,仍然面临严峻挑战。E级计算机的目标是1EFLOPS,而功率要控制在20MW以内。这意味着能效还要提高近一个数量级,想要按照目前的技术路线/架构演进、线性扩展达到上述目标是不可能的。而且未来对性能的需求,指标衡量的方法也都在发生变化。
首先要解决“实效”问题。目前TOP500衡量高性能性能的基准是Linpack(最新版HPL
2.0),测量值HPL反映线性方程的计算性能。新的衡量基准是HPCG(高度共轭梯度基准测试),他使用更复杂的微分方程计算方式。Linpack考验超算的处理器理论性能,而HPCG更看重实际性能,对内存系统、网络延迟要求也更高。任何高性能计算机测出来的HPCG性能要比Linpack性能低得多。也有人用HPCG/HPL比率来衡量计算效率。 2016年上半年度的TOP500的HPCG性能榜单,按照Linpack排名第二的中国的天河2号HPCG为0.5800PFLOPS(HPCG/HPL为1.7%)名列第一,相应数值按照Linpack排名第七的日本K/京计算机为0.5544 PFLOPS(5.3%)位列第二,按照Linpack排名第一的太湖之光为0.3712
PFLOPS(0.4%)位列第三。K/京在硬件配置基本不变的情况下通过优化性能不断提高。除了TOP500、HPCG之外,还有一个测试基准 HPGMG(高性能几何多网格基准)为应用科学计算类应用提供更加平衡的机器能力的度量。综上所述,采用不同基准得到的结果是不同的,每种基准只能反应问题的一个方面。为此如前所述美国的E计算计划的目标性能不再是用单项指标来衡量,而是要求比今天的20PFLOPS的高性能计算机的品质系数高50倍。品质系数是由各种不同应用实际使用结果得出。
第二个问题是将高性能计算与大数据融合,开发一个融合的平台用于建模、模拟和数据分析,发展更灵活和可重用的HPC的软件组合。这样不仅可以满足未来仿真计算与实际数据大数据分析结合的需求,更重要的是可以大幅度降低采购和运营成本。进一步还需要与5GNFV的服务器结合,统一的云平台支持高性能计算、大数据分析和5GNFV等各种应用。
第三个问题,最有挑战性的问题是提高能效。未来E级计算级的能耗将控制在20MW,这意味着能效将提高到50GFLOPS/W,较目前要提高8倍。
要在高性能计算效率和能效方面的革命性提升,需要与目前面临的ICT融合,向后摩尔定律时代演进的大趋势结合。新的一轮竞争不只是只围绕高性能计算,而是在更高的层次进行。国家的产业政策就是要通过国家支持的科研计划引导企业适应新的发展趋势,占领制高点,美国提出“国家战略计算计划”的目的就在于此。
我国在《“十三五”国家科技创新规划》中提出:“再部署一批体现国家战略意图的重大科技项目,探索社会主义市场经济条件下科技创新的新型举国体制,完善重大项目组织模式,在战略必争领域抢占未来竞争制高点,开辟产业发展新方向,培育新经济增长点,带动生产力跨越发展,为提高国家综合竞争力、保障国家安全提供强大支撑”,这体现了通过国家支持的科技计划推行产业政策的思路。在国家科技重大专项的实施中也有成功的案例,如03专项对我国移动通信产业的推动。遗憾的是在科技创新 2030 重大项目中没有设立类似“战略计算”专项,而是设立了“量子通信与量子计算机”和“脑科学与类脑研究”两项。这两项很前沿,很重要,在这领域我国基础不错有可能实现突破。但是其层次不够高,现阶段对产业发展影响有限,相反如果设置一个类似“战略计算”的重大专项不但能在促进产业发展上发挥重大作用,“量子通信与量子计算机”和“脑科学与类脑研究”两项也可概括其中。“高性能计算”作为重点专项被安排在在科技部国家重点研发计划中,由于层次不高只能就事论事发展高性能计算。而在目前ICT融合,向后摩尔定律演进的时代,孤立发展高性能计算在激烈竞争中是很难有胜算的。
总体上看在高性能计算方面,目前我国的布局很凌乱,层次不高,在执行上也存在有一些问题。情况如下:
1、
缺少一个类似战略计算的应对IT业变革,从器件到系统全
覆盖,向后摩尔定律时代过度的战略性计划。目前只在“核高基”专项中安排了高性能计算芯片,“高性能计算”主体安排在重点科技项目中层次不够高起不了统揽全局的作用。
2、
在项目执行机制上缺乏“协同设计”。基本上还是各干各
的。“高性能计算”安排总参56所、国防科大和曙光公司三家搞原型系统或关键技术验证系统,基本每家一个封闭系统各干各的。而美国的E级计算计划ECP 采用跨学科的工程方法,软件生态系统、硬件技术和新一代的计算科学应用的开发人员协作参与设计过程称为协同设计。在2019年以前ECP的研究开发阶段发布3个阶段招标书RFP,通过协同设计吸引工业界参加。参加企业不能关门自己搞而是要参加协同设计。所谓协同就是要来自供应商的专家,硬件架构师、软件堆栈开发者,领域科学家,计算机科学家、应用数学家和系统工作人员共同努力做出明智的关于硬件,软件和下面算法的设计的决定。如前所述,要解决能效问题需要采用3D工艺GAA鳍式场效应晶体管和3D堆叠存储器来实现。目前上述三家没有一家能够解决这个问题。
最近负责E级计算计划的美国能源部又计划设立4个协同设计中心("co-design"
center),4年投资4800万美元软件硬件协同提高运算速度和效率。
3、 “基于非冯诺依曼结构,采用后CMOS工艺的新算法新机制
发展新一代计算”基本没有全局安排。在重点研发计划的一些重点专项中孤立安排一些课题,没有全局考虑。
4、
高性能计算与大数据融合没有安排。在国家重点研发计划中
“高性能计算”和“云计算和大数据”两个项目都没有提及高性能计算与大数据融合问题。
5、
各项科研计划间协调配合合作问题。由于缺乏高层次项目统
揽全局,平行的各个项目之间的协作配合很困难。目前与高性能计算相关的各个技术分散在不同项目计划中,协调配合困难。5G
SDN/NFV的基础是云计算/服务器,5G是未来云计算的最大“客户”。在“核高基”重大专项的服务器芯片及重点研发计划“云计算和大数据”中都没有提出要求。
6、
如何充分发挥公/私合作伙伴关系PPP的作用
7、
建立开发环境和生态链
国家的产业政策是通过国家支持的科研计划来引领产业导向发展,如何选择好项目给予足够高的位置和有效的实施手段是至关重要的
加载中,请稍候......