加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

计算机的峰值速度

(2015-01-09 11:29:12)
标签:

股票

分类: HPC

在超级计算机测试中,我们会碰到RmaxRpeak两个值。

以我国天河二号超级计算机为例,Rmax值为33,862.70tflop/s ,Rpeak值为54,902.40tflop/s

很多朋友可能会不知道它们的详细意思。

rmax和rpeak在英文词汇中,都不存在这个词汇。我们要讲的是它们作为缩写,在linkpack中的意义。

Linpack是最流行的用于测试高性能计算机系统浮点性能的测试软件。通过用高斯消元法求解N元一次稠密线性代数方程组的测试,评价高性能计算机的浮点性能。

而Rmax和Rpeak是linpack软件提供的两个参考值。

她们的单位为:flop/s或者tflop/s,分别对应:每秒浮点运算次数和每秒万亿(10的12次方)浮点运算的次数

Rmax - Maximal LINPACK performance achieved  linpack实际测试中达到的最大性能

Rpeak - Theoretical peak performance 理论最大性能。由理论推算出来的性能,不可能达到。

计算机的峰值速度通常是指其理论峰值速度,其计算公式是:

理论峰值速度(亿次)= MHz x 每个时钟周期执行浮点运算的次数 x CPU数目

其中MHz是指CPU的主频,每个时钟周期执行浮点运算的次数是由处理器中浮点运算单元的个数及每个浮点运算单元在每个时钟周期能处理几条浮点运算来决定的。

以IBM POWER4为例,每个POWER4的处理器有两个浮点运算单元,每个浮点运算单元在一个时钟周期内可以同时处理一个加法和一个乘法的操作。所以如果处理器的主频为1.7GHz(POWER4+),那么该处理器的峰值速度为:

1.7G*2*2=6.8Gflop/s,或68亿次/秒。

对于满配置的IBM p690来说,该系统的峰值速度就是:

1.7G*2*2*32=217.6Gflops,或2176亿次/秒。

 

不同的处理器每个时钟周期能执行浮点运算的次数不同。在市场中常见处理器的情况如下:
每个时钟周期能执行浮点运算的次数:

IBM Power4           4
HPQ PA-RISC          4
HPQ Alpha            2
SUN Ultra-Sparc      2
SGI MIPS             2
Intel Itanium        4
Intel Pentium        1
Intel Xeon           2

 

峰值速度在一定程度上能够反映处理器的性能,但并不能代表计算机的实际运算能力。为此许多组织试图用一些标准的程序来测试计算机的运算速度,其中LINPACK以其使用简单、适用性强等特点被广泛地用于评价计算机的实际峰值运算能力。虽然这些指标并不反映给定系统的全部系统性能,但可以作为对系统理论峰值性能的一个修正。

http://blog.sina.com.cn/s/blog_68357baf0100ux3l.html

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有