加载中…
个人资料
欧阳冰痕2006sun
欧阳冰痕2006sun
  • 博客等级:
  • 博客积分:0
  • 博客访问:102,155
  • 关注人气:0
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
正文 字体大小:

由GPU驱动的数据科学增强了NASA的太阳图像分析能力

(2020-07-06 17:18:57)
美国国家航空航天局(NASA)的太阳动力学天文台仔细观察太阳的变化,希望能更好地了解太阳的变化如何影响地球和附近的空间。但是,数据量惊人。太阳动力天文台每1.3秒拍摄一次太阳图像,每天产生超过60,000张图像,到目前为止,已经积累了超过18 PB的数据,足以填充大约18,000台标准笔记本电脑的硬盘。现在,基于GPU的高性能数据科学工作站正在帮助筛选那片太阳数据。

NASA使用一种算法对太阳数据进行分类,从而以很高的精度消除了诸如坏像素之类的错误。但是,在1.5亿张图像中,数十亿像素最终被算法误分类为“不良像素”,这阻碍了NASA的研究。NASA发现自己在计算上遇到了瓶颈,整年都在寻找CPU筛选所有文件。

“对于科学家来说,一年仍然是不够的,因为我们想探索和迭代发现的结果,”美国宇航局戈达德太空飞行中心的太阳天文学家拉斐尔·阿蒂(Raphael Attie)说。“即使经过一年的计算,我们仍然要花十年的时间才能找到具体的结果。”

因此,研究人员转向了GPU驱动的工作站:特别是Z by HP数据科学工作站,每个工作站都配备了两个Nvidia的Quadro RTX 8000 GPU。根据HP的说法,Z工作站能够在毫秒内与多达50亿个数据集行进行交互GPU服务器租用。突然之间,NASA一项长达数年的任务隐约可见,不到一周的时间就产生了结果。

“数据科学工作站完全改变了我们的可能性领域,” NASA的天体物理学家Michael Kirk说。“这些以前无法想象的计算,现在我们可以比我们想象的快10-150倍。”

由于可靠性方面的考虑,研究人员选择在云环境上使用本地工作站,目的是避免数据分析中的工作流中断。

“我发现响应式工作流程的必要条件是让GPU设备快速访问输入数据,” Attie说。“如果不可能将数据本地存储在与GPU设备相同的机器上,则网络需要非常快速和灵活,因为AI应用程序通常需要快速访问数据。”

研究人员仍在努力完成对18 PB太阳图像中“不良像素”的过滤和分析,但他们已经制定了未来计划。接下来,团队将执行与当前过程相反的操作:分析标记为“好像素”的像素,以检查误报,而不是误报。

0

阅读 评论 收藏 禁止转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有