加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

大模型肇启

(2023-11-16 15:17:57)
标签:

杂谈

分类: 雜感

大模型肇启

大模型肇启

一、

ChatGPT的横空出世,在全球掀起了生成式AI热潮。

英伟达NVIDIA)创始人黄仁勋说,无法辨别自己是猎人还是猎物时,奔跑就好了。

三十年前,因为看到游戏市场,对3D图形处理能力的需求,黄仁勋和其他两位合伙人,共同创建了英伟达。

2003年,英伟达开始对传统GPU(图形芯片)进行优化设计,旨在利用GPU的计算能力,在非图形处理领域进行更通用的科学计算。

黄仁勋将深度学习和GPU的相遇,形容为“命运撞上了一点运气”,开发了一种非常擅长处理数据,且有高通量计算能力的处理器,这恰恰使深度学习成为可能。

2016年4月,英伟达发布了首款深度学习超级计算机DGX-1,“为了计算和人类的未来,我捐出世界上第一台DGX-1。”捐赠时年名不看经传、日后赫赫有名的OpenAI。正是基于 NVIDIA DGX 系统,OpenAI训练出了ChatGPT。

二、

算力是机器学习得以不断突破极限的基础。黄仁勋在2021年,推出的A100芯片,需要7天完成的训练;2022年,面市的H100上仅需20个小时。

2006年,为了推广GPU通用计算,英伟达开发了,用于加速并行计算的软件、开发平台CUDA(用于GPT通用计算)。CUDA可以帮助开发人员,更便捷地利用GPU加快,计算应用程序的速度。

十几年来,CUDA逐渐渗透到包括AI在内的,各个通用计算领域,实现了从硬件层到软件层的打通,且基于海量客户,不断实现性能优化。

“数据、算法、算力是人工智能的三大核心要素。生成式人工智能的繁荣,建立在算力基础上,训练大模型无疑是昂贵的。一些大模型初创公司,前脚筹集了数十亿美元的风险投资,其中的八九成转身便被投入购买算力(CUDA)。CoreWeave(美国核心超算网)此前的主要业务是加密货币挖矿,如今面向市场提供,从英伟达定购GPU用于租赁服务。

三、

1963年,黄仁勋出生在台北,9岁的黄仁勋和哥哥,被父亲送到美国投奔叔叔。年少的黄仁勋没有因此颓靡,而是找到了适合自己的生存之道。在俄勒冈州立大学,学习电气工程期间,在餐厅兼做服务员。从斯坦福大学硕士毕业后,黄仁勋先后在AMD、LSI Logic工作。

1993年,黄仁勋30岁生日那天,他和两位好友决定离职创业,从合作方处力争来的资金,斥资100万美元买下一台模拟机,换来了反复测试的机会。RIVA 128(图形显卡)最终顺利面世,专门用于微软游戏编程接口DirectX、可支持32种图形渲染模式。凭借低廉价格,备受制造商喜爱。

2020年,英伟达首超英特尔,成为美国市值最高的芯片厂商。

在黄仁勋看来,创业和人生一样,是“荣耀”和“悲剧”的永恒交替,成功的关键是当事情没有按预期发展时,你是否能正视错误、及时纠错、谦卑求助并持续向前。(2023/11/16老邓

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有