五家大模型企业CEO论AGI

标签:
杂谈 |
分类: 雜感 |
五家大模型企业CEO论AGI
李开复(零一万物CEO):做AI,GPU这么昂贵,如果能把一张GPU当做两张、三张来使用,任何公司都会得到好处。还要考虑系统化地做数据工程,数据筛选非常重要。
杨植麟(月之暗面CEO):“大模型需要不断提升模型的规模,本质上是一个压缩,压缩产生智能。”更多算力、数据,模型参数变大,模型就能持续产生更多智能。关键在于如何高效地实现Scaling Law(比例定律:组成部分的数量如何随着整体大小的变化而变化)。
张鹏(智谱AI CEO):早期关注的是参数量规模,现在扩展到参数量、数据量、数据质量,变成一种计算量。机器的能力远不止人的水平,在AGI里不断更新AGI的内涵和外延。
王小川(百川智能CEO):寻找算力、算法、数据等范式上的新转化,而不只是简单变成知识压缩,“走出这个体系(算力、算法、数据)才有机会走向AGI。”与AGI等价的是AI能否造出医生,人造医生就是AGI。做到医生是否就算做到AGI了?
李大海(面壁智能CEO):“随着模型能力的提升,大模型能够把边际成本一直往下降,可能会逼近于零,低到接近于零的时候,AGI基本就到来了。”“当有一天达到AGI,还要把大模型小型化。如果用一个10万亿参数的模型做到AGI,能否把参数降到1万亿、1000亿,这需要持续突破。”
张亚勤(清华智研院长):相比只有3斤重、能耗20瓦的大脑,当前大模型决策效率低。不管是微软、OpenAI还是当前的主流大模型,仍处于采购英伟达芯片的阶段,只有提高大模型效率才能建立真正的商业模式。未来5年会有一个全新的架构替代现在的Transformer和Diffusion架构。(2024-6-15老邓)