整个AI行业的两条生死线--AGI征程的感受和思考(徐立)
核心观点:1、两个关键要素:完备的基础设施建设+技术深入应用场景
2、两条生死线:算力供给的成本线+开源模型的性能线
3、未来AI行业百花齐放的需要实现一个目标:计算资源平权
4、LLM和垂直行业应用,都还只是前奏,未来会迎来AGI的“超级时刻”
5、真正通往广泛智能的路线(AGI),很可能不会局限于人类的视角和能力
一、两个关键要素:
所有红利最前面是认知的红利,对新技术认知的快速迭代,是推动时代进步的基础要素。第一条关键要素是基础设施发展要素,这为行业向前走提供了核心支撑。第二条要素是:无论技术再通用,再基础,“场景化”始终是技术走向大众,实现真正意义上商用的关键核心(破局点)。
二、两条生死线:
整个行业的两条生死线。AI 1.0与2.0时代最大区别在于资源的侧重:
AI
1.0时代是人力密集型,重点在人才招揽,计算成本占公司比例不足5%。
AI
2.0时代计算成本达到95%,人力只占5%。
所以,AI
2.0时代如何高效的利用基础设施?我们提出“三位一体”---大装置、模型和应用的无缝集成。AI
2.0发展的核心路径:1、场景化(驱动力) 2、模型研发是驱动基础设施建设的核心动力。
现在做AI,行业存在两条生死线:
1.算力供给的成本线。(从业者何时进入尤为关键,什么时间节点投入、投入的资源是否能够沉淀为持久的价值?)
2.开源模型性能线。(开源是从事基础设施建设或者硬件销售公司的必经之路,好比英伟达,他们将所有过程、数据、细节开源)
一般有3类开源玩家:
A.基础设施提供方:开源目标是让客户掌握这项技术,然后通过销售硬件或服务(比如算力或者模型的调用)获利。
B.内容平台:生成式AI越多生成内容,平台的内容生态就越丰富,平台价值就越高。(类比公司:META,Facebook,Instagram等内容平台)
C.创业公司:这类公司在有限的资源下,将开源作为快速提升行业影响力的路径,
吸引投资者。
当然,也有企业投入不够,无法开源,那就必须通过差异化路线,为行业提供独特价值,比如以行业应用的垂直领域为切入点,通过差异化模型发展,包括差异化的场景数据发展,推动行业的变化。
商汤的定位是:1.既要完成基础模型的迭代(A+B)
2.又要为行业客户提供差异化的价值。
商汤的目标是:
以同等甚至更低的成本,为市场提供优质的计算资源和模型使用。
三、未来中国的AI行业应用需要实现一个重要目标:计算资源平权。
训练基础模型是少数企业的责任,但是使用大模型一定是百花齐放,所以使用模型需要的计算资源必须要高性价比,才能推动行业的发展。但是我们现在面临很多挑战(连接硬件技术的难题、国产化能力的限制),如何解决这些问题,是商汤“三位一体“战略转型中深入思考的问题。
大模型、大装置、场景应用的“三位一体”,目前这三个要素的成熟度如何?
目前来说,计算成本占据了极大的比重,无论是训练还是推理环节都是如此。
关于Scaling Law(尺度定律),在不同领域经历了三次验证时刻:
1.大语言模型上的应用:在Scaling
Law提出前,AI领域普遍认为小数据、小模型的算法在大数据大模型上效果不好,即资源多性能不一定好。但是Scaling
Law在大语言模型中的应用显示:算力资源跟模型性能正相关,即资源越多越好。
2.跨模态的适用性:传统AI领域,算法跨数据、跨模态时容易失效。但Scaling
Law在像Sora、4o等跨模态系统中也能应用,拓宽了应用范围。
3.推理时间上的Scaling Law:在单一模型Scaling
Law发展节奏放缓的情况下,发现推理时间越长,模型性能越容易提升,为模型性能提升提供了新的增长途径。
这三次验证时刻说明,算力资源在整个链路中扮演的核心商业角色。
模型本身的架构和设计直接决定了计算资源的配置和使用。算力、模型、应用三大要素中,大模型是贯穿上下的核心纽带,既牵动上层应用的发展,也影响着下层计算资源的配置。而计算资源的优化和投入,则是决定整个商业模式能否实现闭环的关键所在。
怎么赚钱?
在走向AGI的过程中,要有成熟的商业化变现模式。对于商汤来说,三位一体的方式将计算成本降得更低,一旦迭代完成,就能获取到足够的市场份额,实现客观商业回报。因为当前无论是模型服务还是应用服务,最后都等价于计算资源的变现。在中国,资源变现的模式相对成熟。
(关于商业模式,还有个有趣现象,国外的一个标准化软件可以长期保持固定价格,中国却不行,需要加入更多的服务,甚至贴身化的定制开发,这是认知上的差异,必须理解这点。)
四、AGI的超级时刻
什么事情的发生可以确认超级时刻的到来?
关键在于大众对事情的认知发生了重大转折。我认为超级时刻与应用是强绑定关系的。
在通用人工智能时代,不管是LLM还是垂直行业的应用,可能都只是一个前奏,随着技术的发展,我们对于世界本质的理解以及基础科学探索的突破,可能会迎来AGI的“超级时刻”!
五、关于AGI的未来
问:在你心目中,AGI是什么?它的实现可能有哪几个阶段?我们现在处于哪个阶段?
答:给AI下定义时,图灵没有给出明确的定义,而是采用了一种判别式的方法:如果无法区分对面的是人还是机器,就认为它具有智能。(图灵测试)
直到今天,AGI的定义逻辑依然类似:我区分不开它到底是人干的还是机器干的,它就叫AGI。只不过早期的图灵测试只针对单一任务,而现在的AGI测试扩展到了更多任务和更广泛的应用。
真正通往广泛智能的路线,很可能不会局限于人类的视角和能力。未来智能的发展方向未必是线性的,甚至可能与现在的方向完全相反。但这并不妨碍我们利用现有技术推动当下的进步,实现一个百花齐放的时代。
加载中,请稍候......