从中国走向全球:DeepSeek潜入寻常百姓家
(2025-03-23 12:00:00)分类: 军事与科技 |
从中国走向全球:DeepSeek潜入寻常百姓家 AI人人可亲
2025-02-21
中国人工智能“深度求索”(DeepSeek)的诞生震惊全球,科技专家乐见高科技降低门槛,让中小企业以较少的资源发展科学和经济,个人也可改善生活。
2025年1月20日,中国“深度求索”(DeepSeek)选择在美国总统特朗普就职当天,发布一款开源的推理模型R1,性能可媲美OpenAI的o1模型。撼动了全球AI竞赛的格局。
推理模型,指具备推理能力的大语言模型。在面对复杂任务场景时,它可以通过推理生成答案,且能通过后训练提升模型性能。
推理模型其实始于OpenAI去年12月发布的o1模型,不过o1是闭源的,付费使用。DeepSeek
R1则是免费使用,并给大家看它的推理方式,因此引起极大关注。
开源的好处:可以检视推理过程,修正问题。如果出错,方便查找。如推理表现很好,可以把知识转移到较小模型中【蒸馏】。
大型语言模型做推理是困难的技术问题。其次是模型效率。
由于受到美国的AI晶片管制,DeepSeek被迫想出一系列工程创新,降低模型成本。比如绕过CUDA(英伟达GPU的计算接口),提高GPU利用率。
DeepSeek采用了“混合专家”模型。每个专家负责不同类型的任务,从而提高整体效率。
许多人很关注AI技术的安全性,下载到自己的电脑上,只在自己的硬件上运行,就能避免个人数据和隐私外泄。
敏感的政治话题,DeepSeek提供中国官方立场的答案。
迫于压力,OpenAI在1月23日迅速推出o3-mini推理模型,也首次向免费开放。
英伟达开发者网站称,DeepSeek-R1模型是最先进、高效的大型语言模型,在推理、数学和编码方面表现出色。
目前已有超过200家中国企业宣布接入DeepSeek,包括华为、阿里、京东等,覆盖基础电信、云计算、芯片、金融、汽车、手机等领域。