从中国走向全球：DeepSeek潜入寻常百姓家_刘群鸣

个人资料

微博

正文字体大小：大中小

从中国走向全球：DeepSeek潜入寻常百姓家

(2025-03-23 12:00:00)

分类：军事与科技

从中国走向全球：DeepSeek潜入寻常百姓家 AI人人可亲

2025-02-21

中国人工智能“深度求索”（DeepSeek）的诞生震惊全球，科技专家乐见高科技降低门槛，让中小企业以较少的资源发展科学和经济，个人也可改善生活。

2025年1月20日，中国“深度求索”（DeepSeek）选择在美国总统特朗普就职当天，发布一款开源的推理模型R1，性能可媲美OpenAI的o1模型。撼动了全球AI竞赛的格局。

推理模型，指具备推理能力的大语言模型。在面对复杂任务场景时，它可以通过推理生成答案，且能通过后训练提升模型性能。

推理模型其实始于OpenAI去年12月发布的o1模型，不过o1是闭源的，付费使用。DeepSeek R1则是免费使用，并给大家看它的推理方式，因此引起极大关注。

开源的好处：可以检视推理过程，修正问题。如果出错，方便查找。如推理表现很好，可以把知识转移到较小模型中【蒸馏】。

大型语言模型做推理是困难的技术问题。其次是模型效率。

由于受到美国的AI晶片管制，DeepSeek被迫想出一系列工程创新，降低模型成本。比如绕过CUDA（英伟达GPU的计算接口），提高GPU利用率。

DeepSeek采用了“混合专家”模型。每个专家负责不同类型的任务，从而提高整体效率。

许多人很关注AI技术的安全性，下载到自己的电脑上，只在自己的硬件上运行，就能避免个人数据和隐私外泄。

敏感的政治话题，DeepSeek提供中国官方立场的答案。

迫于压力，OpenAI在1月23日迅速推出o3-mini推理模型，也首次向免费开放。

英伟达开发者网站称，DeepSeek-R1模型是最先进、高效的大型语言模型，在推理、数学和编码方面表现出色。

目前已有超过200家中国企业宣布接入DeepSeek，包括华为、阿里、京东等，覆盖基础电信、云计算、芯片、金融、汽车、手机等领域。

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report