“缩小中美AI差距至3个月”，DeepSeek深夜更新

新闻动态Position

你的位置：娱乐天地开户 > 新闻动态 > “缩小中美AI差距至3个月”，DeepSeek深夜更新

发布日期：2025-04-13 11:12 点击次数：146

据新加坡《联合早报》网站 3 月 25 日报道，中国初创企业零一万物首席执行官李开复说，在人工智能（AI）发展方面，中国已将与美国在某些领域的差距缩小至仅 3 个月，因为中国初创企业深度求索（DeepSeek）等公司已经研究出如何更有效地使用芯片和应用算法。

李开复是全球 AI 领域的重要人物，曾担任美国搜索引擎巨头谷歌公司的中国区负责人。李开复在香港接受路透社采访时说，DeepSeek 的推出表明，中国已经在基础设施软件工程等领域取得领先地位。

今年 1 月，DeepSeek 推出一款 AI 推理模型，震惊了全球 AI 行业。该公司称，该模型采用的芯片技术较落后，开发成本也低于西方竞争对手。这挑战了美国制裁将阻碍中国 AI 行业发展的假设。

李开复说："之前我认为差距是 6 到 9 个月，在各方面都落后。现在我认为，在一些核心技术上可能落后 3 个月，但实际上在某些特定领域领先。"

▲资料图片：用户在 DeepSeek 手机客户端上提问（新华社发）

李开复形容华盛顿的半导体制裁是一把"双刃剑"，既带来了短期挑战，也迫使中国企业在约束下进行创新，并提到中国企业如何开发自己的算法。

他说：" DeepSeek 能够通过一种新的强化学习方式来弄清楚思路链，这要么是在赶超美国，要么是在快速学习，甚至可能更具创新性。"他指的是 DeepSeek 模型在给出答案之前，向用户展示推理过程。这一功能由美国 AI 巨头 OpenAI 率先开发，但尚未向用户发布。

2022 年底 OpenAI 推出聊天机器人 ChatGPT 后不久，中国科技行业就加入了开发生成式 AI 的全球竞赛，但直到 DeepSeek 推出前，中国许多科技领袖都说，他们远远落后于西方同行。

新闻多一点

编程能力大大提升，DeepSeek 发布更新版 V3 模型

据新加坡《联合早报》网站 3 月 25 日报道，中国初创公司深度求索（DeepSeek）发布了 V3 模型更新，加强了模型的编程能力，显示这家公司希望在人工智能（AI）领域的激烈竞争中保持领先优势。

综合彭博社和科技博客网站"风险投资节奏"网站的报道，AI 开源模型 DeepSeek-V3 的更新版本 V3-0324 于 24 日深夜在 AI 开源平台低调上线。

深度求索没有为此次版本更新发布任何公告，延续了该公司的低调风格。

初代 DeepSeek-V3 发布于 2024 年 12 月 26 日，这款模型自上线后便以高性价比火速"出圈"。根据官方技术论文披露，DeepSeek-V3 模型的总训练成本约为 557.6 万美元，而 OpenAI 的 GPT-4o 等模型的训练成本约为 1 亿美元。

更新后的 DeepSeek-V3 模型大小为 641GB，模型参数为 6850 亿。与 V3 相同，V3-0324 模型采用混合专家（MoE）架构，并开源允许自由商用。

此次更新的最大亮点是编程能力的优化。有网民使用 V3-0324 模型编写 800 多行代码，全程没有出现任何故障。

有 AI 研究者在社交平台 X 上发布评测指出，V3-0324 模型在所有基准测试中都取得巨大进步，可能已超越美国 Anthropic 公司的 Claude 3.5 Sonnet，成为最强大的非推理模型。Claude 3.5 Sonnet 是当前最受认可的商业 AI 模型之一。

让更多科技博主关注的是，V3-0324 模型可直接在消费级硬件上运行，如搭载苹果 M3 Ultra 芯片的 Mac Studio 上，而不需要动辄千瓦级别功耗的数据中心。

M3 Ultra 芯片在进行推理时的功耗不到 200 瓦，意味着 V3-0324 模型的部署和运营门槛已大大降低。

"风险投资节奏"网站报道认为，DeepSeek-V3-0324 模型的发布，可能预示着 DeepSeek-R2 即将到来。DeepSeek 一贯先推出基础模型，再推出专门优化推理能力的版本，如 V3 后不久发布的 R1。

路透社今年 2 月引述消息称，DeepSeek 正加快推出 R1 模型的后续产品 R2。据悉，DeepSeek-R2 原计划在 5 月初发布，但公司现在希望尽早推出。

"风险投资节奏"网站认为，DeepSeek-R2 的发布，可能成为直接挑战 GPT-5 的竞品。