DeepSeek V4引爆AI圈，最值得关注的是7大要点： NO.1 一个更大

DeepSeek V4引爆AI圈，最值得关注的是7大要点：

NO.1 一个更大规模、成本更低的型号

DeepSeek V4发布了两个版本的模型：一个参数为1.6万亿的V4-Pro和一个参数为2840亿的V4-Flash。两款型号均支持最多100万令牌的上下文窗口，较早期版本大幅提升。

这些开源模型在与顶级闭源（商业）系统竞争的同时，实现了强有力的成本效益。V4-Pro在多个领域与领先模型匹敌，并提升了代理在多步任务中的能力。

定价是一个关键的差异化因素。据报道，V4-Pro 每百万个输出代币的价格约为3.48美元——相比之下，竞争对手如Anthropic和OpenAI的定价约为25至30美元——而 V4-Flash 则降至最低0.28美元。

这种定价策略可能会给竞争对手带来压力，因为竞争对手已经在提高价格并限制使用以管理需求。

NO.2 通过架构创新实现显著的推理成本节约

与竞争对手模型相比，DeepSeek V4 在推理成本上节省了显著的效果。这些节省来自于新颖的架构变革，特别是注意力机制的改进。DeepSeek研究人员引入了一种混合注意力机制，结合了压缩稀疏注意力和重度压缩注意力，使KV缓存所需的内存比DeepSeek V3.2减少了9.5倍至13.7倍。该模型还混合使用了FP8和FP4的精度数据类型，FP4相比FP8实际上将存储模型权重所需的内存减半。

NO.4 编程表现强劲，但AI能力差距依然存在

DeepSeek V4在编码任务中表现出色，公司声称两款V4模型在编码竞赛基准测试中表现与GPT-5.4相当。

一项针对85名有经验开发者的内部调查发现，超过90%将V4-Pro列为编程任务的首选型号。 DeepSeek 专门为 Claude Code、OpenClaw 和 CodeBuddy 等流行代理框架优化了 V4。

不过，公司承认这些模型在知识测试中略有落后，特别是落后于OpenAI的GPT-5.4和谷歌的Gemini 3.1 Pro。DeepSeek在其技术论文中承认，这一滞后表明“发展轨迹大约落后于最先进的前沿模型3到6个月”。

NO.5 华为从发布开始就对芯片和软件进行协调

华为表示，其Ascend芯片已准备好立即支持该型号。其最新处理器在DeepSeek V4中实现了“零日”适配，体现了两家公司之间的密切合作。其Ascend SuperNode系列已完全适配V4推理工作负载。

华为工程师在直播中解释道：“整个Ascend SuperNode产品线完全适配DeepSeek V4用于模型推断，由于两家公司在模型发布前的密切合作，推理性能有了显著提升。”

另外报告了多个芯片系列的兼容性，包括Ascend A2、A3和950系列处理器。这种紧密的集成也延伸到了华为的神经网络计算架构平台，该平台与该模型一同优化。

证券的分析师强调，“V4的发布明确提到了与国产芯片的兼容性”，并表示今年可能会有更广泛的本地GPU采用。

NO.6专家混合架构与硬件兼容性

两个DeepSeek V4模型都采用专家混合方法，每个任务只激活一定数量的参数以降低推理成本。

V4-Pro 训练于33万亿个代币上，据 Deepseek 称，它击败了所有开放权重模型，并在其基准测试套件中与西方专有模型竞争。

值得注意的是，此次发布标志着中国芯片产业的一个里程碑，DeepSeek明确强调了与华为国产技术的兼容性，以及英伟达GPU的兼容。

NO.7 龙虾默认DeepSeek V4

4月26日凌晨，OpenClaw更新2026.4.24版本，包括接入DeepSeek-V4两款模型。用户配置DeepSeek API后，默认模型就被设为DeepSeek-V4-Flash。

官方更新日志显示，DeepSeek-V4-Flash与V4-Pro已纳入OpenClaw捆绑服务目录。DeepSeek-V4模型后续工具调用轮次的深度思考与推理复现机制已完成固化优化。

NO.8 DeepSeek V4更新持续不断

DeepSeek官方账号也官宣了几项集成更新，哥哥辣眼：

Claude Code模型切换为deepseek-v4-pro[1m]，正式解锁100万超长上下文能力，适配长代码库、技术文档、产业长文本全量上下文处理。

OpenCode版本升级至v1.14.24+，修复底层推理兼容问题，优化大模型代码生成、调试与工程化落地效率。

YC科技资讯网

DeepSeek V4引爆AI圈，最值得关注的是7大要点： NO.1 一个更大

热门分类