YC科技资讯网

DeepSeek V4引爆AI圈,最值得关注的是7大要点: NO.1 一个更大

DeepSeek V4引爆AI圈,最值得关注的是7大要点:

NO.1 一个更大规模、成本更低的型号

DeepSeek V4发布了两个版本的模型:一个参数为1.6万亿的V4-Pro和一个参数为2840亿的V4-Flash。两款型号均支持最多100万令牌的上下文窗口,较早期版本大幅提升。

这些开源模型在与顶级闭源(商业)系统竞争的同时,实现了强有力的成本效益。V4-Pro在多个领域与领先模型匹敌,并提升了代理在多步任务中的能力。

定价是一个关键的差异化因素。据报道,V4-Pro 每百万个输出代币的价格约为3.48美元——相比之下,竞争对手如Anthropic和OpenAI的定价约为25至30美元——而 V4-Flash 则降至最低0.28美元。

这种定价策略可能会给竞争对手带来压力,因为竞争对手已经在提高价格并限制使用以管理需求。

NO.2 通过架构创新实现显著的推理成本节约

与竞争对手模型相比,DeepSeek V4 在推理成本上节省了显著的效果。这些节省来自于新颖的架构变革,特别是注意力机制的改进。DeepSeek研究人员引入了一种混合注意力机制,结合了压缩稀疏注意力和重度压缩注意力,使KV缓存所需的内存比DeepSeek V3.2减少了9.5倍至13.7倍。该模型还混合使用了FP8和FP4的精度数据类型,FP4相比FP8实际上将存储模型权重所需的内存减半。

NO.4 编程表现强劲,但AI能力差距依然存在

DeepSeek V4在编码任务中表现出色,公司声称两款V4模型在编码竞赛基准测试中表现与GPT-5.4相当。

一项针对85名有经验开发者的内部调查发现,超过90%将V4-Pro列为编程任务的首选型号。 DeepSeek 专门为 Claude Code、OpenClaw 和 CodeBuddy 等流行代理框架优化了 V4。

不过,公司承认这些模型在知识测试中略有落后,特别是落后于OpenAI的GPT-5.4和谷歌的Gemini 3.1 Pro。DeepSeek在其技术论文中承认,这一滞后表明“发展轨迹大约落后于最先进的前沿模型3到6个月”。

NO.5 华为从发布开始就对芯片和软件进行协调

华为表示,其Ascend芯片已准备好立即支持该型号。其最新处理器在DeepSeek V4中实现了“零日”适配,体现了两家公司之间的密切合作。其Ascend SuperNode系列已完全适配V4推理工作负载。

华为工程师在直播中解释道:“整个Ascend SuperNode产品线完全适配DeepSeek V4用于模型推断,由于两家公司在模型发布前的密切合作,推理性能有了显著提升。”

另外报告了多个芯片系列的兼容性,包括Ascend A2、A3和950系列处理器。这种紧密的集成也延伸到了华为的神经网络计算架构平台,该平台与该模型一同优化。

证券的分析师强调,“V4的发布明确提到了与国产芯片的兼容性”,并表示今年可能会有更广泛的本地GPU采用。

NO.6专家混合架构与硬件兼容性

两个DeepSeek V4模型都采用专家混合方法,每个任务只激活一定数量的参数以降低推理成本。

V4-Pro 训练于33万亿个代币上,据 Deepseek 称,它击败了所有开放权重模型,并在其基准测试套件中与西方专有模型竞争。

值得注意的是,此次发布标志着中国芯片产业的一个里程碑,DeepSeek明确强调了与华为国产技术的兼容性,以及英伟达GPU的兼容。

NO.7 龙虾默认DeepSeek V4

4月26日凌晨,OpenClaw更新2026.4.24版本,包括接入DeepSeek-V4两款模型。用户配置DeepSeek API后,默认模型就被设为DeepSeek-V4-Flash。

官方更新日志显示,DeepSeek-V4-Flash与V4-Pro已纳入OpenClaw捆绑服务目录。DeepSeek-V4模型后续工具调用轮次的深度思考与推理复现机制已完成固化优化。

NO.8 DeepSeek V4更新持续不断

DeepSeek官方账号也官宣了几项集成更新,哥哥辣眼:

Claude Code模型切换为deepseek-v4-pro[1m],正式解锁100万超长上下文能力,适配长代码库、技术文档、产业长文本全量上下文处理。

OpenCode版本升级至v1.14.24+,修复底层推理兼容问题,优化大模型代码生成、调试与工程化落地效率。