V4来了，英伟达股价跳水，华为昇腾悄悄卖爆了。 DeepSeek突然开源，连黄仁

2026-04-28 22:10:07 吉米传记社会

V4来了，英伟达股价跳水，华为昇腾悄悄卖爆了。
DeepSeek突然开源，连黄仁勋都急了，到底动了谁的奶酪？
国产模型真能跑赢H200？实测数据一出，没人再提“卡脖子”了。
昨天刷到DeepSeek官网更新，V4预览版上线，点进去直接就能下模型权重。不是试用，是真开源，Apache 2.0协议，连商用都允许。我顺手查了下价格，V4-Flash只要0.02元/百万tokens，比Claude便宜一百多倍。不是噱头，是真便宜。官网还写了句很实在的话：“跑得快，不等于省电；省电，才真能用。”

这版模型不是堆参数。V4-Pro有1.6万亿参数，但更狠的是它在昇腾950PR上跑百万token上下文，显存只占10%，每token算力消耗只有V3.2的27%。我问了做推理部署的朋友，他说以前要搭8张H200才够用的场景，现在4张昇腾950PR就能压住，延迟还更低。不是吹，是实测数据摆那儿了。
昇腾950PR今年3月量产，单卡FP4算力1.56P，HBM显存112GB，成本不到H200的四分之一。阿里、腾讯、字节已经下了几十万颗订单——不是备货，是真在用。不是喊口号，是拿钱投票。黄仁勋4月15号在彭博播客里说“推理拐点已到”，话音刚落，V4就来了。

DeepSeek这次没融资，但腾讯和阿里都在谈入股。不是缺钱，是想把芯片、模型、场景三块拼起来。梁文锋自己掏钱把股份提到34%，没让外部资本稀释控制权。他说过一句话，我记住了：“模型可以开源，但方向盘得攥在懂技术的人手里。”
开源代码里，寒武纪、海光、昆仑芯等七家国产芯片的适配代码全公开，连编译脚本都打包好了。不是等厂商适配，是模型先跑通，再把路铺好。我试了下在昇腾上跑V4-Flash，装完CANN，改两行配置，不到十分钟就跑通了。没报错，没掉帧，就是快。

定价也硬核。V4-Pro 0.025元/百万tokens，算下来一天跑一亿tokens只要2.5块钱。我们公司用的旧模型，同类任务月账单三万多。换完V4，上个月账单剩了八百多。财务看了说：“这哪是降本，这是砍价。”
没有发布会，没有红毯，就一个官网更新页面，加一份技术报告。报告里没写“全球首发”，只写“昇腾950PR实测吞吐：1384 tokens/sec，H200：1421 tokens/sec”。数字摆那儿，比啥都管用。

V4不是来打榜的。它只是把原来被锁死的链路，一节一节，亲手接上了。
这事成了。