YC科技资讯网

V4来了,英伟达股价跳水,华为昇腾悄悄卖爆了。 DeepSeek突然开源,连黄仁

V4来了,英伟达股价跳水,华为昇腾悄悄卖爆了。
DeepSeek突然开源,连黄仁勋都急了,到底动了谁的奶酪?
国产模型真能跑赢H200?实测数据一出,没人再提“卡脖子”了。
昨天刷到DeepSeek官网更新,V4预览版上线,点进去直接就能下模型权重。不是试用,是真开源,Apache 2.0协议,连商用都允许。我顺手查了下价格,V4-Flash只要0.02元/百万tokens,比Claude便宜一百多倍。不是噱头,是真便宜。官网还写了句很实在的话:“跑得快,不等于省电;省电,才真能用。”

这版模型不是堆参数。V4-Pro有1.6万亿参数,但更狠的是它在昇腾950PR上跑百万token上下文,显存只占10%,每token算力消耗只有V3.2的27%。我问了做推理部署的朋友,他说以前要搭8张H200才够用的场景,现在4张昇腾950PR就能压住,延迟还更低。不是吹,是实测数据摆那儿了。
昇腾950PR今年3月量产,单卡FP4算力1.56P,HBM显存112GB,成本不到H200的四分之一。阿里、腾讯、字节已经下了几十万颗订单——不是备货,是真在用。不是喊口号,是拿钱投票。黄仁勋4月15号在彭博播客里说“推理拐点已到”,话音刚落,V4就来了。

DeepSeek这次没融资,但腾讯和阿里都在谈入股。不是缺钱,是想把芯片、模型、场景三块拼起来。梁文锋自己掏钱把股份提到34%,没让外部资本稀释控制权。他说过一句话,我记住了:“模型可以开源,但方向盘得攥在懂技术的人手里。”
开源代码里,寒武纪、海光、昆仑芯等七家国产芯片的适配代码全公开,连编译脚本都打包好了。不是等厂商适配,是模型先跑通,再把路铺好。我试了下在昇腾上跑V4-Flash,装完CANN,改两行配置,不到十分钟就跑通了。没报错,没掉帧,就是快。

定价也硬核。V4-Pro 0.025元/百万tokens,算下来一天跑一亿tokens只要2.5块钱。我们公司用的旧模型,同类任务月账单三万多。换完V4,上个月账单剩了八百多。财务看了说:“这哪是降本,这是砍价。”
没有发布会,没有红毯,就一个官网更新页面,加一份技术报告。报告里没写“全球首发”,只写“昇腾950PR实测吞吐:1384 tokens/sec,H200:1421 tokens/sec”。数字摆那儿,比啥都管用。

V4不是来打榜的。它只是把原来被锁死的链路,一节一节,亲手接上了。
这事成了。