DeepSeek又当“价格屠夫”,但这次“屠”的不仅是价格
本文为《Token经济学》系列第六篇。Token正重塑AI时代的价值坐标,DeepSeek V4预览版发布,又一次成为了“价格屠夫”,但是带来了token定价的新的命题。同样数量的Token,在不同系统中的实际成本可相差一个数量级,大模型正在走向系统级定价。
文|晓静
编辑|徐青阳
DeepSeek V4预览版终于发布,又一次把大模型的价格打了下来,这很符合DeepSeek的“特性”。
V4-Flash定价输入1元、输出2元/百万tokens,缓存命中后输入仅0.2元;V4-Pro定价输入12元、输出24元/百万tokens,缓存命中输入1元,发布时给出限时75折,截至5月5日。两款模型均原生支持百万tokens上下文。
这周末,DeepSeek-V4-Pro 继续开启限时优惠,把价格打到2.5折,缓存命中率的输入价格再打1折。一位AI工程师半开玩笑地说,“周末过后,DeepSeek-V4-Pro离免费只差0.025元”。
目前距离2024年那一轮以DeepSeek V2为起点的价格战,已经过去了整整两年。这两年,大模型的推理成本出现了指数级的下降,在考虑缓存命中等因素后的有效成本口径下,累计降幅甚至达百倍。
但今天,把价格打下来的意义比之前更为重要。AI已经切换到以长程复杂任务为主的Agent范式,一次任务背后是几十次、上百次模型调用。
在这个行业语境下,DeepSeek V4预览版的发布,同时也伴随着两个值得划重点的信息。一是百万上下文成为两款模型原生标配;二是强调了缓存价格,折上折。叠加标准输入输出价格压到了同规格模型的梯度下沿,目标是把Agent完成一次任务的总账单压到最有竞争力。
网页链接
