文章详情

XM交易:外媒:中美前沿模型价格战进一步拉大

币界网报道:

外媒称,中国前沿模型厂商近期继续下调 API 价格,DeepSeek 与小米先后宣布新的定价安排,而美国头部实验室的新模型则走向更高单价。这使中美前沿模型在推理成本上的差距进一步扩大。

对企业客户来说,模型价格主要体现在按 token 计费的 API 成本。应用接入模型后,输入、输出以及缓存命中都会形成费用,因此单价变化会直接影响 AI 产品的商业可行性。

DeepSeek与小米同步降价

DeepSeek 在 5 月 22 日将 V4-Pro 此前的 75% 折扣转为长期价格。调整后,该模型输入价格为每百万 token 0.435 美元,输出价格为 0.87 美元。

小米则在 5 月 26 日下调 MiMo-V2.5 API 价格,其中 Pro 版本缓存命中输入价格降至每百万 token 0.0036 美元,部分项目降幅最高达到 99%。按小米新的套餐方案,同样价格可获得的 token 数量提升 5 倍到 8 倍。

降价背后是推理优化

文章称,这轮降价并非单纯营销动作。小米 MiMo 团队负责人、前 DeepSeek 核心开发者罗福莉表示,主要节省来自缓存与推理框架优化。系统可复用更多已处理信息,减少重复计算,从而压低存储和推理开销。

按其说法,相关优化让缓存 token 的处理能力明显提升,整体存储和处理成本约下降 80%。在新的 API 价格下,生产环境推理引擎接近满负荷运行时,仍大致可以做到盈亏平衡。

DeepSeek 的做法则是通过模型架构压缩上下文计算成本。文章提到,V4 采用两类交错注意力机制,在长上下文场景下显著缩小 KV 缓存规模,并降低单 token 推理成本。以百万 token 上下文计算,V4-Pro 的 KV 缓存仅为前代约一成,单 token 推理成本约为前代的 27%。

美国模型价格走向相反

文章指出,美国头部模型近期没有跟随降价。OpenAI 于 4 月底发布的 GPT-5.5,将输出价格提高到每百万 token 30 美元,约为前代的两倍。Anthropic 的 Claude Opus 4.7 标价维持不变,但因更新分词器,同样文本可能产生更多 token,实际账单最高或增加约 35%。

作为对比,DeepSeek V4-Pro 在代码基准 SWE-Verified 上得分 80.6%,接近 Claude Opus 4.6 的 80.8%,但输出价格差距达到数十倍。小米 MiMo-V2.5-Pro 在最新调价后,也达到与 DeepSeek V4-Pro 相同的输入和输出价格。

文章还提到,除 DeepSeek 与小米外,MiniMax、Moonshot AI、Z.AI 等中国模型厂商也维持较低定价。按文中比较,2026 年第二季度,中国与美国前沿模型的价格差大致在 15 倍到 30 倍之间;若计入缓存优惠,差距还会进一步扩大。