XM交易：外媒：中美前沿模型价格战进一步拉大

币界网报道：

外媒称，中国前沿模型厂商近期继续下调 API 价格，DeepSeek 与小米先后宣布新的定价安排，而美国头部实验室的新模型则走向更高单价。这使中美前沿模型在推理成本上的差距进一步扩大。

对企业客户来说，模型价格主要体现在按 token 计费的 API 成本。应用接入模型后，输入、输出以及缓存命中都会形成费用，因此单价变化会直接影响 AI 产品的商业可行性。

DeepSeek与小米同步降价

DeepSeek 在 5 月 22 日将 V4-Pro 此前的 75% 折扣转为长期价格。调整后，该模型输入价格为每百万 token 0.435 美元，输出价格为 0.87 美元。

小米则在 5 月 26 日下调 MiMo-V2.5 API 价格，其中 Pro 版本缓存命中输入价格降至每百万 token 0.0036 美元，部分项目降幅最高达到 99%。按小米新的套餐方案，同样价格可获得的 token 数量提升 5 倍到 8 倍。

降价背后是推理优化

文章称，这轮降价并非单纯营销动作。小米 MiMo 团队负责人、前 DeepSeek 核心开发者罗福莉表示，主要节省来自缓存与推理框架优化。系统可复用更多已处理信息，减少重复计算，从而压低存储和推理开销。

按其说法，相关优化让缓存 token 的处理能力明显提升，整体存储和处理成本约下降 80%。在新的 API 价格下，生产环境推理引擎接近满负荷运行时，仍大致可以做到盈亏平衡。

DeepSeek 的做法则是通过模型架构压缩上下文计算成本。文章提到，V4 采用两类交错注意力机制，在长上下文场景下显著缩小 KV 缓存规模，并降低单 token 推理成本。以百万 token 上下文计算，V4-Pro 的 KV 缓存仅为前代约一成，单 token 推理成本约为前代的 27%。

美国模型价格走向相反

文章指出，美国头部模型近期没有跟随降价。OpenAI 于 4 月底发布的 GPT-5.5，将输出价格提高到每百万 token 30 美元，约为前代的两倍。Anthropic 的 Claude Opus 4.7 标价维持不变，但因更新分词器，同样文本可能产生更多 token，实际账单最高或增加约 35%。

作为对比，DeepSeek V4-Pro 在代码基准 SWE-Verified 上得分 80.6%，接近 Claude Opus 4.6 的 80.8%，但输出价格差距达到数十倍。小米 MiMo-V2.5-Pro 在最新调价后，也达到与 DeepSeek V4-Pro 相同的输入和输出价格。

文章还提到，除 DeepSeek 与小米外，MiniMax、Moonshot AI、Z.AI 等中国模型厂商也维持较低定价。按文中比较，2026 年第二季度，中国与美国前沿模型的价格差大致在 15 倍到 30 倍之间；若计入缓存优惠，差距还会进一步扩大。

文章详情

XM交易：外媒：中美前沿模型价格战进一步拉大