外媒评论认为,生成式 AI 的竞争重点正在从“谁的模型更强”转向“谁能把模型跑得更便宜、更快”。在企业大规模部署 AI 代理后,推理成本持续上升,谷歌则试图把这一点变成自己的主战场。
企业开始重算账单
谷歌 CEO 皮查伊近期表示,不少公司到 5 月就已接近用完全年 token 预算。他称,如果 Google Cloud 的头部客户把 80% 的 AI 工作负载转向 Gemini 3.5 Flash 与其他前沿模型的组合,一年合计可节省逾 10 亿美元。
文章称,随着 AI 代理处理更长流程、调用更多上下文,企业对账单的敏感度明显上升。Uber 首席运营官此前也提到,持续膨胀的 AI 成本越来越难以合理化。投资人 Chamath Palihapitiya 也在 3 月表示,其公司 8090 因 token 支出过高,正减少对 Cursor 的使用。
谷歌押注基础设施

在外媒看来,当模型性能差距收窄后,竞争会更多落到基础设施和推理效率。谷歌的优势在于掌握了较完整的技术栈,包括芯片、数据中心、云平台、模型以及上层应用。
William Blair 分析师本月估算,谷歌依靠自研 TPU 芯片并直接向制造商采购部件,其内部 AI 计算成本较竞争对手低约 50%,在部分情况下甚至可能低 75%。相比之下,OpenAI 需要向微软、甲骨文等云服务商支付基础设施费用,而这些服务商还要继续承担 GPU 成本。
搜索时代打法再现
文章认为,谷歌现在的思路与早年搜索业务扩张时相似。2006 年,谷歌搜索市场份额已超过 40%。它当时不仅依靠搜索结果质量吸引用户,也持续强调响应速度和更低的服务成本。
谷歌彼时没有单纯依赖昂贵服务器,而是用更便宜的通用硬件搭建定制系统,以提升速度并压低成本。随着搜索量增长,更多数据又反过来优化搜索结果,形成正反馈。
外媒据此判断,谷歌并不一定需要在每一项模型能力上都绝对领先。若能在“足够好”的前提下,把价格和速度优势做得更明显,就有机会在企业 AI 市场扩大份额。

