XM交易：外媒：Google AI连单词拼写都频频出错

币界网报道：

外媒称，Google 正把生成式 AI 进一步推向搜索核心位置，但 AI Overview 近期再次暴露基础能力缺陷：不仅会把单词中的字母数量算错，还会把常见词拼错。这类失误看似简单，却触及大模型当前架构的老问题。

Google承认是已知难题

报道提到，Google 的 AI Overview 曾给出多条明显错误的回答，包括把“Google”中的字母数量算错，也会在拼写常见英文单词时出现错乱。Google 向 TechCrunch 表示，模型在“单词内部计数”方面一直存在已知挑战，团队正在修复这一问题。

这并不是 Google 搜索 AI 首次因低级错误引发关注。此前，AI Overview 就曾引用讽刺内容和论坛帖子，给出不可靠建议。上周，Google 还修复了一项与词条解释有关的异常显示问题，但这次的拼写错误仍在持续出现。

问题指向 token 架构

文章称，这类错误并不只是产品打磨不足，更与大语言模型的底层处理方式有关。当前多数 LLM 并不是像人类那样逐字读取文本，而是先把输入拆成 token，再转成数值表示进行推理。

这些 token 可能是完整单词、音节，也可能只是部分字符。也就是说，模型理解的是编码后的模式和上下文，而不是字母本身。加拿大阿尔伯塔大学助理教授 Matthew Guzdial 表示，模型处理的是词语对应的整体编码，并不会真正理解其中每个字母的组成。

研究人员称难以根治

报道援引研究人员观点称，拼写和字母计数问题之所以反复出现，是因为语言模型对“词”的切分本身就没有绝对标准。即便人为设计出更理想的 token 词表，模型在训练和推理时仍可能继续采用更粗粒度的切分方式。

美国东北大学研究大模型可解释性的博士生 Sheridan Feucht 表示，很难定义一个“完美”的 tokenizer，因为语言本身就带有模糊性。这意味着，类似拼写错误未必能通过简单补丁完全消除。

文章认为，这类问题未必是研究人员当前最紧迫的任务，因为大模型的主要用途并不在拼写本身。但当 AI 被放进搜索等高频入口后，这些基础错误会直接影响用户对结果的信任，也再次提醒外界，生成式 AI 的输出仍需要人工核对。