文章详情

XM交易:外媒:Google AI连单词拼写都频频出错

币界网报道:

外媒称,Google 正把生成式 AI 进一步推向搜索核心位置,但 AI Overview 近期再次暴露基础能力缺陷:不仅会把单词中的字母数量算错,还会把常见词拼错。这类失误看似简单,却触及大模型当前架构的老问题。

Google承认是已知难题

报道提到,Google 的 AI Overview 曾给出多条明显错误的回答,包括把“Google”中的字母数量算错,也会在拼写常见英文单词时出现错乱。Google 向 TechCrunch 表示,模型在“单词内部计数”方面一直存在已知挑战,团队正在修复这一问题。

这并不是 Google 搜索 AI 首次因低级错误引发关注。此前,AI Overview 就曾引用讽刺内容和论坛帖子,给出不可靠建议。上周,Google 还修复了一项与词条解释有关的异常显示问题,但这次的拼写错误仍在持续出现。

问题指向 token 架构

文章称,这类错误并不只是产品打磨不足,更与大语言模型的底层处理方式有关。当前多数 LLM 并不是像人类那样逐字读取文本,而是先把输入拆成 token,再转成数值表示进行推理。

这些 token 可能是完整单词、音节,也可能只是部分字符。也就是说,模型理解的是编码后的模式和上下文,而不是字母本身。加拿大阿尔伯塔大学助理教授 Matthew Guzdial 表示,模型处理的是词语对应的整体编码,并不会真正理解其中每个字母的组成。

研究人员称难以根治

报道援引研究人员观点称,拼写和字母计数问题之所以反复出现,是因为语言模型对“词”的切分本身就没有绝对标准。即便人为设计出更理想的 token 词表,模型在训练和推理时仍可能继续采用更粗粒度的切分方式。

美国东北大学研究大模型可解释性的博士生 Sheridan Feucht 表示,很难定义一个“完美”的 tokenizer,因为语言本身就带有模糊性。这意味着,类似拼写错误未必能通过简单补丁完全消除。

文章认为,这类问题未必是研究人员当前最紧迫的任务,因为大模型的主要用途并不在拼写本身。但当 AI 被放进搜索等高频入口后,这些基础错误会直接影响用户对结果的信任,也再次提醒外界,生成式 AI 的输出仍需要人工核对。