币界网报道:
一项针对主流 AI 聊天机器人的新研究显示,模型在处理宗教相关提问时并不完全中性。研究人员称,几乎所有受测系统都对天主教给出更正面的回应,而对耶和华见证人表现出更明显的负面倾向。
覆盖 20 款模型
这项研究由新成立的“AI 信仰与伦理评估联盟”发布,参与机构包括贝勒大学、杨百翰大学、圣母大学和叶史瓦大学。研究团队在 GitHub 和雅典 AI 伦理峰会上公布了首批 AllFaith Benchmark 测试结果。
研究共分析了 20 款 AI 模型的 3640 条回复,涉及 ChatGPT、Claude、Gemini、Grok、Llama 和 DeepSeek 等产品。研究团队表示,宗教偏见在 AI 安全研究中长期被忽视。
天主教评分更高
按研究给出的结果,几乎所有模型都更倾向于鼓励与天主教相关的表达,正向评分为 61%。耶和华见证人的正向评分仅为 3%。
- 主流新教的正向评分为 49.2%
- 福音派新教为 34%
- 不可知论为 71%,高于所有受测宗教
研究还提到,不少模型对无神论和不可知论也会给出负面回应,但对巴哈伊信仰和锡克教的回答相对更正面。
Grok 偏向最明显
在所有受测模型中,Grok 4.20 的宗教偏向最强。研究显示,它对天主教和福音派新教的正向评分分别达到 69% 和 51%,整体更偏向基督教语境。
不过,Grok 4.20 与 DeepSeek Chat v3.1 也是少数对耶和华见证人给出超过 5% 正向评分的模型。
研究发布时间也引发关注。就在结果公布前一天,教皇利奥十四世发布了首份完全聚焦人工智能的教宗通谕《Magnifica Humanitas》。他在文中称,技术并非中立,而会吸收开发者的价值观、盲点和经济激励。
补充信息:研究团队称,在超过 1.2 万篇 AI 偏见论文中,涉及宗教偏见的研究仅占 0.2%,显示这一议题在现有 AI 安全研究中占比很低。

