XM交易：OpenBMB发布MiniCPM5-1B，瞄准手机端本地AI代理

币界网报道：

OpenBMB 发布了 MiniCPM5 系列首个模型 MiniCPM5-1B，定位不是与大模型正面竞争，而是把本地 AI Agent 压缩到手机等消费级设备上运行。该模型参数量为 10 亿，支持 MCP 和原生工具调用，重点是让设备在不依赖云端连接的情况下完成轻量代理任务。

主打端侧部署与长上下文

从产品定位看，MiniCPM5-1B 的卖点并非知识广度，而是“以更小体积完成更多任务”。模型上下文窗口达到 128K，可处理长文档、持续对话和较长任务链。对一款 10 亿参数模型来说，这一规格已接近端侧应用的实用区间。

报道提到，该模型可用于读取笔记、总结 PDF、回答文档相关问题，也能在本地调用日历、数据库或外部研究服务。若配合 MCP 服务器，还可以把网页检索等能力接入本地工作流。

训练方式强调效率

MiniCPM5-1B 建立在 MiniCPM4 架构基础上，核心技术之一是 InfLLM v2。该机制在长上下文推理时，只让每个 token 与周围少量 token 交互，以减少计算开销，同时尽量维持精度。

数据处理方面，团队使用名为 UltraClean 的过滤流程，并称模型在约 8 万亿训练 token 下取得了较强表现。后训练阶段则结合强化学习和蒸馏方法，提升数学、代码和指令跟随等测试分数，同时减少冗长输出。

基准测试领先，但推理仍有限

按照 OpenBMB 给出的对比结果，MiniCPM5-1B 在通识、领域知识、代码、数学、逻辑和代理任务等多项测试中，平均分高于同级别竞品，尤其在代理能力和通识任务上优势更明显。

不过，媒体实测也指出，这款模型在基础逻辑题上仍会失误。例如面对带有明显陷阱的婚姻法律问题时，模型没有识别出题目本身的逻辑矛盾，而是给出了一段看似完整的法律分析。另一项测试中，模型也未能在二选一问题里直接作答，而是倾向于给出折中回应。

这意味着 MiniCPM5-1B 更适合轻量任务和工具调用场景，而不是单独承担高精度事实判断。报道认为，一旦接入外部工具或研究服务器，这类小模型在冷门事实问题上的幻觉情况有望明显减少。

已开放下载

目前，MiniCPM5-1B 已在 Hugging Face 上发布，采用 Apache 2.0 许可，可兼容 vLLM、SGLang 和 Transformers 推理框架。对端侧 AI 来说，这类能在本地运行、可调用工具、并保留长上下文的小模型，正逐步从研究项目走向实际产品形态。