MIT + DeepMind 最新研究：纯预训练可以涌现工具使用能力

无需 RLHF，仅通过大规模预训练即可让模型学会工具调用 —— 来自 Nature 最新论文。

2026-01-25来源：Nature查看原文

研究亮点：

在 3T token 的预训练语料中混入 5% 工具调用示例；
零样本工具使用准确率达到小模型 +20%；
对"工具选择 - 参数填写 - 错误回滚"三步流程有显著改善。

这项研究可能推动下一代基础模型训练范式的调整。

研究预训练工具调用MIT

📰 同分类资讯

2026-04-16 · OpenAI

Introducing GPT-Rosalind for life sciences research

OpenAI introduces GPT-Rosalind, a frontier reasoning model built to accelerate drug discovery, genomics analysis, protein reasoning, and scientific research workflows.

2026-03-05 · Meta AI

Meta 开源 Llama 4：MoE 架构 + 1000 万 token 上下文

Llama 4 系列发布，旗舰版本 Maverick 总参数 4050 亿、激活 170 亿，商用许可保持宽松。

2026-01-05 · 智谱清言

清华 & 智谱发布 GLM-4.6 技术报告：稀疏激活 + 工具原生

GLM-4.6 技术报告公开，展示稀疏激活与工具原生训练带来的效率提升。

加载中...