研究亮点:
- 在 3T token 的预训练语料中混入 5% 工具调用示例;
- 零样本工具使用准确率达到小模型 +20%;
- 对"工具选择 - 参数填写 - 错误回滚"三步流程有显著改善。
这项研究可能推动下一代基础模型训练范式的调整。
无需 RLHF,仅通过大规模预训练即可让模型学会工具调用 —— 来自 Nature 最新论文。
研究亮点:
这项研究可能推动下一代基础模型训练范式的调整。
OpenAI introduces GPT-Rosalind, a frontier reasoning model built to accelerate drug discovery, genomics analysis, protein reasoning, and scientific research workflows.
Llama 4 系列发布,旗舰版本 Maverick 总参数 4050 亿、激活 170 亿,商用许可保持宽松。
GLM-4.6 技术报告公开,展示稀疏激活与工具原生训练带来的效率提升。