MiniMax 发布 M2.5 基础模型:
- SWE-bench Verified 80.2%,是国产模型首次在该基准逼近 Claude Opus 级别;
- 256K 上下文;
- 定价 $1/$4,成本只有 Opus 4.7 的 1/5;
- 多模态视频能力同步升级,集成于海螺视频产品。
M2.5 的亮眼成绩把 "国产模型 = 追赶者" 的标签进一步擦除。
国产 MiniMax M2.5 在 SWE-bench Verified 跑到 80.2%,接近 Claude Opus 4.6 的水平。
MiniMax 发布 M2.5 基础模型:
M2.5 的亮眼成绩把 "国产模型 = 追赶者" 的标签进一步擦除。
The eighth generation of Google’s TPU include
GPT-5 的 Agent 模式允许模型调用网页浏览、终端、代码执行、文件系统,默认可规划最多 2 小时的长任务。
Cursor 2.0 引入后台 Agent,允许模型在本地不占主线程的情况下同时处理多任务。