全面对比 GLM-5、Kimi K2.5、MiniMax M2.5、Claude Opus 4.6、Gemini 3.1 Pro、GPT-5.3 Codex
MiniMax M2.5 和 Gemini 3.1 Pro 以80%以上的得分并列第一,达到生产级可用水平!
MiniMax M2.5 50TPS版本输出价格仅为 Claude Opus 4.6、Gemini 3 Pro、GPT-5的1/10-1/20!1万美元就能让4个Agent连续工作一年,真正实现"无限使用"!
| 模型 | 上下文 | 输出 | SWE-Bench | BrowseComp | 速度 | 评分 |
|---|---|---|---|---|---|---|
| MiniMax M2.5 | 200K | 128K | 80.2% | 76.3% | 100 TPS | ⭐⭐⭐⭐⭐ |
| GLM-5 | 200K | 128K | 77.8% | SOTA | 流式 | ⭐⭐⭐⭐ |
| Kimi K2.5 | 256K | - | 76.8% | 60.6% | - | ⭐⭐⭐⭐ |
| Claude Opus 4.6 | 1M β | 128K | 65.4% | 最佳 | - | ⭐⭐⭐⭐ |
| Gemini 3.1 Pro | 1M | 64K | 80.6% | - | - | ⭐⭐⭐⭐ |
| GPT-5.3 Codex | 200K+ | - | - | - | - | ⭐⭐⭐ |