Google
Gemini 2.5 Pro
Google 多模态推理模型。
Use Case Fit
适合的应用场景
按应用任务展示该模型被推荐的理由和证据数量。
学习研究论文总结
在该应用场景的公开证据或平台样例评测中表现靠前。
#1 · 94 分 · 1 条证据办公效率会议纪要在该应用场景的公开证据或平台样例评测中表现靠前。
#2 · 91 分 · 1 条证据内容创作写文章长上下文材料整合能力突出,适合基于资料写文章。
#3 · 88 分 · 1 条证据营销销售广告营销文案在该应用场景的公开证据或平台样例评测中表现靠前。
#3 · 88 分 · 1 条证据办公效率PPT/方案在该应用场景的公开证据或平台样例评测中表现靠前。
#3 · 88 分 · 1 条证据商业分析财报分析在该应用场景的公开证据或平台样例评测中表现靠前。
#3 · 88 分 · 1 条证据专业行业医学问答在该应用场景的公开证据或平台样例评测中表现靠前。
#3 · 88 分 · 1 条证据跨 Benchmark 成绩
已收录结果
7Results
| 领域 | Benchmark | 排名 | 分数 | 指标 | 来源 | 更新时间 |
|---|---|---|---|---|---|---|
| math | LMArena Math | #2 | 1378 Elo | Arena Elo | LMArena | 2026/05/30 |
| math | MMLU-Pro Mathematics | #2 | 86.8% | Accuracy | TIGER-Lab / MMLU-Pro | 2026/05/20 |
| physics | MMLU-Pro Physics | #1 | 83.1% | Accuracy | TIGER-Lab / MMLU-Pro | 2026/05/20 |
| chemistry | ChemBench | #1 | 79.8 pts | Normalized Score | ChemBench | 2026/05/28 |
| economics | MMLU-Pro Economics | #3 | 83.4% | Accuracy | TIGER-Lab / MMLU-Pro | 2026/05/20 |
| finance | Open FinLLM Leaderboard | #3 | 79.6 pts | Composite Score | TheFinAI / Open FinLLM | 2026/05/29 |
| medicine | MedHELM | #3 | 82.1 pts | Overall Score | MedHELM | 2026/05/27 |