← 返回排行榜

Google

Gemini 2.5 Pro

Google 多模态推理模型。

闭源 API

Use Case Fit

适合的应用场景

按应用任务展示该模型被推荐的理由和证据数量。

学习研究论文总结

在该应用场景的公开证据或平台样例评测中表现靠前。

#1 · 94 分 · 1 条证据办公效率会议纪要

在该应用场景的公开证据或平台样例评测中表现靠前。

#2 · 91 分 · 1 条证据内容创作写文章

长上下文材料整合能力突出，适合基于资料写文章。

#3 · 88 分 · 1 条证据营销销售广告营销文案

在该应用场景的公开证据或平台样例评测中表现靠前。

#3 · 88 分 · 1 条证据办公效率PPT/方案

在该应用场景的公开证据或平台样例评测中表现靠前。

#3 · 88 分 · 1 条证据商业分析财报分析

在该应用场景的公开证据或平台样例评测中表现靠前。

#3 · 88 分 · 1 条证据专业行业医学问答

在该应用场景的公开证据或平台样例评测中表现靠前。

#3 · 88 分 · 1 条证据

跨 Benchmark 成绩

已收录结果

7Results

领域	Benchmark	排名	分数	指标	来源	更新时间
math	LMArena Math	#2	1378 Elo	Arena Elo	LMArena	2026/05/30
math	MMLU-Pro Mathematics	#2	86.8%	Accuracy	TIGER-Lab / MMLU-Pro	2026/05/20
physics	MMLU-Pro Physics	#1	83.1%	Accuracy	TIGER-Lab / MMLU-Pro	2026/05/20
chemistry	ChemBench	#1	79.8 pts	Normalized Score	ChemBench	2026/05/28
economics	MMLU-Pro Economics	#3	83.4%	Accuracy	TIGER-Lab / MMLU-Pro	2026/05/20
finance	Open FinLLM Leaderboard	#3	79.6 pts	Composite Score	TheFinAI / Open FinLLM	2026/05/29
medicine	MedHELM	#3	82.1 pts	Overall Score	MedHELM	2026/05/27