← 返回排行榜
OpenAI

o3

面向复杂推理任务的闭源模型。

闭源 API
Use Case Fit

适合的应用场景

按应用任务展示该模型被推荐的理由和证据数量。

跨 Benchmark 成绩

已收录结果

6Results
领域Benchmark排名分数指标来源更新时间
mathLMArena Math#11392 EloArena EloLMArena2026/05/30
mathMMLU-Pro Mathematics#187.4%AccuracyTIGER-Lab / MMLU-Pro2026/05/20
physicsMMLU-Pro Physics#282.4%AccuracyTIGER-Lab / MMLU-Pro2026/05/20
chemistryChemBench#377.3 ptsNormalized ScoreChemBench2026/05/28
economicsMMLU-Pro Economics#185.9%AccuracyTIGER-Lab / MMLU-Pro2026/05/20
medicineMedHELM#479.8 ptsOverall ScoreMedHELM2026/05/27