办公效率
PPT/方案模型排名
比较方案结构、商业表达、逻辑层次和格式执行稳定性。
#1
Claude 3.7 SonnetAnthropic · closed
94应用适配分
数据来源1 条证据
模力榜 场景样例评测平台评测
- 测评时间
- 2026/06/03
- 指标
- 场景适配分
- 分数
- 90/100
平台自建样例评测,覆盖该应用场景的输出质量、稳定性和可用性。
打开来源在该应用场景的公开证据或平台样例评测中表现靠前。
价格 中速度 中上下文 中长
证据明细1 条
平台评测平台 rubric
方案结构和商业表达强
- 来源
- 模力榜 场景样例评测
- 指标
- 场景适配分
- 分数
- 90/100
- 排名
- #1
- 更新时间
- 2026/06/03
平台自建样例评测,覆盖该应用场景的输出质量、稳定性和可用性。
不代表全量真实业务转化效果,需结合用户自己的 prompt 和审核流程。
打开来源#2
GPT-4oOpenAI · closed
91应用适配分
数据来源1 条证据
模力榜 场景样例评测平台评测
- 测评时间
- 2026/06/03
- 指标
- 场景适配分
- 分数
- 88/100
平台自建样例评测,覆盖该应用场景的输出质量、稳定性和可用性。
打开来源在该应用场景的公开证据或平台样例评测中表现靠前。
价格 中速度 中上下文 中长
证据明细1 条
平台评测平台 rubric
执行格式和改写快
- 来源
- 模力榜 场景样例评测
- 指标
- 场景适配分
- 分数
- 88/100
- 排名
- #2
- 更新时间
- 2026/06/03
平台自建样例评测,覆盖该应用场景的输出质量、稳定性和可用性。
不代表全量真实业务转化效果,需结合用户自己的 prompt 和审核流程。
打开来源#3
Gemini 2.5 ProGoogle · closed
88应用适配分
数据来源1 条证据
LiveBench独立评测
- 测评时间
- 2026/06/03
- 指标
- 公开来源分
- 分数
- 86/100
公开 benchmark 或第三方来源提供的模型能力信号。
打开来源在该应用场景的公开证据或平台样例评测中表现靠前。
价格 中速度 中上下文 中长
证据明细1 条
独立评测
长材料汇总能力强
- 来源
- LiveBench
- 指标
- 公开来源分
- 分数
- 86/100
- 排名
- #3
- 更新时间
- 2026/06/03
公开 benchmark 或第三方来源提供的模型能力信号。
不能直接代表该应用场景的所有业务效果,因此只作为推荐证据之一。
打开来源