内容创作

写文章模型排名

比较模型的中文长文结构、表达自然度、事实稳定性和风格控制能力。

Models3

Evidence3

Updated06/03 16:30

#1

Claude 3.7 SonnetAnthropic · closed

最强长文中文润色结构稳定

94应用适配分

长文结构、语气控制和润色稳定性最好，适合公众号和深度文章。

价格中高速度中上下文长上下文友好

证据明细1 条

平台评测平台 rubric

长文结构和中文润色稳定

来源: 模力榜场景样例评测
指标: 场景适配分
分数: 92/100
排名: #1
更新时间: 2026/06/03

平台自建样例评测，覆盖该应用场景的输出质量、稳定性和可用性。

不代表全量真实业务转化效果，需结合用户自己的 prompt 和审核流程。

#2

GPT-4oOpenAI · closed

通用稳妥速度快多风格

91应用适配分

通用写作表现均衡，适合快速生成多版本文章。

价格中速度快上下文中长

证据明细1 条

独立评测

通用写作偏好靠前

来源: LMArena
指标: 公开来源分
分数: 89/100
排名: #2
更新时间: 2026/06/03

公开 benchmark 或第三方来源提供的模型能力信号。

不能直接代表该应用场景的所有业务效果，因此只作为推荐证据之一。

#3

Gemini 2.5 ProGoogle · closed

长材料资料整合研究写作

88应用适配分

长上下文材料整合能力突出，适合基于资料写文章。

价格中速度中上下文长

证据明细1 条

独立评测

长上下文材料整合强

来源: LiveBench
指标: 公开来源分
分数: 86/100
排名: #3
更新时间: 2026/06/03

公开 benchmark 或第三方来源提供的模型能力信号。

不能直接代表该应用场景的所有业务效果，因此只作为推荐证据之一。