图像 · 文生图 · 总榜

基于公开偏好评测数据展示 文生图 / 总榜 榜单,每个榜单独立排序。

选型指南

总榜模型怎么选?

总榜排行榜用于回答“总榜哪个 AI 模型更强”这类选型问题。页面基于公开偏好评测数据展示模型排名,每个榜单独立排序,不把不同任务的原始分数直接混合。当前榜首是 gpt-image-2 (medium),厂商为 openai,百分制分数 100.0,样本量 45.1K。 数据来源保留 Arena 原始榜单和 LMArena leaderboard dataset,更新时间以榜单发布时间 2026-06-05 为准。

gpt-image-2 (medium)reve-2.0gemini-3.1-flash-image-preview (nano-banana-2) [web-search]mai-image-2.5gemini-3-pro-image-preview-2k (nano-banana-pro)
当前目录图像 · 文生图 · 总榜
模型数量70
榜单发布时间2026/06/05
Arena 公开偏好评测原始榜单: 文生图总榜榜单发布时间: 2026/06/05榜单数据集: LMArena latest parquet打开 Arena 来源打开榜单数据集
1
gpt-image-2 (medium)
Openai
100.0
45.1K
-
¥36 / ¥216输入/输出
2
reve-2.0
Reve
98.6
4.8K
-
-
3
gemini-3.1-flash-image-preview (nano-banana-2) [web-search]
Google
97.1
75.7K
131K
¥3.6 / ¥21.6输入/输出
4
mai-image-2.5
Microsoft Ai
95.7
12.1K
32K
¥36 / ¥338输入/输出
5
gemini-3-pro-image-preview-2k (nano-banana-pro)
Google
94.2
114.1K
131K
¥14.4 / ¥864输入/输出
6
gpt-image-1.5-high-fidelity
Openai
92.8
118.4K
-
¥36 / ¥230输入/输出
7
grok-imagine-image-quality
Xai
91.3
23.8K
1M
¥9 / ¥18输入/输出
8
gemini-3-pro-image-preview (nano-banana-pro)
Google
89.9
82.6K
131K
¥14.4 / ¥864输入/输出
9
ideogram-4.0-quality
Ideogram
88.4
3.5K
-
-
10
uni-1.1-max
Luma Ai
87.0
11.9K
-
-
11
mai-image-2
Microsoft Ai
85.5
48.8K
32K
¥36 / ¥338输入/输出
12
uni-1.1
Luma Ai
84.1
13.5K
-
-
13
grok-imagine-image
Xai
82.6
175.4K
1M
¥9 / ¥18输入/输出
14
recraft-v4.1-utility-pro
Recraft
81.2
2.5K
-
-
15
qwen-image-2.0-pro-2026-04-22
Alibaba
79.7
5.1K
8.19K
¥0 / ¥0输入/输出
16
flux-2-max
Bfl
78.3
115.7K
-
-
17
grok-imagine-image-pro
Xai
76.8
93.1K
1M
¥9 / ¥18输入/输出
18
flux-2-flex
Bfl
75.4
147.4K
-
-
19
flux-2-pro
Bfl
73.9
151.4K
-
-
20
reve-v1.5
Reve
72.5
18.7K
-
-
21
gemini-2.5-flash-image-preview (nano-banana)
Google
71.0
784.1K
1.05M
¥2.16 / ¥18输入/输出
22
hunyuan-image-3.0
Tencent
69.6
172.7K
-
-
23
flux-2-dev
Bfl
68.1
58.7K
-
-
24
imagen-ultra-4.0-generate-001
Google
66.7
388K
-
-
25
seedream-4.5
Bytedance
65.2
195.4K
-
-
26
seedream-4-2k
Bytedance
63.8
12.6K
-
-
27
wan2.6-t2i
Alibaba
62.3
151.1K
-
-
28
seedream-5.0-lite
Bytedance
60.9
72.2K
-
-
29
recraft-v4.1-pro
Recraft
59.4
2.7K
-
-
30
imagen-4.0-generate-001
Google
58.0
519.4K
-
-
31
qwen-image-2512
Alibaba
56.5
73.5K
8.19K
¥3.6 / ¥14.4输入/输出
32
hidream-o1-image
Hidream
55.1
9.4K
200K
¥108 / ¥432输入/输出
33
krea-2-medium
Krea
53.6
2.6K
-
-
34
wan2.5-t2i-preview
Alibaba
52.2
199.6K
-
-
35
seedream-4-fal
Bytedance
50.7
11.9K
-
-
36
gpt-image-1
Openai
49.3
264.7K
-
¥36 / ¥288输入/输出
37
qwen-image-2.0-2026-03-03
Alibaba
47.8
58K
8.19K
¥0 / ¥0输入/输出
38
seedream-4-high-res-fal
Bytedance
46.4
173.5K
-
-
39
recraft-v4
Recraft
44.9
73.8K
-
-
40
gpt-image-1-mini
Openai
43.5
162K
-
¥14.4 / ¥57.6输入/输出
41
wan2.7-image-pro
Alibaba
42.0
28.5K
8.19K
¥0 / ¥0输入/输出
42
krea-2-large
Krea
40.6
2.6K
-
-
43
wan2.7-image
Alibaba
39.1
28.9K
8.19K
¥0 / ¥0输入/输出
44
mai-image-1
Microsoft Ai
37.7
94.4K
32K
¥36 / ¥338输入/输出
45
seedream-3
Bytedance
36.2
36.8K
-
-
46
z-image-turbo
Alibaba
34.8
18.6K
-
-
47
flux-1-kontext-max
Bfl
33.3
65.6K
-
-
48
flux-2-klein-9b
Bfl
31.9
139.9K
-
-
49
Cosmos3-Super-Text2Image
Nvidia
30.4
3K
-
-
50
qwen-image-prompt-extend
Alibaba
29.0
702K
8.19K
¥3.6 / ¥14.4输入/输出
51
flux-1-kontext-pro
Bfl
27.5
330.7K
-
-
52
imagen-3.0-generate-002
Google
26.1
360.2K
-
-
53
qwen-image
Alibaba
24.6
84.7K
8.19K
¥3.6 / ¥14.4输入/输出
54
Cosmos3-Super-Text2Image (Agentic)
Nvidia
23.2
3K
-
-
55
ideogram-v3-quality
Ideogram
21.7
115.2K
-
-
56
photon
Luma Ai
20.3
127.4K
-
-
57
p-image
-
18.8
102.1K
-
-
58
flux-2-klein-4b
Bfl
17.4
141.8K
-
-
59
runway-gen4
Runway
15.9
50.3K
-
-
60
recraft-v3
Recraft
14.5
191.9K
-
-
61
flux-1.1-pro
Bfl
13.0
70.5K
-
-
62
lucid-origin
Leonardo Ai
11.6
285.5K
-
-
63
ideogram-v2
Ideogram
10.1
72.1K
-
-
64
glm-image
Zai
8.7
4.6K
200K
¥5.4 / ¥18.7输入/输出
65
gemini-2.0-flash-preview-image-generation
Google
7.2
257.1K
1.05M
¥0.72 / ¥2.88输入/输出
66
flux-1-dev-fp8
Bfl
5.8
49.2K
-
-
67
dall-e-3
Openai
4.3
239.3K
-
-
68
flux-1-kontext-dev
Bfl
2.9
215.3K
-
-
69
stable-diffusion-v35-large
-
1.4
23.4K
0.26K
¥0.58 / ¥0输入/输出
70
bagel
Bytedance
0.0
12.4K
-
-
榜首模型解读

gpt-image-2 (medium) 为什么排第一

gpt-image-2 (medium) 当前排名第 1,厂商为 openai,百分制分数 100.0,样本量 45.1K。如果你的任务与本榜单口径一致,可以优先把它作为候选模型,再结合价格、上下文长度和可用性做最终选择。

如何选择模型

不要只看第一名

先选择最接近真实任务的排行榜,再比较 Top 模型的分数和样本量。分数越高说明同一榜单内偏好表现越强;样本量越高通常结果更稳定。最后再结合价格、上下文长度、开源闭源和厂商可用性筛选。

常见问题

总榜常见问题

总榜排行榜看什么指标?

主要看排名、百分制分数、样本量和来源。分数用于快速比较同一榜单内模型表现,样本量用于判断结果稳定性。

为什么不同榜单不能直接混合成总分?

不同榜单的任务、样本和评测口径不同,模力榜默认只在同一榜单内排序,避免把写作、代码、图像等能力强行合并。

总榜模型应该怎么选?

优先看与你任务最接近的榜单,再结合价格、上下文长度、开源闭源和厂商可用性。排名靠前不代表适合所有预算和部署方式。

榜单多久更新?

页面展示的是最新成功采集的公开榜单数据。当前优先使用 LMArena leaderboard dataset,并在页面来源中保留原始链接。

筛选项

筛选项

输入价格0 - 108 元/百万 token
-
输出价格0 - 864 元/百万 token
-
上下文长度0 - 1048576 token
-
厂商
模式