图像 · 文生图 · 产品品牌设计排行榜

基于公开偏好评测数据展示 文生图 / 产品品牌设计 榜单,每个榜单独立排序。

选型指南

产品品牌设计模型怎么选?

产品品牌设计排行榜用于回答“产品品牌设计哪个 AI 模型更强”这类选型问题。页面基于公开偏好评测数据展示模型排名,每个榜单独立排序,不把不同任务的原始分数直接混合。当前榜首是 gpt-image-2 (medium),厂商为 openai,百分制分数 100.0,样本量 15.5K。 数据来源保留 Arena 原始榜单和 LMArena leaderboard dataset,更新时间以榜单发布时间 2026-05-26 为准。

gpt-image-2 (medium)gemini-3.1-flash-image-preview (nano-banana-2) [web-search]mai-image-2.5-previewgemini-3-pro-image-preview-2k (nano-banana-pro)gpt-image-1.5-high-fidelity
当前目录图像 · 文生图 · 产品品牌设计
模型数量64
榜单发布时间2026/05/26
Arena 公开偏好评测原始榜单: 文生图 / 商业设计榜单发布时间: 2026/05/26榜单数据集: LMArena latest parquet打开 Arena 来源打开榜单数据集
1
gpt-image-2 (medium)
Openai
100.0
15.5K
-
¥36.4 / ¥233输入/输出
2
gemini-3.1-flash-image-preview (nano-banana-2) [web-search]
Google
98.4
27K
131K
¥3.6 / ¥21.6输入/输出
3
mai-image-2.5-preview
Microsoft Ai
96.8
1.9K
32K
¥36 / ¥338输入/输出
4
gemini-3-pro-image-preview-2k (nano-banana-pro)
Google
95.2
39.3K
1.05M
¥14.4 / ¥86.4输入/输出
5
gpt-image-1.5-high-fidelity
Openai
93.7
44.7K
1M
¥36 / ¥216输入/输出
6
gemini-3-pro-image-preview (nano-banana-pro)
Google
92.1
26.3K
1.05M
¥14.4 / ¥86.4输入/输出
7
grok-imagine-image-quality
Xai
90.5
7.7K
1M
¥9 / ¥18输入/输出
8
uni-1.1-max
Luma Ai
88.9
3.4K
-
-
9
reve-v1.5
Reve
87.3
5.8K
-
-
10
uni-1.1
Luma Ai
85.7
3.9K
-
-
11
grok-imagine-image
Xai
84.1
62.8K
1M
¥9 / ¥18输入/输出
12
mai-image-2
Microsoft Ai
82.5
18.7K
32K
¥36 / ¥338输入/输出
13
flux-2-flex
Bfl
81.0
52.7K
-
-
14
recraft-v4.1-utility-pro
Recraft
79.4
1K
-
-
15
grok-imagine-image-pro
Xai
77.8
34.4K
1M
¥9 / ¥18输入/输出
16
flux-2-max
Bfl
76.2
41.7K
-
-
17
flux-2-pro
Bfl
74.6
53.6K
-
-
18
flux-2-dev
Bfl
73.0
20.2K
-
-
19
qwen-image-2.0-pro-2026-04-22
Alibaba
71.4
2.2K
8.19K
¥0 / ¥0输入/输出
20
hunyuan-image-3.0
Tencent
69.8
55.5K
-
-
21
gemini-2.5-flash-image-preview (nano-banana)
Google
68.3
233K
1.05M
¥2.16 / ¥18输入/输出
22
imagen-ultra-4.0-generate-001
Google
66.7
108K
-
-
23
wan2.6-t2i
Alibaba
65.1
55.5K
-
-
24
seedream-4.5
Bytedance
63.5
69.2K
-
-
25
wan2.5-t2i-preview
Alibaba
61.9
68.3K
-
-
26
recraft-v4.1-pro
Recraft
60.3
1.1K
-
-
27
hidream-o1-image
Hidream
58.7
2K
200K
¥108 / ¥432输入/输出
28
seedream-4-2k
Bytedance
57.1
3.5K
-
-
29
qwen-image-2512
Alibaba
55.6
25K
8.19K
¥3.6 / ¥14.4输入/输出
30
imagen-4.0-generate-001
Google
54.0
153.3K
-
-
31
seedream-4-fal
Bytedance
52.4
3.2K
-
-
32
seedream-5.0-lite
Bytedance
50.8
26.6K
-
-
33
recraft-v4
Recraft
49.2
25.9K
-
-
34
qwen-image-2.0-2026-03-03
Alibaba
47.6
20.6K
8.19K
¥0 / ¥0输入/输出
35
gpt-image-1
Openai
46.0
81.2K
-
¥36 / ¥288输入/输出
36
wan2.7-image-pro
Alibaba
44.4
11.5K
8.19K
¥0 / ¥0输入/输出
37
seedream-4-high-res-fal
Bytedance
42.9
57.9K
-
-
38
wan2.7-image
Alibaba
41.3
11.6K
8.19K
¥0 / ¥0输入/输出
39
gpt-image-1-mini
Openai
39.7
58.4K
1M
¥36 / ¥216输入/输出
40
qwen-image-prompt-extend
Alibaba
38.1
205.6K
8.19K
¥3.6 / ¥14.4输入/输出
41
mai-image-1
Microsoft Ai
36.5
34.5K
32K
¥36 / ¥338输入/输出
42
flux-1-kontext-max
Bfl
34.9
16.6K
-
-
43
ideogram-v3-quality
Ideogram
33.3
36.8K
-
-
44
seedream-3
Bytedance
31.7
10.3K
-
-
45
flux-2-klein-9b
Bfl
30.2
51.5K
-
-
46
flux-1-kontext-pro
Bfl
28.6
91.3K
-
-
47
qwen-image
Alibaba
27.0
18K
8.19K
¥3.6 / ¥14.4输入/输出
48
z-image-turbo
Alibaba
25.4
6.2K
-
-
49
imagen-3.0-generate-002
Google
23.8
88K
-
-
50
ideogram-v2
Ideogram
22.2
10.3K
-
-
51
photon
Luma Ai
20.6
37.1K
-
-
52
glm-image
Zai
19.0
1.6K
200K
¥5.4 / ¥18.7输入/输出
53
p-image
-
17.5
35.9K
-
-
54
runway-gen4
Runway
15.9
18.3K
-
-
55
flux-2-klein-4b
Bfl
14.3
52.5K
-
-
56
recraft-v3
Recraft
12.7
46.7K
-
-
57
lucid-origin
Leonardo Ai
11.1
82.9K
-
-
58
gemini-2.0-flash-preview-image-generation
Google
9.5
68K
1.05M
¥1.08 / ¥4.32输入/输出
59
flux-1.1-pro
Bfl
7.9
10.1K
-
-
60
flux-1-dev-fp8
Bfl
6.3
6.4K
-
-
61
dall-e-3
Openai
4.8
56.3K
-
-
62
flux-1-kontext-dev
Bfl
3.2
58.4K
-
-
63
stable-diffusion-v35-large
-
1.6
3.1K
0.26K
¥0.58 / ¥0输入/输出
64
bagel
Bytedance
0.0
3.3K
-
-
榜首模型解读

gpt-image-2 (medium) 为什么排第一

gpt-image-2 (medium) 当前排名第 1,厂商为 openai,百分制分数 100.0,样本量 15.5K。如果你的任务与本榜单口径一致,可以优先把它作为候选模型,再结合价格、上下文长度和可用性做最终选择。

如何选择模型

不要只看第一名

先选择最接近真实任务的排行榜,再比较 Top 模型的分数和样本量。分数越高说明同一榜单内偏好表现越强;样本量越高通常结果更稳定。最后再结合价格、上下文长度、开源闭源和厂商可用性筛选。

常见问题

产品品牌设计常见问题

产品品牌设计排行榜看什么指标?

主要看排名、百分制分数、样本量和来源。分数用于快速比较同一榜单内模型表现,样本量用于判断结果稳定性。

为什么不同榜单不能直接混合成总分?

不同榜单的任务、样本和评测口径不同,模力榜默认只在同一榜单内排序,避免把写作、代码、图像等能力强行合并。

产品品牌设计模型应该怎么选?

优先看与你任务最接近的榜单,再结合价格、上下文长度、开源闭源和厂商可用性。排名靠前不代表适合所有预算和部署方式。

榜单多久更新?

页面展示的是最新成功采集的公开榜单数据。当前优先使用 LMArena leaderboard dataset,并在页面来源中保留原始链接。