图像 · 图像编辑 · 多图片编辑排行榜

基于公开偏好评测数据展示图像编辑 / 多图片编辑榜单，每个榜单独立排序。

选型指南

多图片编辑模型怎么选？

多图片编辑排行榜用于回答“多图片编辑哪个 AI 模型更强”这类选型问题。页面基于公开偏好评测数据展示模型排名，每个榜单独立排序，不把不同任务的原始分数直接混合。当前榜首是 gpt-image-2 (medium)，厂商为 openai，百分制分数 100.0，样本量 28K。数据来源保留 Arena 原始榜单和 LMArena leaderboard dataset，更新时间以榜单发布时间 2026-05-12 为准。

gpt-image-2 (medium)gemini-3.1-flash-image-preview (nano-banana-2) [web-search]gemini-3-pro-image-preview (nano-banana-pro)gemini-3-pro-image-preview-2k (nano-banana-pro)chatgpt-image-latest-high-fidelity (20251216)

gpt-image-2 (medium)

Openai

100.0

28K

¥36.4 / ¥233输入/输出

gemini-3.1-flash-image-preview (nano-banana-2) [web-search]

Google

97.1

66.4K

131K

¥3.6 / ¥21.6输入/输出

gemini-3-pro-image-preview (nano-banana-pro)

Google

94.3

285.3K

1.05M

¥14.4 / ¥86.4输入/输出

gemini-3-pro-image-preview-2k (nano-banana-pro)

Google

91.4

141K

1.05M

¥14.4 / ¥86.4输入/输出

chatgpt-image-latest-high-fidelity (20251216)

Openai

88.6

141.4K

¥36 / ¥216输入/输出

gpt-image-1.5-high-fidelity

Openai

85.7

122.4K

¥36 / ¥216输入/输出

uni-1.1-max

Luma Ai

82.9

7.9K

seedream-4.5

Bytedance

80.0

317.8K

uni-1.1

Luma Ai

77.1

8.1K

wan2.7-image-pro

Alibaba

74.3

16.4K

8.19K

¥0 / ¥0输入/输出

wan2.7-image

Alibaba

71.4

17.5K

8.19K

¥0 / ¥0输入/输出

seedream-5.0-lite

Bytedance

68.6

109.1K

reve-v1.1

Reve

65.7

230.3K

kling-image-o1

Kling

62.9

31.4K

200K

¥108 / ¥432输入/输出

flux-2-max

Bfl

60.0

120.3K

flux-2-pro

Bfl

57.1

120.6K

gemini-2.5-flash-image-preview (nano-banana)

Google

54.3

4421.2K

1.05M

¥2.16 / ¥18输入/输出

flux-2-flex

Bfl

51.4

109.1K

reve-v1

Reve

48.6

532.3K

wan2.6-image

Alibaba

45.7

115.4K

flux-2-klein-9b

Bfl

42.9

126.1K

seedream-4-high-res-fal

Bytedance

40.0

993.1K

flux-2-dev

Bfl

37.1

70.7K

seedream-4-2k

Bytedance

34.3

30.5K

qwen-image-edit-2511

Alibaba

31.4

141K

8.19K

¥3.6 / ¥14.4输入/输出

flux-2-klein-4b

Bfl

28.6

126.1K

wan2.5-i2i-preview

Alibaba

25.7

58.6K

seedream-4-fal

Bytedance

22.9

310.1K

UNp-image-edit

20.0

109.9K

¥0 / ¥0输入/输出

gpt-image-1

Openai

17.1

1830K

¥36 / ¥288输入/输出

gpt-image-1-mini

Openai

14.3

602.4K

¥36 / ¥216输入/输出

flux-1-kontext-pro

Bfl

11.4

142.2K

flux-1-kontext-max

Bfl

8.6

52.1K

gemini-2.0-flash-preview-image-generation

Google

5.7

3175.4K

1.05M

¥1.08 / ¥4.32输入/输出

seededit-3.0

Bytedance

2.9

87.8K

flux-1-kontext-dev

Bfl

0.0

130.5K

常见问题

多图片编辑常见问题

多图片编辑排行榜看什么指标？

主要看排名、百分制分数、样本量和来源。分数用于快速比较同一榜单内模型表现，样本量用于判断结果稳定性。

为什么不同榜单不能直接混合成总分？

不同榜单的任务、样本和评测口径不同，模力榜默认只在同一榜单内排序，避免把写作、代码、图像等能力强行合并。

多图片编辑模型应该怎么选？

优先看与你任务最接近的榜单，再结合价格、上下文长度、开源闭源和厂商可用性。排名靠前不代表适合所有预算和部署方式。

榜单多久更新？

页面展示的是最新成功采集的公开榜单数据。当前优先使用 LMArena leaderboard dataset，并在页面来源中保留原始链接。

图像 · 图像编辑 · 多图片编辑排行榜

多图片编辑模型怎么选？

gpt-image-2 (medium) 为什么排第一

不要只看第一名

继续比较相近能力

多图片编辑常见问题