Code · Image-to-WebDev · Image-to-WebDev Leaderboard

Ranking for Image-to-WebDev / Image-to-WebDev, based on public preference data.

Selection guide

Image-to-WebDev model ranking guide

Ranking for Image-to-WebDev / Image-to-WebDev, based on public preference data.

claude-opus-4-7-thinkingclaude-sonnet-4-6claude-opus-4-7claude-opus-4-6-thinkinggpt-5.5-xhigh (codex-harness)

claude-opus-4-7-thinking

Anthropic

100.0

2.1K

¥36 / ¥180Input/Output

claude-sonnet-4-6

Anthropic

95.5

3.2K

¥21.6 / ¥108Input/Output

claude-opus-4-7

Anthropic

90.9

2.4K

¥36 / ¥180Input/Output

claude-opus-4-6-thinking

Anthropic

86.4

¥36 / ¥180Input/Output

gpt-5.5-xhigh (codex-harness)

Openai

81.8

1.8K

400K

¥9 / ¥72Input/Output

claude-opus-4-6

Anthropic

77.3

¥36 / ¥180Input/Output

kimi-k2.6

Moonshot

72.7

1.5K

262K

¥6.84 / ¥28.8Input/Output

gpt-5.5-high (codex-harness)

Openai

68.2

400K

¥9 / ¥72Input/Output

gemini-3.1-pro-preview

Google

63.6

3.6K

1.05M

¥14.4 / ¥86.4Input/Output

gpt-5.5 (codex-harness)

Openai

59.1

1.9K

400K

¥9 / ¥72Input/Output

qwen3.6-plus

Alibaba

54.5

2.6K

¥3.6 / ¥21.6Input/Output

gemini-3-pro

Google

50.0

1.1K

1.05M

¥14.4 / ¥86.4Input/Output

gemini-3-flash

Google

45.5

4.4K

1.05M

¥3.6 / ¥21.6Input/Output

gpt-5.3-codex (codex-harness)

Openai

40.9

2.5K

400K

¥9 / ¥72Input/Output

kimi-k2.5-thinking

Moonshot

36.4

1.7K

262K

¥4.32 / ¥21.6Input/Output

gpt-5.4

Openai

31.8

1.2K

1.05M

¥18 / ¥108Input/Output

gemini-3-flash (thinking-minimal)

Google

27.3

4.4K

1.05M

¥3.6 / ¥21.6Input/Output

gpt-5.1-high

Openai

22.7

1.1K

400K

¥9 / ¥72Input/Output

kimi-k2.5-instant

Moonshot

18.2

1.1K

262K

¥4.32 / ¥21.6Input/Output

grok-4.3

Xai

13.6

965

¥9 / ¥18Input/Output

gpt-5.1

Openai

9.1

1.3K

400K

¥9 / ¥72Input/Output

gemini-3.1-flash-lite-preview

Google

4.5

3.7K

1.05M

¥1.8 / ¥10.8Input/Output

gemini-2.5-pro

Google

0.0

1.2K

1.05M

¥9 / ¥72Input/Output

FAQ

图片转网页排行榜看什么指标？

主要看排名、百分制分数、样本量和来源。分数用于快速比较同一榜单内模型表现，样本量用于判断结果稳定性。

为什么不同榜单不能直接混合成总分？

不同榜单的任务、样本和评测口径不同，模力榜默认只在同一榜单内排序，避免把写作、代码、图像等能力强行合并。

图片转网页模型应该怎么选？

优先看与你任务最接近的榜单，再结合价格、上下文长度、开源闭源和厂商可用性。排名靠前不代表适合所有预算和部署方式。

榜单多久更新？

页面展示的是最新成功采集的公开榜单数据。当前优先使用 LMArena leaderboard dataset，并在页面来源中保留原始链接。

Code · Image-to-WebDev · Image-to-WebDev Leaderboard

Image-to-WebDev model ranking guide

claude-opus-4-7-thinking why it ranks first

Do not only look at rank #1

Compare adjacent capabilities

FAQ