对话 · 文本 · 数学排行榜

基于公开偏好评测数据展示文本 / 数学榜单，每个榜单独立排序。

选型指南

数学模型怎么选？

数学排行榜用于回答“数学哪个 AI 模型更强”这类选型问题。页面基于公开偏好评测数据展示模型排名，每个榜单独立排序，不把不同任务的原始分数直接混合。当前榜首是 gemini-3.5-flash，厂商为 google，百分制分数 100.0，样本量 526。数据来源保留 Arena 原始榜单和 LMArena leaderboard dataset，更新时间以榜单发布时间 2026-05-27 为准。

gemini-3.5-flashclaude-opus-4-6-thinkingclaude-opus-4-6gpt-5.4-highqwen3.7-max-preview

gemini-3.5-flash

Google

100.0

526

1.05M

¥10.8 / ¥64.8输入/输出

claude-opus-4-6-thinking

Anthropic

99.7

¥36 / ¥180输入/输出

claude-opus-4-6

Anthropic

99.4

2.2K

¥36 / ¥180输入/输出

gpt-5.4-high

Openai

99.1

1.7K

1.05M

¥18 / ¥108输入/输出

qwen3.7-max-preview

Alibaba

98.9

220

¥18 / ¥54输入/输出

gemini-3.1-pro-preview

Google

98.6

2.6K

1.05M

¥14.4 / ¥86.4输入/输出

claude-opus-4-7-thinking

Anthropic

98.3

1.2K

¥36 / ¥180输入/输出

claude-opus-4-7

Anthropic

98.0

1.2K

¥36 / ¥180输入/输出

mimo-v2.5-pro

Xiaomi

97.7

866

1.05M

¥7.2 / ¥21.6输入/输出

ernie-5.1

Baidu

97.4

836

119K

¥5.4 / ¥21.6输入/输出

gpt-5.5

Openai

97.1

1.05M

¥36 / ¥216输入/输出

gpt-5.5-high

Openai

96.8

1.05M

¥36 / ¥216输入/输出

qwen3.6-max-preview

Alibaba

96.6

327

246K

¥9.5 / ¥56.9输入/输出

glm-5.1

Zai

96.3

860

200K

¥0 / ¥0输入/输出

qwen3.5-max-preview

Alibaba

96.0

1.3K

gemini-3-pro

Google

95.7

2.7K

1.05M

¥14.4 / ¥86.4输入/输出

gemini-3-flash

Google

95.4

1.05M

¥3.6 / ¥21.6输入/输出

kimi-k2.6

Moonshot

95.1

887

262K

¥6.84 / ¥28.8输入/输出

kimi-k2.5-thinking

Moonshot

94.8

2.3K

262K

¥4.32 / ¥21.6输入/输出

gemma-4-26b-a4b

Google

94.5

369

262K

¥0.94 / ¥2.88输入/输出

deepseek-v4-pro-thinking

Deepseek

94.3

886

¥3.13 / ¥6.26输入/输出

gemma-4-31b

Google

94.0

398

262K

¥3.24 / ¥7.2输入/输出

grok-4.20-beta-0309-reasoning

Xai

93.7

1.7K

¥14.4 / ¥43.2输入/输出

claude-opus-4-5-20251101

Anthropic

93.4

4.1K

200K

¥36 / ¥180输入/输出

claude-opus-4-5-20251101-thinking-32k

Anthropic

93.1

2.3K

200K

¥108 / ¥540输入/输出

claude-sonnet-4-6

Anthropic

92.8

1.7K

¥21.6 / ¥108输入/输出

muse-spark

Meta

92.5

795

gpt-5.4

Openai

92.2

1.8K

1.05M

¥18 / ¥108输入/输出

qwen3.6-plus

Alibaba

92.0

1.1K

¥3.6 / ¥21.6输入/输出

gemini-2.5-pro

Google

91.7

7.5K

1.05M

¥9 / ¥72输入/输出

qwen3-max-preview

Alibaba

91.4

1.5K

262K

¥6.2 / ¥24.8输入/输出

gemini-3-flash (thinking-minimal)

Google

91.1

3.2K

1.05M

¥3.6 / ¥21.6输入/输出

mimo-v2-pro

Xiaomi

90.8

1.5K

1.05M

¥7.2 / ¥21.6输入/输出

qwen3.5-397b-a17b

Alibaba

90.5

262K

¥3.1 / ¥18.6输入/输出

claude-sonnet-4-5-20250929-thinking-32k

Anthropic

90.2

4.7K

200K

¥21.6 / ¥108输入/输出

deepseek-v4-flash

Deepseek

89.9

992

¥1.01 / ¥2.02输入/输出

grok-4.20-multi-agent-beta-0309

Xai

89.7

1.7K

¥14.4 / ¥43.2输入/输出

gpt-5.1-high

Openai

89.4

2.5K

400K

¥9 / ¥72输入/输出

gpt-5.2-high

Openai

89.1

2.9K

400K

¥12.6 / ¥101输入/输出

qwen3-next-80b-a3b-instruct

Alibaba

88.8

1.2K

131K

¥1.04 / ¥4.13输入/输出

kimi-k2.5-instant

Moonshot

88.5

515

262K

¥4.32 / ¥21.6输入/输出

longcat-flash-chat

Meituan

88.2

689

128K

¥1.08 / ¥10.8输入/输出

amazon-nova-experimental-chat-26-02-10

Amazon

87.9

207

ernie-5.0-0110

Baidu

87.6

2.1K

128K

¥7.92 / ¥14.4输入/输出

qwen3-max-2025-09-23

Alibaba

87.4

584

258K

¥6.19 / ¥24.7输入/输出

mimo-v2.5

Xiaomi

87.1

914

1.05M

¥2.88 / ¥14.4输入/输出

dola-seed-2.0-pro

Bytedance

86.8

2.3K

gpt-5.2-chat-latest-20260210

Openai

86.5

400K

¥12.6 / ¥101输入/输出

deepseek-v3.2

Deepseek

86.2

128K

¥2.09 / ¥3.1输入/输出

grok-4.20-beta1

Xai

85.9

1.5K

¥14.4 / ¥43.2输入/输出

glm-5

Zai

85.6

1.4K

205K

¥7.2 / ¥23输入/输出

longcat-flash-chat-2602-exp

Meituan

85.3

1.5K

128K

¥1.08 / ¥10.8输入/输出

glm-4.6

Zai

85.1

2.1K

205K

¥4.32 / ¥15.8输入/输出

kimi-k2-thinking-turbo

Moonshot

84.8

3.7K

262K

¥17.3 / ¥72输入/输出

qwen3.5-27b

Alibaba

84.5

1.6K

262K

¥2.16 / ¥17.3输入/输出

deepseek-v4-pro

Deepseek

84.2

¥3.13 / ¥6.26输入/输出

amazon-nova-experimental-chat-11-10

Amazon

83.9

1.6K

qwen3-235b-a22b-instruct-2507

Alibaba

83.6

5.8K

128K

¥2.09 / ¥8.23输入/输出

claude-opus-4-1-20250805-thinking-16k

Anthropic

83.3

200K

¥108 / ¥540输入/输出

gemini-3.1-flash-lite-preview

Google

83.0

2.2K

1.05M

¥1.8 / ¥10.8输入/输出

amazon-nova-experimental-chat-10-20

Amazon

82.8

805

glm-4.5

Zai

82.5

1.4K

131K

¥4.32 / ¥15.8输入/输出

gpt-5.5-instant

Openai

82.2

1.4K

400K

¥9 / ¥72输入/输出

qwen3.5-122b-a10b

Alibaba

81.9

1.7K

262K

¥2.88 / ¥23输入/输出

deepseek-v3.2-exp-thinking

Deepseek

81.6

481

128K

¥0 / ¥0输入/输出

deepseek-v4-flash-thinking

Deepseek

81.3

948

¥1.01 / ¥2.02输入/输出

o3-2025-04-16

Openai

81.0

3.7K

200K

¥14.4 / ¥57.6输入/输出

grok-4-0709

Xai

80.7

2.3K

256K

¥21.6 / ¥108输入/输出

qwen3-vl-235b-a22b-instruct

Alibaba

80.5

704

128K

¥2.16 / ¥8.64输入/输出

grok-4.1-thinking

Xai

80.2

3.7K

200K

¥14.4 / ¥72输入/输出

glm-4.7

Zai

79.9

711

205K

¥0 / ¥0输入/输出

deepseek-v3.2-exp

Deepseek

79.6

775

128K

¥0 / ¥0输入/输出

claude-opus-4-1-20250805

Anthropic

79.3

4.7K

200K

¥108 / ¥540输入/输出

hunyuan-hy3-preview

Tencent

79.0

378

256K

¥0 / ¥0输入/输出

amazon-nova-experimental-chat-12-10

Amazon

78.7

234

deepseek-v3.1

Deepseek

78.4

992

128K

¥1.44 / ¥5.04输入/输出

claude-sonnet-4-5-20250929

Anthropic

78.2

4.7K

200K

¥21.6 / ¥108输入/输出

grok-4.1

Xai

77.9

4.1K

200K

¥14.4 / ¥72输入/输出

gpt-5.2

Openai

77.6

2.8K

400K

¥12.6 / ¥101输入/输出

deepseek-v3.2-thinking

Deepseek

77.3

2.5K

128K

¥2.09 / ¥3.1输入/输出

gpt-5.4-mini-high

Openai

77.0

1.6K

400K

¥5.4 / ¥32.4输入/输出

gpt-5.4-nano-high

Openai

76.7

1.5K

400K

¥1.44 / ¥9输入/输出

grok-4-fast-chat

Xai

76.4

399

¥1.44 / ¥3.6输入/输出

gemini-2.5-flash-preview-09-2025

Google

76.1

1.9K

¥2.16 / ¥18输入/输出

mistral-large-3

Mistral

75.9

2.7K

262K

¥3.6 / ¥10.8输入/输出

qwen3-vl-235b-a22b-thinking

Alibaba

75.6

428

131K

¥2.06 / ¥8.26输入/输出

deepseek-v3.1-thinking

Deepseek

75.3

665

128K

¥1.44 / ¥5.04输入/输出

qwen3-235b-a22b-thinking-2507

Alibaba

75.0

490

131K

¥2.07 / ¥8.26输入/输出

gpt-4.5-preview-2025-02-27

Openai

74.7

1.4K

8.19K

¥216 / ¥432输入/输出

gemini-2.5-flash

Google

74.4

7.8K

1.05M

¥2.16 / ¥18输入/输出

minimax-m2.7

Minimax

74.1

1.4K

205K

¥0 / ¥0输入/输出

mistral-medium-2508

Mistral

73.9

5.7K

262K

¥2.88 / ¥14.4输入/输出

ernie-5.0-preview-1022

Baidu

73.6

268

128K

¥7.92 / ¥14.4输入/输出

gpt-5.1

Openai

73.3

2.9K

400K

¥9 / ¥72输入/输出

hunyuan-t1-20250711

Tencent

73.0

236

131K

¥0 / ¥0输入/输出

gpt-5-chat

Openai

72.7

1.8K

400K

¥9 / ¥72输入/输出

deepseek-v3.1-terminus-thinking

Deepseek

72.4

200

128K

¥1.8 / ¥5.04输入/输出

qwen3.5-flash

Alibaba

72.1

1.9K

¥1.24 / ¥12.4输入/输出

grok-4-1-fast-reasoning

Xai

71.8

3.4K

¥1.44 / ¥3.6输入/输出

100

qwen3.5-35b-a3b

Alibaba

71.6

1.7K

262K

¥1.8 / ¥14.4输入/输出

101

chatgpt-4o-latest-20250326

Openai

71.3

5.7K

128K

¥18 / ¥72输入/输出

102

ernie-5.0-preview-1203

Baidu

71.0

618

128K

¥7.92 / ¥14.4输入/输出

103

step-3.5-flash

Stepfun

70.7

2.1K

256K

¥0.69 / ¥2.07输入/输出

104

grok-4-fast-reasoning

Xai

70.4

1.1K

¥1.44 / ¥3.6输入/输出

105

deepseek-r1-0528

Deepseek

70.1

869

164K

¥3.6 / ¥15.5输入/输出

106

amazon-nova-experimental-chat-26-01-10

Amazon

69.8

263

107

deepseek-v3.1-terminus

Deepseek

69.5

218

128K

¥1.8 / ¥5.04输入/输出

108

qwen3-235b-a22b-no-thinking

Alibaba

69.3

2.4K

131K

¥2.07 / ¥8.26输入/输出

109

grok-4.3

Xai

69.0

846

¥9 / ¥18输入/输出

110

qwen3-32b

Alibaba

68.7

316

131K

¥2.07 / ¥8.26输入/输出

111

gpt-5-high

Openai

68.4

1.9K

400K

¥9 / ¥72输入/输出

112

glm-4.5-air

Zai

68.1

1.5K

131K

¥0 / ¥0输入/输出

113

kimi-k2-0905-preview

Moonshot

67.8

759

262K

¥4.32 / ¥18输入/输出

114

mimo-v2-flash (non-thinking)

Xiaomi

67.5

2.7K

262K

¥0.72 / ¥2.16输入/输出

115

o3-mini-high

Openai

67.2

1.9K

200K

¥7.92 / ¥31.7输入/输出

116

qwen3-235b-a22b

Alibaba

67.0

1.6K

131K

¥2.07 / ¥8.26输入/输出

117

minimax-m2.1-preview

Minimax

66.7

205K

¥0 / ¥0输入/输出

118

qwen3-next-80b-a3b-thinking

Alibaba

66.4

829

131K

¥1.04 / ¥10.3输入/输出

119

qwen3-30b-a3b-instruct-2507

Alibaba

66.1

1.4K

262K

¥2.16 / ¥3.6输入/输出

120

nvidia-llama-3.3-nemotron-super-49b-v1.5

Nvidia

65.8

194

131K

¥2.88 / ¥2.88输入/输出

121

deepseek-r1

Deepseek

65.5

1.6K

164K

¥5.04 / ¥18输入/输出

122

claude-opus-4-20250514-thinking-16k

Anthropic

65.2

2.2K

200K

¥108 / ¥540输入/输出

123

grok-3-preview-02-24

Xai

64.9

2.7K

¥9 / ¥18输入/输出

124

claude-haiku-4-5-20251001

Anthropic

64.7

4.7K

200K

¥7.2 / ¥36输入/输出

125

o1-2024-12-17

Openai

64.4

128K

¥108 / ¥432输入/输出

126

gpt-oss-120b

Openai

64.1

1.8K

131K

¥1.08 / ¥4.32输入/输出

127

o4-mini-2025-04-16

Openai

63.8

2.9K

200K

¥7.92 / ¥31.7输入/输出

128

gpt-5.3-chat-latest

Openai

63.5

1.9K

128K

¥12.6 / ¥101输入/输出

129

UNintellect-3

63.2

332

131K

¥1.44 / ¥7.92输入/输出

130

grok-3-mini-high

Xai

62.9

977

128K

¥0 / ¥0输入/输出

131

minimax-m2.5

Minimax

62.6

2.2K

205K

¥0 / ¥0输入/输出

132

nvidia-nemotron-3-super-120b-a12b

Nvidia

62.4

511

262K

¥1.44 / ¥5.76输入/输出

133

mimo-v2-flash (thinking)

Xiaomi

62.1

633

262K

¥0.72 / ¥2.16输入/输出

134

gpt-5-mini-high

Openai

61.8

1.5K

400K

¥1.8 / ¥14.4输入/输出

135

claude-sonnet-4-20250514-thinking-32k

Anthropic

61.5

200K

¥21.6 / ¥108输入/输出

136

deepseek-v3-0324

Deepseek

61.2

3.2K

75K

¥1.44 / ¥5.76输入/输出

137

nvidia-nemotron-3-nano-30b-a3b-bf16

Nvidia

60.9

987

131K

¥0 / ¥0输入/输出

138

gemini-2.5-flash-lite-preview-09-2025-no-thinking

Google

60.6

2.9K

1.05M

¥0.72 / ¥2.88输入/输出

139

o3-mini

Openai

60.3

4.7K

200K

¥7.92 / ¥31.7输入/输出

140

claude-opus-4-20250514

Anthropic

60.1

2.8K

200K

¥108 / ¥540输入/输出

141

o1-preview

Openai

59.8

4.6K

128K

¥108 / ¥432输入/输出

142

UNtrinity-large-thinking

59.5

1.4K

262K

¥1.8 / ¥6.48输入/输出

143

ling-flash-2.0

Ant Group

59.2

461

131K

¥1.01 / ¥4.1输入/输出

144

grok-3-mini-beta

Xai

58.9

1.5K

¥9 / ¥18输入/输出

145

qwen2.5-max

Alibaba

58.6

3.3K

32K

¥11.5 / ¥46输入/输出

146

gpt-4.1-2025-04-14

Openai

58.3

3.2K

1.05M

¥14.4 / ¥57.6输入/输出

147

kimi-k2-0711-preview

Moonshot

58.0

1.7K

131K

¥4.32 / ¥18输入/输出

148

step-3

Stepfun

57.8

353

65.5K

¥1.8 / ¥4.68输入/输出

149

qwen3-coder-480b-a35b-instruct

Alibaba

57.5

1.6K

262K

¥6.2 / ¥24.8输入/输出

150

gemini-2.5-flash-lite-preview-06-17-thinking

Google

57.2

2.1K

65.5K

¥0.72 / ¥2.88输入/输出

151

minimax-m1

Minimax

56.9

1.8K

¥0.95 / ¥9.03输入/输出

152

nova-2-lite

Amazon

56.6

825

128K

¥2.38 / ¥19.8输入/输出

153

llama-3.1-nemotron-ultra-253b-v1

Nvidia

56.3

209

128K

¥4.32 / ¥13输入/输出

154

qwq-32b

Alibaba

56.0

1.7K

131K

¥2.07 / ¥6.2输入/输出

155

hunyuan-turbos-20250416

Tencent

55.7

845

131K

¥0 / ¥0输入/输出

156

glm-4.7-flash

Zai

55.5

718

200K

¥0 / ¥0输入/输出

157

o1-mini

Openai

55.2

7.5K

128K

¥7.92 / ¥31.7输入/输出

158

claude-sonnet-4-20250514

Anthropic

54.9

2.5K

200K

¥21.6 / ¥108输入/输出

159

qwen3-30b-a3b

Alibaba

54.6

1.7K

128K

¥0.79 / ¥7.78输入/输出

160

minimax-m2

Minimax

54.3

318

197K

¥0 / ¥0输入/输出

161

mistral-medium-2505

Mistral

54.0

2.2K

262K

¥2.88 / ¥14.4输入/输出

162

gemini-2.0-flash-001

Google

53.7

4.1K

1.05M

¥1.08 / ¥4.32输入/输出

163

glm-4.5v

Zai

53.4

276

64K

¥4.32 / ¥13输入/输出

164

ring-flash-2.0

Ant Group

53.2

453

131K

¥1.01 / ¥4.1输入/输出

165

gpt-4.1-mini-2025-04-14

Openai

52.9

2.7K

1.05M

¥2.88 / ¥11.5输入/输出

166

mistral-small-2506

Mistral

52.6

262K

¥2.88 / ¥14.4输入/输出

167

claude-3-7-sonnet-20250219-thinking-32k

Anthropic

52.3

2.8K

168

UNtrinity-large-preview

52.0

1.8K

262K

¥1.8 / ¥6.48输入/输出

169

qwen-plus-0125

Alibaba

51.7

732

¥0.83 / ¥2.07输入/输出

170

claude-3-7-sonnet-20250219

Anthropic

51.4

3.4K

200K

¥21.6 / ¥108输入/输出

171

step-1o-turbo-202506

Stepfun

51.1

564

172

gpt-oss-20b

Openai

50.9

680

131K

¥0.32 / ¥1.3输入/输出

173

gpt-5-nano-high

Openai

50.6

494

400K

¥0.36 / ¥2.88输入/输出

174

olmo-3-32b-think

Allenai

50.3

314

128K

¥2.16 / ¥3.24输入/输出

175

gemini-1.5-pro-002

Google

50.0

7.6K

176

gemma-3-27b-it

Google

49.7

3.6K

128K

¥2.15 / ¥2.15输入/输出

177

olmo-3.1-32b-instruct

Allenai

49.4

696

200K

¥14.4 / ¥57.6输入/输出

178

deepseek-v3

Deepseek

49.1

2.7K

128K

¥0 / ¥0输入/输出

179

gemini-2.0-flash-lite-preview-02-05

Google

48.9

2.8K

1.05M

¥0.54 / ¥2.16输入/输出

180

granite-4.1-8b

Ibm

48.6

218

131K

¥0.36 / ¥0.72输入/输出

181

gemma-3-12b-it

Google

48.3

389

128K

¥1.96 / ¥1.96输入/输出

182

claude-3-5-sonnet-20241022

Anthropic

48.0

10K

200K

¥21.6 / ¥108输入/输出

183

step-2-16k-exp-202412

Stepfun

47.7

642

16.4K

¥37.5 / ¥118输入/输出

184

claude-3-5-sonnet-20240620

Anthropic

47.4

11.4K

200K

¥21.6 / ¥108输入/输出

185

UNathene-v2-chat

47.1

3.4K

186

llama-4-maverick-17b-128e-instruct

Meta

46.8

2.8K

¥1.8 / ¥6.26输入/输出

187

UNyi-lightning

46.6

3.9K

12K

¥1.44 / ¥1.44输入/输出

188

command-a-03-2025

Cohere

46.3

256K

¥18 / ¥72输入/输出

189

olmo-3.1-32b-think

Allenai

46.0

473

200K

¥14.4 / ¥57.6输入/输出

190

qwen2.5-plus-1127

Alibaba

45.7

1.4K

191

hunyuan-turbos-20250226

Tencent

45.4

238

131K

¥0 / ¥0输入/输出

192

deepseek-v2.5-1210

Deepseek

45.1

¥1.01 / ¥2.02输入/输出

193

glm-4-plus-0111

Zai

44.8

721

128K

¥72 / ¥72输入/输出

194

llama-4-scout-17b-16e-instruct

Meta

44.5

1.9K

128K

¥1.44 / ¥5.62输入/输出

195

gpt-4o-2024-08-06

Openai

44.3

6.8K

128K

¥18 / ¥72输入/输出

196

gpt-4o-2024-05-13

Openai

44.0

15.1K

128K

¥36 / ¥108输入/输出

197

grok-2-2024-08-13

Xai

43.7

¥9 / ¥18输入/输出

198

qwen2.5-72b-instruct

Alibaba

43.4

5.4K

131K

¥4.13 / ¥12.4输入/输出

199

llama-3.1-405b-instruct-fp8

Meta

43.1

8.5K

128K

¥0 / ¥0输入/输出

200

hunyuan-large-2025-02-10

Tencent

42.8

497

201

llama-3.1-405b-instruct-bf16

Meta

42.5

5.2K

128K

¥0 / ¥0输入/输出

202

qwen-max-0919

Alibaba

42.2

2.2K

131K

¥2.48 / ¥9.91输入/输出

203

glm-4-plus

Zai

42.0

3.6K

128K

¥54 / ¥54输入/输出

204

gpt-4.1-nano-2025-04-14

Openai

41.7

582

1.05M

¥14.4 / ¥57.6输入/输出

205

hunyuan-standard-2025-02-10

Tencent

41.4

499

206

hunyuan-turbo-0110

Tencent

41.1

243

207

claude-3-opus-20240229

Anthropic

40.8

25.8K

200K

¥108 / ¥540输入/输出

208

gemini-advanced-0514

Google

40.5

6.4K

209

gpt-4-turbo-2024-04-09

Openai

40.2

13.2K

128K

¥72 / ¥216输入/输出

210

llama-3.1-nemotron-70b-instruct

Nvidia

39.9

128K

¥0 / ¥0输入/输出

211

deepseek-v2.5

Deepseek

39.7

3.6K

¥1.01 / ¥2.02输入/输出

212

gemini-1.5-pro-001

Google

39.4

10.5K

213

gpt-4-1106-preview

Openai

39.1

13.3K

8.19K

¥216 / ¥432输入/输出

214

gemini-1.5-flash-002

Google

38.8

4.8K

¥0.54 / ¥2.2输入/输出

215

hunyuan-large-vision

Tencent

38.5

351

216

gpt-4-0125-preview

Openai

38.2

12.4K

8.19K

¥216 / ¥432输入/输出

217

gpt-4o-mini-2024-07-18

Openai

37.9

9.3K

128K

¥1.08 / ¥4.32输入/输出

218

llama-3.3-70b-instruct

Meta

37.6

5.8K

128K

¥0 / ¥0输入/输出

219

grok-2-mini-2024-08-13

Xai

37.4

7.3K

¥9 / ¥18输入/输出

220

mistral-large-2407

Mistral

37.1

6.7K

131K

¥14.4 / ¥43.2输入/输出

221

mistral-small-3.1-24b-instruct-2503

Mistral

36.8

2.1K

262K

¥2.88 / ¥14.4输入/输出

222

mistral-large-2411

Mistral

36.5

3.6K

128K

¥14.4 / ¥43.2输入/输出

223

llama-3.1-70b-instruct

Meta

36.2

7.7K

131K

¥2.88 / ¥2.88输入/输出

224

amazon-nova-pro-v1.0

Amazon

35.9

300K

¥5.76 / ¥23输入/输出

225

ibm-granite-h-small

Ibm

35.6

358

226

gemma-3n-e4b-it

Google

35.3

1.6K

128K

¥0 / ¥0输入/输出

227

qwen2.5-coder-32b-instruct

Alibaba

35.1

725

131K

¥2.07 / ¥6.2输入/输出

228

magistral-medium-2506

Mistral

34.8

553

128K

¥14.4 / ¥36输入/输出

229

phi-4

Microsoft

34.5

2.8K

128K

¥0.9 / ¥3.6输入/输出

230

claude-3-5-haiku-20241022

Anthropic

34.2

6.4K

200K

¥5.76 / ¥28.8输入/输出

231

llama-3.1-tulu-3-70b

Allenai

33.9

397

232

deepseek-coder-v2

Deepseek

33.6

1.9K

¥1.01 / ¥2.02输入/输出

233

mistral-small-24b-instruct-2501

Mistral

33.3

1.7K

262K

¥2.88 / ¥14.4输入/输出

234

gemma-3-4b-it

Google

33.0

423

128K

¥1.44 / ¥1.44输入/输出

235

qwen2-72b-instruct

Alibaba

32.8

4.8K

131K

¥4.13 / ¥12.4输入/输出

236

hunyuan-standard-256k

Tencent

32.5

361

237

UNathene-70b-0725

32.2

2.9K

238

gpt-4-0314

Openai

31.9

7.1K

8.19K

¥216 / ¥432输入/输出

239

llama-3.1-nemotron-51b-instruct

Nvidia

31.6

507

128K

¥0 / ¥0输入/输出

240

gemini-1.5-flash-001

Google

31.3

8.4K

¥0.54 / ¥2.2输入/输出

241

amazon-nova-lite-v1.0

Amazon

31.0

2.5K

300K

¥0.43 / ¥1.73输入/输出

242

UNreka-core-20240904

30.7

1.2K

243

UNjamba-1.5-large

30.5

1.1K

256K

¥0 / ¥0输入/输出

244

glm-4-0520

Zai

30.2

1.2K

128K

¥108 / ¥108输入/输出

245

llama-3-70b-instruct

Meta

29.9

20.9K

8.19K

¥3.67 / ¥5.33输入/输出

246

gpt-4-0613

Openai

29.6

11.2K

8.19K

¥216 / ¥432输入/输出

247

nemotron-4-340b-instruct

Nvidia

29.3

2.4K

248

qwq-32b-preview

Alibaba

29.0

480

131K

¥2.07 / ¥6.2输入/输出

249

claude-3-sonnet-20240229

Anthropic

28.7

13.8K

200K

¥21.6 / ¥108输入/输出

250

gemma-2-27b-it

Google

28.4

10.2K

8.19K

¥0.58 / ¥0.58输入/输出

251

olmo-2-0325-32b-instruct

Allenai

28.2

375

252

gemini-1.5-flash-8b-001

Google

27.9

¥0.54 / ¥2.2输入/输出

253

amazon-nova-micro-v1.0

Amazon

27.6

2.5K

128K

¥0.25 / ¥1.01输入/输出

254

mistral-large-2402

Mistral

27.3

262K

¥2.88 / ¥14.4输入/输出

255

c4ai-aya-expanse-32b

Cohere

27.0

3.9K

256

UNreka-flash-20240904

26.7

1.3K

65.5K

¥0.72 / ¥1.44输入/输出

257

llama-3.1-tulu-3-8b

Allenai

26.4

363

258

ministral-8b-2410

Mistral

26.1

683

128K

¥0.72 / ¥0.72输入/输出

259

claude-3-haiku-20240307

Anthropic

25.9

15K

200K

¥1.8 / ¥9输入/输出

260

command-r-plus-08-2024

Cohere

25.6

1.5K

128K

¥18 / ¥72输入/输出

261

qwen1.5-110b-chat

Alibaba

25.3

3.2K

262

mixtral-8x22b-instruct-v0.1

Mistral

25.0

6.8K

64K

¥14.4 / ¥43.2输入/输出

263

gemma-2-9b-it

Google

24.7

7.1K

8.19K

¥1.44 / ¥1.44输入/输出

264

UNyi-1.5-34b-chat

24.4

265

mistral-medium

Mistral

24.1

4.4K

262K

¥2.88 / ¥14.4输入/输出

266

UNinternlm2_5-20b-chat

23.9

1.4K

267

llama-3.1-8b-instruct

Meta

23.6

7.1K

131K

¥0.79 / ¥0.79输入/输出

268

phi-3-medium-4k-instruct

Microsoft

23.3

3.2K

4.1K

¥1.22 / ¥4.9输入/输出

269

UNgemma-2-9b-it-simpo

23.0

1.3K

8.19K

¥1.44 / ¥1.44输入/输出

270

c4ai-aya-expanse-8b

Cohere

22.7

1.3K

271

UNreka-flash-21b-20240226-online

22.4

272

command-r-plus

Cohere

22.1

9.8K

128K

¥18 / ¥72输入/输出

273

qwen1.5-72b-chat

Alibaba

21.8

5.3K

274

UNjamba-1.5-mini

21.6

1.1K

256K

¥0 / ¥0输入/输出

275

granite-3.1-2b-instruct

Ibm

21.3

391

276

UNreka-flash-21b-20240226

21.0

3.4K

277

qwen1.5-32b-chat

Alibaba

20.7

2.6K

278

command-r-08-2024

Cohere

20.4

1.6K

128K

¥18 / ¥72输入/输出

279

phi-3-mini-4k-instruct-june-2024

Microsoft

20.1

1.6K

4.1K

¥0.94 / ¥3.74输入/输出

280

granite-3.1-8b-instruct

Ibm

19.8

382

281

llama-3-8b-instruct

Meta

19.5

14.3K

8.19K

¥0.29 / ¥0.29输入/输出

282

phi-3-small-8k-instruct

Microsoft

19.3

2.1K

8.19K

¥1.08 / ¥4.32输入/输出

283

UNzephyr-orpo-141b-A35b-v0.1

19.0

589

200K

¥108 / ¥432输入/输出

284

mixtral-8x7b-instruct-v0.1

Mistral

18.7

9.7K

32K

¥5.04 / ¥5.04输入/输出

285

UNdbrx-instruct-preview

18.4

286

granite-3.0-8b-instruct

Ibm

18.1

873

287

gpt-3.5-turbo-0125

Openai

17.8

8.6K

16.4K

¥3.6 / ¥10.8输入/输出

288

gpt-3.5-turbo-1106

Openai

17.5

2.1K

16.4K

¥7.2 / ¥14.4输入/输出

289

gemma-2-2b-it

Google

17.2

6.6K

128K

¥0 / ¥0输入/输出

290

gemini-pro-dev-api

Google

17.0

2.3K

1.05M

¥14.4 / ¥86.4输入/输出

291

gemini-pro

Google

16.7

993

1.05M

¥14.4 / ¥86.4输入/输出

292

llama-3.2-3b-instruct

Meta

16.4

1.1K

131K

¥0.22 / ¥0.35输入/输出

293

qwen1.5-14b-chat

Alibaba

16.1

2.2K

294

UNstarling-lm-7b-beta

15.8

200K

¥5.4 / ¥18.7输入/输出

295

command-r

Cohere

15.5

6.7K

128K

¥18 / ¥72输入/输出

296

granite-3.0-2b-instruct

Ibm

15.2

908

297

wizardlm-70b

Microsoft

14.9

903

298

UNyi-34b-chat

14.7

299

phi-3-mini-4k-instruct

Microsoft

14.4

2.6K

4.1K

¥0.94 / ¥3.74输入/输出

300

UNsnowflake-arctic-instruct

14.1

4.8K

301

deepseek-llm-67b-chat

Deepseek

13.8

576

¥1.01 / ¥2.02输入/输出

302

UNtulu-2-dpo-70b

13.5

888

303

gemma-1.1-7b-it

Google

13.2

304

UNopenchat-3.5-0106

12.9

1.7K

305

UNsmollm2-1.7b-instruct

12.6

271

306

UNopenhermes-2.5-mistral-7b

12.4

697

¥36 / ¥180输入/输出

307

llama-2-70b-chat

Meta

12.1

4.7K

308

phi-3-mini-128k-instruct

Microsoft

11.8

2.8K

128K

¥0.94 / ¥3.74输入/输出

309

llama-3.2-1b-instruct

Meta

11.5

1.2K

16.4K

¥0.07 / ¥0.08输入/输出

310

mistral-7b-instruct-v0.2

Mistral

11.2

2.6K

262K

¥2.88 / ¥14.4输入/输出

311

UNstarling-lm-7b-alpha

10.9

1.3K

200K

¥5.4 / ¥18.7输入/输出

312

qwen1.5-7b-chat

Alibaba

10.6

690

313

UNdolphin-2.2.1-mistral-7b

10.3

219

262K

¥2.88 / ¥14.4输入/输出

314

llama2-70b-steerlm-chat

Nvidia

10.1

440

315

UNopenchat-3.5

9.8

945

316

UNvicuna-33b

9.5

2.7K

317

qwen-14b-chat

Alibaba

9.2

534

32.8K

¥1.04 / ¥3.1输入/输出

318

gemma-7b-it

Google

8.9

1.1K

319

llama-2-13b-chat

Meta

8.6

2.2K

320

UNsolar-10.7b-instruct-v1.0

8.3

604

128K

¥0 / ¥0输入/输出

321

UNnous-hermes-2-mixtral-8x7b-dpo

8.0

628

¥36 / ¥180输入/输出

322

codellama-34b-instruct

Meta

7.8

770

323

palm-2

Google

7.5

901

324

gemma-1.1-2b-it

Google

7.2

1.4K

325

UNmpt-30b-chat

6.9

242

326

llama-2-7b-chat

Meta

6.6

1.7K

128K

¥4.03 / ¥48输入/输出

327

UNzephyr-7b-beta

6.3

1.3K

328

UNstripedhyena-nous-7b

6.0

676

329

UNguanaco-33b

5.7

280

200K

¥14.4 / ¥57.6输入/输出

330

UNvicuna-13b

5.5

2.1K

331

mistral-7b-instruct

Mistral

5.2

974

262K

¥2.88 / ¥14.4输入/输出

332

qwen1.5-4b-chat

Alibaba

4.9

988

333

olmo-7b-instruct

Allenai

4.6

848

334

wizardlm-13b

Microsoft

4.3

669

335

gemma-2b-it

Google

4.0

597

336

UNvicuna-7b

3.7

658

337

UNchatglm3-6b

3.4

576

200K

¥5.4 / ¥18.7输入/输出

338

UNgpt4all-13b-snoozy

3.2

211

¥36 / ¥216输入/输出

339

UNkoala-13b

2.9

751

340

UNchatglm-6b

2.6

525

200K

¥5.4 / ¥18.7输入/输出

341

UNRWKV-4-Raven-14B

2.3

544

342

UNmpt-7b-chat

2.0

471

343

UNchatglm2-6b

1.7

227

200K

¥5.4 / ¥18.7输入/输出

344

UNalpaca-13b

1.4

652

345

UNoasst-pythia-12b

1.1

687

346

UNdolly-v2-12b

0.9

370

347

UNfastchat-t5-3b

0.6

462

348

UNstablelm-tuned-alpha-7b

0.3

353

349

llama-13b

Meta

0.0

252

常见问题

数学常见问题

数学排行榜看什么指标？

主要看排名、百分制分数、样本量和来源。分数用于快速比较同一榜单内模型表现，样本量用于判断结果稳定性。

为什么不同榜单不能直接混合成总分？

不同榜单的任务、样本和评测口径不同，模力榜默认只在同一榜单内排序，避免把写作、代码、图像等能力强行合并。

数学模型应该怎么选？

优先看与你任务最接近的榜单，再结合价格、上下文长度、开源闭源和厂商可用性。排名靠前不代表适合所有预算和部署方式。

榜单多久更新？

页面展示的是最新成功采集的公开榜单数据。当前优先使用 LMArena leaderboard dataset，并在页面来源中保留原始链接。

对话 · 文本 · 数学排行榜

数学模型怎么选？

gemini-3.5-flash 为什么排第一

不要只看第一名

继续比较相近能力

数学常见问题