模型榜单

这是一个基于 Chatbot Arena (lmarena.ai) 数据的排行榜,通过自动化流程生成。

数据更新时间: 2025-06-21 09:44:44 UTC / 2025-06-21 17:44:44 CST (北京时间)

点击排行榜中的 模型名称 可跳转至其详细信息或试用页面。

排行榜

排名(UB)
排名(StyleCtrl)
模型名
分数
置信区间
票数
服务商
许可协议
知识截止日期

1

1

1480

+6/-6

8,825

Google

Proprietary

暂无数据

2

2

1446

+5/-5

13,025

Google

Proprietary

暂无数据

3

2

1427

+4/-4

16,019

OpenAI

Proprietary

暂无数据

3

3

1426

+5/-5

20,638

OpenAI

Proprietary

暂无数据

3

6

1421

+7/-7

8,423

DeepSeek

MIT

暂无数据

3

6

1420

+5/-5

14,034

Google

Proprietary

暂无数据

3

8

1419

+4/-5

22,643

xAI

Proprietary

暂无数据

5

4

1413

+4/-4

15,271

OpenAI

Proprietary

暂无数据

9

8

1398

+4/-4

14,812

Google

Proprietary

暂无数据

9

11

1387

+7/-6

7,837

Alibaba

Apache 2.0

暂无数据

10

6

1385

+6/-4

14,635

OpenAI

Proprietary

暂无数据

10

12

1384

+5/-3

17,365

DeepSeek

MIT

暂无数据

10

12

1377

+10/-8

3,905

Google

Proprietary

暂无数据

10

18

1373

+7/-7

6,747

Tencent

Proprietary

暂无数据

13

6

1373

+4/-4

15,254

Anthropic

Proprietary

暂无数据

13

12

1373

+4/-5

19,430

DeepSeek

MIT

暂无数据

14

18

1365

+4/-5

13,385

Mistral

Proprietary

暂无数据

16

12

1365

+3/-3

29,038

OpenAI

Proprietary

暂无数据

16

22

1363

+5/-6

11,429

Alibaba

Apache 2.0

暂无数据

16

26

1361

+7/-6

6,984

xAI

Proprietary

暂无数据

17

25

1363

+3/-3

34,803

Google

Proprietary

暂无数据

17

12

1362

+4/-4

14,392

OpenAI

Proprietary

暂无数据

17

23

1360

+3/-3

30,065

Alibaba

Proprietary

暂无数据

19

26

1356

+4/-3

22,300

Google

Gemma

暂无数据

25

18

1350

+3/-4

33,177

OpenAI

Proprietary

2023/10

25

12

1346

+5/-5

12,143

Anthropic

Proprietary

暂无数据

26

25

1340

+4/-3

19,404

OpenAI

Proprietary

暂无数据

26

21

1338

+4/-5

13,519

OpenAI

Proprietary

暂无数据

26

33

1336

+8/-10

3,976

Google

Gemma

暂无数据

27

30

1334

+4/-4

22,841

DeepSeek

DeepSeek

暂无数据

28

37

1332

+4/-5

16,438

Alibaba

Apache 2.0

暂无数据

29

32

1328

+3/-3

26,104

Google

Proprietary

暂无数据

29

36

1326

+6/-9

6,028

Zhipu

Proprietary

暂无数据

29

33

1326

+6/-7

6,055

Alibaba

Proprietary

暂无数据

29

33

1325

+6/-3

21,092

Cohere

CC-BY-NC-4.0

暂无数据

30

38

1320

+9/-7

5,126

StepFun

Proprietary

暂无数据

30

31

1318

+11/-10

2,452

Tencent

Proprietary

暂无数据

31

38

1312

+15/-13

2,371

Nvidia

Nvidia

暂无数据

33

32

1321

+3/-2

33,256

OpenAI

Proprietary

暂无数据

34

39

1319

+3/-3

54,951

OpenAI

Proprietary

2023/10

34

33

1317

+2/-3

58,645

Google

Proprietary

暂无数据

34

18

1315

+5/-3

22,385

Anthropic

Proprietary

暂无数据

34

33

1311

+11/-12

2,510

Tencent

Proprietary

暂无数据

40

56

1303

+9/-9

3,913

Google

Gemma

暂无数据

41

21

1307

+4/-3

26,866

Anthropic

Proprietary

暂无数据

42

45

1303

+2/-3

67,084

xAI

Proprietary

2024/3

42

48

1302

+3/-3

28,968

01 AI

Proprietary

暂无数据

43

35

1300

+2/-2

117,747

OpenAI

Proprietary

2023/10

43

25

1299

+2/-2

74,230

Anthropic

Proprietary

2024/4

43

57

1297

+5/-7

10,715

Alibaba

Proprietary

暂无数据

43

51

1294

+6/-4

7,243

DeepSeek

DeepSeek

暂无数据

44

66

1290

+9/-7

4,321

Google

Gemma

暂无数据

48

45

1287

+11/-8

3,856

Tencent

Proprietary

暂无数据

50

58

1291

+3/-4

26,074

NexusFlow

NexusFlow

暂无数据

50

56

1289

+3/-3

27,788

Zhipu AI

Proprietary

暂无数据

50

43

1288

+5/-4

14,164

Meta

Llama 4

暂无数据

50

50

1286

+7/-6

6,302

OpenAI

Proprietary

暂无数据

52

57

1287

+2/-2

72,536

OpenAI

Proprietary

2023/10

52

63

1287

+3/-3

37,021

Google

Proprietary

暂无数据

52

39

1284

+3/-2

43,788

Meta

Llama 3.1 Community

2023/12

52

75

1284

+6/-6

7,577

Nvidia

Llama 3.1

2023/12

54

36

1283

+2/-3

86,159

Anthropic

Proprietary

2024/4

55

42

1283

+2/-2

63,038

Meta

Llama 3.1 Community

2023/12

55

40

1282

+3/-2

52,144

Google

Proprietary

Online

55

56

1276

+9/-9

4,014

Tencent

Proprietary

暂无数据

57

70

1281

+2/-2

55,442

xAI

Proprietary

2024/3

57

44

1280

+2/-3

47,973

OpenAI

Proprietary

2023/10

58

60

1279

+4/-5

17,432

Alibaba

Qwen

暂无数据

67

54

1275

+2/-2

82,435

Google

Proprietary

2023/11

67

66

1273

+3/-4

26,344

DeepSeek

DeepSeek

暂无数据

67

57

1272

+3/-2

45,404

Meta

Llama-3.3

暂无数据

67

72

1272

+2/-3

41,519

Alibaba

Qwen

2024/9

67

69

1266

+9/-10

3,258

Mistral

Apache 2.0

暂无数据

68

52

1272

+2/-2

102,133

OpenAI

Proprietary

2023/12

73

60

1267

+3/-3

48,217

Mistral

Mistral Research

2024/7

73

71

1266

+3/-4

20,580

NexusFlow

CC-BY-NC-4.0

2024/7

73

72

1264

+3/-3

29,633

Mistral

MRL

暂无数据

73

76

1259

+8/-7

3,010

Ai2

Llama 3.1

暂无数据

74

57

1265

+2/-2

103,748

OpenAI

Proprietary

2023/4

74

79

1263

+2/-2

58,637

Meta

Llama 3.1 Community

2023/12

74

54

1262

+2/-1

202,641

Anthropic

Proprietary

2023/8

75

80

1260

+3/-3

26,371

Amazon

Proprietary

暂无数据

76

61

1260

+2/-2

97,079

OpenAI

Proprietary

2023/12

82

79

1250

+6/-6

7,948

Reka AI

Proprietary

暂无数据

83

57

1253

+3/-2

45,698

Anthropic

Propretary

暂无数据

85

83

1242

+2/-3

65,661

Google

Proprietary

2023/11

86

80

1237

+5/-6

9,125

AI21 Labs

Jamba Open

2024/3

87

82

1235

+2/-2

79,538

Google

Gemma license

2024/6

87

92

1233

+6/-5

15,321

Mistral

Apache 2.0

暂无数据

87

89

1232

+6/-7

5,730

Alibaba

Apache 2.0

暂无数据

87

98

1232

+3/-4

20,646

Amazon

Proprietary

暂无数据

87

85

1231

+4/-5

10,548

Princeton

MIT

2024/7

87

85

1231

+4/-5

10,535

Cohere

CC-BY-NC-4.0

2024/8

87

79

1227

+7/-10

3,889

Nvidia

Llama 3.1

2023/12

89

102

1228

+2/-3

37,697

Google

Proprietary

暂无数据

89

96

1224

+4/-3

28,768

Cohere

CC-BY-NC-4.0

暂无数据

89

89

1224

+4/-4

20,608

Nvidia

NVIDIA Open Model

2023/6

89

100

1221

+10/-8

3,460

Allen AI

Apache-2.0

暂无数据

91

92

1222

+5/-5

10,221

Zhipu AI

Proprietary

暂无数据

92

89

1221

+6/-7

8,132

Reka AI

Proprietary

暂无数据

95

90

1222

+1/-2

163,629

Meta

Llama 3 Community

2023/12

95

103

1221

+4/-3

25,213

Microsoft

MIT

暂无数据

98

88

1216

+2/-2

113,067

Anthropic

Proprietary

2023/8

100

111

1213

+4/-5

20,654

Amazon

Proprietary

暂无数据

101

112

1204

+11/-12

2,901

Tencent

Proprietary

暂无数据

104

101

1207

+2/-2

57,197

Google

Gemma license

2024/6

104

113

1201

+8/-9

3,074

Ai2

Llama 3.1

暂无数据

105

98

1205

+2/-3

80,846

Cohere

CC-BY-NC-4.0

2024/3

105

111

1197

+8/-8

5,111

Mistral

MRL

暂无数据

106

100

1202

+2/-3

38,872

Alibaba

Qianwen LICENSE

2024/6

106

85

1201

+2/-3

55,962

OpenAI

Proprietary

2021/9

107

113

1195

+4/-5

10,391

Cohere

CC-BY-NC-4.0

暂无数据

108

103

1195

+4/-5

10,851

Cohere

CC-BY-NC-4.0

2024/8

109

103

1195

+2/-2

122,309

Anthropic

Proprietary

2023/8

109

96

1194

+4/-4

15,753

DeepSeek AI

DeepSeek License

2024/6

109

112

1191

+7/-6

9,274

AI21 Labs

Jamba Open

2024/3

109

128

1191

+2/-3

52,578

Meta

Llama 3.1 Community

2023/12

118

96

1178

+2/-2

91,614

OpenAI

Proprietary

2021/9

118

113

1176

+3/-3

27,430

Alibaba

Qianwen LICENSE

2024/4

118

145

1168

+12/-10

3,410

Alibaba

Apache 2.0

暂无数据

119

128

1173

+4/-5

25,135

01 AI

Apache-2.0

2024/5

119

112

1173

+2/-3

64,926

Mistral

Proprietary

暂无数据

119

113

1171

+5/-4

16,027

Reka AI

Proprietary

Online

121

122

1167

+2/-2

109,056

Meta

Llama 3 Community

2023/3

121

135

1164

+5/-5

10,599

InternLM

Other

2024/8

123

117

1164

+2/-3

56,398

Cohere

CC-BY-NC-4.0

2024/3

123

122

1163

+3/-3

35,556

Mistral

Proprietary

暂无数据

123

122

1163

+4/-4

25,803

Reka AI

Proprietary

2023/11

123

122

1158

+9/-10

3,289

IBM

Apache 2.0

暂无数据

124

116

1163

+2/-3

53,751

Mistral

Apache 2.0

2024/4

124

117

1163

+3/-2

40,658

Alibaba

Qianwen LICENSE

2024/2

124

135

1159

+2/-3

48,892

Google

Gemma license

2024/7

132

116

1147

+4/-5

18,800

Google

Proprietary

2023/4

132

127

1142

+8/-9

4,854

HuggingFace

Apache 2.0

2024/4

133

130

1141

+3/-4

22,765

Alibaba

Qianwen LICENSE

2024/2

133

137

1135

+9/-9

3,380

IBM

Apache 2.0

暂无数据

134

135

1138

+3/-3

26,105

Microsoft

MIT

2023/10

134

145

1134

+4/-4

16,676

Nexusflow

Apache-2.0

2024/3

137

135

1129

+2/-2

76,126

Mistral

Apache 2.0

2023/12

137

140

1126

+4/-4

15,917

01 AI

Yi License

2023/6

137

125

1126

+6/-8

6,557

Google

Proprietary

2023/4

138

137

1124

+3/-4

18,687

Alibaba

Qianwen LICENSE

2024/2

138

138

1122

+6/-6

8,383

Microsoft

Llama 2 Community

2023/8

140

125

1121

+2/-3

68,867

OpenAI

Proprietary

2021/9

140

144

1118

+7/-6

8,390

Meta

Llama 3.2

2023/12

141

135

1118

+3/-3

33,743

Databricks

DBRX LICENSE

2023/12

141

141

1117

+4/-5

18,476

Microsoft

MIT

2023/10

141

144

1114

+7/-7

6,658

AllenAI/UW

AI2 ImpACT Low-risk

2023/11

146

135

1108

+5/-7

7,002

IBM

Apache 2.0

暂无数据

148

155

1108

+2/-3

39,595

Meta

Llama 2 Community

2023/7

148

140

1107

+4/-4

12,990

OpenChat

Apache-2.0

2024/1

148

147

1106

+4/-3

22,936

LMSYS

Non-commercial

2023/8

148

140

1105

+2/-4

34,173

Snowflake

Apache 2.0

2024/4

148

150

1104

+6/-5

10,415

UC Berkeley

CC-BY-NC-4.0

2023/11

148

157

1099

+10/-10

3,836

NousResearch

Apache-2.0

2024/1

149

155

1096

+10/-9

3,636

Nvidia

Llama 2 Community

2023/11

150

141

1099

+4/-3

25,070

Google

Gemma license

2024/2

154

144

1092

+6/-7

4,988

DeepSeek AI

DeepSeek License

2023/11

155

142

1092

+6/-6

8,106

OpenChat

Apache-2.0

2023/11

155

144

1089

+8/-8

5,088

NousResearch

Apache-2.0

2023/11

156

152

1089

+6/-7

7,191

IBM

Apache 2.0

暂无数据

156

161

1088

+4/-4

20,067

Mistral

Apache-2.0

2023/12

156

161

1086

+4/-4

12,808

Microsoft

MIT

2023/10

156

161

1085

+8/-8

4,872

Alibaba

Qianwen LICENSE

2024/2

156

156

1078

+14/-13

1,714

Cognitive Computations

Apache-2.0

2023/10

158

137

1083

+3/-4

17,036

OpenAI

Proprietary

2021/9

158

165

1082

+4/-4

21,097

Microsoft

MIT

2023/10

158

160

1077

+9/-8

4,286

Upstage AI

CC-BY-NC-4.0

2023/11

161

166

1078

+4/-5

19,722

Meta

Llama 2 Community

2023/7

164

161

1074

+6/-7

7,176

Microsoft

Llama 2 Community

2023/7

167

171

1069

+6/-5

8,523

Meta

Llama 3.2

2023/12

167

169

1068

+6/-6

11,321

HuggingFace

MIT

2023/10

167

162

1062

+13/-12

2,375

HuggingFace

Apache 2.0

暂无数据

167

170

1057

+18/-14

1,192

Meta

Llama 2 Community

2024/1

169

161

1061

+8/-11

2,644

MosaicML

CC-BY-NC-SA-4.0

2023/6

169

164

1056

+13/-12

1,811

HuggingFace

MIT

2023/10

171

160

1049

+15/-13

1,327

TII

Falcon-180B TII License

2023/9

172

170

1058

+5/-7

7,509

Meta

Llama 2 Community

2023/7

173

164

1057

+5/-5

19,775

LMSYS

Llama 2 Community

2023/7

173

168

1053

+8/-6

9,176

Google

Gemma license

2024/2

173

170

1052

+3/-3

21,622

Microsoft

MIT

2023/10

173

185

1052

+5/-5

14,532

Meta

Llama 2 Community

2023/7

173

162

1050

+7/-8

5,065

Alibaba

Qianwen LICENSE

2023/8

173

171

1048

+10/-12

2,996

UW

Non-commercial

2023/5

183

174

1036

+5/-5

11,351

Google

Gemma license

2024/2

183

180

1033

+8/-8

5,276

Together AI

Apache 2.0

2023/12

184

191

1030

+6/-8

6,503

Allen AI

Apache-2.0

2024/2

186

184

1023

+7/-6

9,142

Mistral

Apache 2.0

2023/9

186

185

1020

+6/-7

7,017

LMSYS

Llama 2 Community

2023/7

186

174

1019

+6/-7

8,713

Google

Proprietary

2021/6

190

189

1005

+8/-8

4,918

Google

Gemma license

2024/2

191

189

1004

+5/-7

7,816

Alibaba

Qianwen LICENSE

2024/2

193

192

980

+8/-8

7,020

UC Berkeley

Non-commercial

2023/4

193

193

970

+6/-9

4,763

Tsinghua

Apache-2.0

2023/10

194

193

948

+15/-11

1,788

Nomic AI

Non-commercial

2023/3

195

193

943

+9/-11

3,997

MosaicML

CC-BY-NC-SA-4.0

2023/5

195

198

940

+13/-11

2,713

Tsinghua

Apache-2.0

2023/6

195

198

937

+8/-7

4,920

RWKV

Apache 2.0

2023/4

199

193

917

+8/-7

5,864

Stanford

Non-commercial

2023/3

199

199

908

+8/-8

6,368

OpenAssistant

Apache 2.0

2023/4

200

201

894

+9/-8

4,983

Tsinghua

Non-commercial

2023/3

201

201

883

+8/-12

4,288

LMSYS

Apache 2.0

2023/4

203

204

855

+11/-14

3,336

Stability AI

CC-BY-NC-SA-4.0

2023/4

203

201

838

+11/-12

3,480

Databricks

MIT

2023/4

204

202

815

+12/-10

2,446

Meta

Non-commercial

2023/2

说明

  • 排名(UB):基于 Bradley-Terry 模型计算的排名。此排名反映了模型在竞技场中的综合表现,并提供了其 Elo 分数的 上界 估计,帮助理解模型的潜在竞争力。

  • 排名(StyleCtrl):经过对话风格控制后的排名。此排名旨在减少因模型回复风格(例如冗长、简洁)带来的偏好偏差,更纯粹地评估模型的核心能力。

  • 模型名:大型语言模型 (LLM) 的名称。此列已嵌入模型相关链接,点击可跳转。

  • 分数:模型在竞技场中通过用户投票获得的 Elo 评分。Elo 评分是一种相对排名系统,分数越高表示模型表现越好。该分数是动态变化的,反映了模型在当前竞争环境中的相对实力。

  • 置信区间:模型 Elo 评分的95%置信区间(例如:+6/-6)。这个区间越小,表示模型的评分越稳定和可靠;反之,区间越大可能意味着数据量不足或模型表现波动较大。它提供了对评分准确性的量化评估。

  • 票数:该模型在竞技场中收到的总投票数量。投票数越多,通常意味着其评分的统计可靠性越高。

  • 服务商:提供该模型的组织或公司。

  • 许可协议:模型的许可协议类型,例如专有 (Proprietary)、Apache 2.0、MIT 等。

  • 知识截止日期:模型训练数据的知识截止日期。暂无数据 表示相关信息未提供或未知。

数据来源与更新频率

本排行榜数据由 fboulnois/llm-leaderboard-csv 项目自动生成并提供,该项目从 lmarena.ai 获取并处理数据。此排行榜由 GitHub Actions 每天自动更新。

免责声明

本报告仅供参考。排行榜数据是动态变化的,并基于特定时间段内用户在 Chatbot Arena 上的偏好投票。数据的完整性和准确性取决于上游数据源及 fboulnois/llm-leaderboard-csv 项目的更新和处理。不同模型可能采用不同的许可协议,使用时请务必参考模型提供商的官方说明。

最后更新于

这有帮助吗?