模型榜單

呢個係基於 Chatbot Arena (lmarena.ai) 數據嘅排行榜,透過自動化流程生成。

數據更新時間: 2025-12-05 08:08:31 UTC / 2025-12-05 16:08:31 CST (北京時間)

排行榜

排名
排名範圍(上限-下限)
模型
分數
95% 信心區間 (±)
票數
組織/公司
許可證

1

1◄─►2

gemini-3-pro

1491

±7

13,423

Google

專有

2

1◄─►3

grok-4.1-thinking

1481

±7

14,001

xAI

專有

3

2◄─►6

Anthropicclaude-opus-4-5-20251101-thinking-32k

1469

±8

7,552

Anthropic

專有

4

3◄─►6

Anthropicclaude-opus-4-5-20251101

1465

±8

8,321

Anthropic

專有

5

3◄─►6

grok-4.1

1463

±7

13,890

xAI

專有

6

3◄─►10

gpt-5.1-high

1457

±7

11,559

OpenAI

專有

7

6◄─►11

gemini-2.5-pro

1451

±4

74,528

Google

專有

8

6◄─►12

Anthropicclaude-sonnet-4-5-20250929-thinking-32k

1448

±5

25,546

Anthropic

專有

9

6◄─►11

Anthropicclaude-opus-4-1-20250805-thinking-16k

1448

±4

41,341

Anthropic

專有

10

6◄─►15

Anthropicclaude-sonnet-4-5-20250929

1445

±5

20,675

Anthropic

專有

11

7◄─►17

gpt-4.5-preview-2025-02-27

1443

±6

14,644

OpenAI

專有

12

9◄─►18

Anthropicclaude-opus-4-1-20250805

1440

±4

54,404

Anthropic

專有

13

10◄─►18

chatgpt-4o-latest-20250326

1440

±3

60,767

OpenAI

專有

14

10◄─►19

gpt-5-high

1437

±5

32,896

OpenAI

專有

15

10◄─►24

gpt-5.1

1435

±7

12,389

OpenAI

專有

16

11◄─►21

o3-2025-04-16

1434

±4

61,602

OpenAI

專有

17

11◄─►24

qwen3-max-preview

1433

±5

28,135

Alibaba

專有

18

12◄─►39

grok-4-1-fast-reasoning

1429

±8

6,534

xAI

專有

19

14◄─►39

MoonshotAIkimi-k2-thinking-turbo

1428

±6

13,222

Moonshot

Modified MIT

20

15◄─►39

glm-4.6

1425

±5

22,311

Z.ai

MIT

21

16◄─►39

gpt-5-chat

1425

±4

32,139

OpenAI

專有

22

16◄─►39

qwen3-max-2025-09-23

1424

±6

9,256

Alibaba

專有

23

18◄─►39

Anthropicclaude-opus-4-20250514-thinking-16k

1423

±4

37,879

Anthropic

專有

24

16◄─►40

deepseek-v3.2-exp

1423

±7

11,980

DeepSeek AI

MIT

25

18◄─►39

qwen3-235b-a22b-instruct-2507

1421

±4

48,918

Alibaba

Apache 2.0

26

18◄─►42

deepseek-v3.2-exp-thinking

1421

±7

9,228

DeepSeek AI

MIT

27

15◄─►46

mistral-large-3

1420Preliminary

±10

3,951

Mistral

Apache 2.0

28

18◄─►45

grok-4-fast

1420

±8

7,060

xAI

專有

29

18◄─►46

MoonshotAIkimi-k2-0905-preview

1418

±7

11,843

Moonshot

Modified MIT

30

18◄─►45

deepseek-r1-0528

1418

±6

19,241

DeepSeek

MIT

31

18◄─►47

ernie-5.0-preview-1022

1418

±9

4,702

Baidu

專有

32

18◄─►45

MoonshotAIkimi-k2-0711-preview

1417

±5

28,672

Moonshot

Modified MIT

33

18◄─►46

deepseek-v3.1

1417

±6

15,259

DeepSeek

MIT

34

18◄─►47

deepseek-v3.1-thinking

1416

±7

11,987

DeepSeek

MIT

35

18◄─►50

deepseek-v3.1-terminus

1415

±10

3,746

DeepSeek AI

MIT

36

18◄─►47

qwen3-vl-235b-a22b-instruct

1415

±7

8,535

Alibaba

Apache 2.0

37

18◄─►52

deepseek-v3.1-terminus-thinking

1414

±10

3,522

DeepSeek AI

MIT

38

18◄─►56

deepseek-v3.2

1413

±10

4,053

DeepSeek AI

MIT

39

25◄─►47

Anthropicclaude-opus-4-20250514

1412

±4

45,676

Anthropic

專有

40

26◄─►47

gpt-4.1-2025-04-14

1412

±4

52,588

OpenAI

專有

41

18◄─►56

deepseek-v3.2-thinking

1411

±11

3,575

DeepSeek AI

MIT

42

26◄─►47

mistral-medium-2508

1411

±4

43,003

Mistral

專有

43

27◄─►50

grok-3-preview-02-24

1410

±4

34,127

xAI

專有

44

27◄─►52

grok-4-0709

1409

±4

42,578

xAI

專有

45

27◄─►53

glm-4.5

1409

±5

24,827

Z.ai

MIT

46

30◄─►52

gemini-2.5-flash

1408

±3

73,910

Google

專有

47

33◄─►57

gemini-2.5-flash-preview-09-2025

1405

±5

27,015

Google

專有

48

39◄─►59

grok-4-fast-reasoning

1402

±5

18,886

xAI

專有

49

39◄─►59

Anthropicclaude-haiku-4-5-20251001

1402

±5

23,785

Anthropic

專有

50

41◄─►59

o1-2024-12-17

1401

±4

28,039

OpenAI

專有

51

41◄─►61

qwen3-next-80b-a3b-instruct

1400

±5

23,119

Alibaba

Apache 2.0

52

39◄─►63

longcat-flash-chat

1400

±6

11,502

Meituan

MIT

53

45◄─►62

Anthropicclaude-sonnet-4-20250514-thinking-32k

1399

±4

36,216

Anthropic

專有

54

44◄─►62

qwen3-235b-a22b-no-thinking

1399

±5

39,380

Alibaba

Apache 2.0

55

45◄─►66

qwen3-235b-a22b-thinking-2507

1397

±6

9,346

Alibaba

Apache 2.0

56

48◄─►66

deepseek-r1

1396

±5

18,718

DeepSeek

MIT

57

47◄─►68

qwen3-vl-235b-a22b-thinking

1394

±7

7,984

Alibaba

Apache 2.0

58

48◄─►68

gpt-5-mini-high

1392

±5

27,447

OpenAI

專有

59

51◄─►67

deepseek-v3-0324

1392

±4

46,786

DeepSeek

MIT

60

45◄─►73

Tencenthunyuan-vision-1.5-thinking

1391

±12

2,213

Tencent

專有

61

52◄─►68

o4-mini-2025-04-16

1391

±4

46,849

OpenAI

專有

62

51◄─►70

mai-1-preview

1391

±5

18,186

Microsoft AI

專有

63

55◄─►71

Anthropicclaude-sonnet-4-20250514

1389

±4

41,655

Anthropic

專有

64

55◄─►72

o1-preview

1387

±5

31,505

OpenAI

專有

65

55◄─►72

Anthropicclaude-3-7-sonnet-20250219-thinking-32k

1387

±4

39,914

Anthropic

專有

66

57◄─►72

qwen3-coder-480b-a35b-instruct

1385

±5

23,156

Alibaba

Apache 2.0

67

54◄─►75

Tencenthunyuan-t1-20250711

1385

±9

4,819

Tencent

專有

68

58◄─►74

mistral-medium-2505

1383

±5

34,529

Mistral

專有

69

61◄─►74

qwen3-30b-a3b-instruct-2507

1382

±5

24,200

Alibaba

Apache 2.0

70

62◄─►75

gpt-4.1-mini-2025-04-14

1381

±4

40,494

OpenAI

專有

71

61◄─►78

Tencenthunyuan-turbos-20250416

1380

±6

11,130

Tencent

專有

72

63◄─►77

gemini-2.5-flash-lite-preview-09-2025-no-thinking

1379

±5

26,924

Google

專有

73

66◄─►79

gemini-2.5-flash-lite-preview-06-17-thinking

1375

±4

33,971

Google

專有

74

67◄─►80

qwen3-235b-a22b

1374

±5

27,167

Alibaba

Apache 2.0

75

69◄─►80

qwen2.5-max

1373

±4

33,548

Alibaba

專有

76

71◄─►80

Anthropicclaude-3-5-sonnet-20241022

1372

±3

89,850

Anthropic

專有

77

71◄─►83

Anthropicclaude-3-7-sonnet-20250219

1371

±4

44,562

Anthropic

專有

78

72◄─►83

glm-4.5-air

1370

±4

31,676

Z.ai

MIT

79

73◄─►86

qwen3-next-80b-a3b-thinking

1367

±6

13,824

Alibaba

Apache 2.0

80

74◄─►86

Minimaxminimax-m1

1366

±4

36,885

MiniMax

Apache 2.0

81

77◄─►86

gemma-3-27b-it

1365

±4

49,315

Google

Gemma

82

77◄─►89

o3-mini-high

1363

±5

18,735

OpenAI

專有

83

77◄─►90

grok-3-mini-high

1362

±5

17,590

xAI

專有

84

79◄─►92

gemini-2.0-flash-001

1360

±4

45,110

Google

專有

85

79◄─►100

deepseek-v3

1357

±5

21,994

DeepSeek

DeepSeek

86

79◄─►101

grok-3-mini-beta

1357

±5

23,794

xAI

專有

87

82◄─►106

mistral-small-2506

1355

±5

18,329

Mistral

Apache 2.0

88

84◄─►106

gemini-2.0-flash-lite-preview-02-05

1353

±4

25,215

Google

專有

89

84◄─►107

gpt-oss-120b

1352

±4

31,278

OpenAI

Apache 2.0

90

85◄─►106

Coherecommand-a-03-2025

1352

±3

57,833

Cohere

CC-BY-NC-4.0

91

82◄─►109

glm-4.5v

1352

±8

4,977

Z.ai

MIT

92

85◄─►107

gemini-1.5-pro-002

1351

±3

56,012

Google

專有

93

87◄─►109

o3-mini

1348

±3

58,816

OpenAI

專有

94

85◄─►112

amazon-nova-experimental-chat-10-20

1348

±9

5,524

Amazon

專有

95

82◄─►118

Tencenthunyuan-turbos-20250226

1346

±12

2,250

Tencent

專有

96

85◄─►112

ling-flash-2.0

1346

±7

7,161

Ant Group

MIT

97

85◄─►115

Minimaxminimax-m2

1346

±8

7,123

MiniMax

Apache 2.0

98

85◄─►114

Stepfunstep-3

1346

±7

6,641

StepFun

Apache 2.0

99

83◄─►119

Nvidiallama-3.1-nemotron-ultra-253b-v1

1346

±12

2,573

Nvidia

Nvidia Open Model

100

85◄─►119

amazon-nova-experimental-chat-10-09

1345

±11

2,892

Amazon

專有

101

90◄─►109

gpt-4o-2024-05-13

1345

±3

113,568

OpenAI

專有

102

85◄─►118

qwen3-32b

1345

±9

3,943

Alibaba

Apache 2.0

103

86◄─►118

qwen-plus-0125

1345

±8

5,861

Alibaba

專有

104

87◄─►118

glm-4-plus-0111

1343

±8

5,806

Zhipu

專有

105

92◄─►112

Anthropicclaude-3-5-sonnet-20240620

1342

±3

82,864

Anthropic

專有

106

87◄─►121

gemma-3-12b-it

1340

±9

3,866

Google

Gemma

107

87◄─►123

Nvidianvidia-llama-3.3-nemotron-super-49b-v1.5

1340

±10

3,492

Nvidia

Nvidia Open

108

92◄─►120

gpt-5-nano-high

1339

±7

8,388

OpenAI

專有

109

87◄─►125

Tencenthunyuan-turbo-0110

1339

±11

2,322

Tencent

專有

110

95◄─►120

o1-mini

1335

±4

52,301

OpenAI

專有

111

95◄─►120

Metallama-3.1-405b-instruct-bf16

1335

±4

41,932

Meta

Llama 3.1 Community

112

98◄─►123

gpt-4o-2024-08-06

1335

±4

45,787

OpenAI

專有

113

100◄─►122

grok-2-2024-08-13

1334

±4

63,725

xAI

專有

114

99◄─►123

qwq-32b

1334

±4

26,273

Alibaba

Apache 2.0

115

98◄─►123

gemini-advanced-0514

1334

±5

50,654

Google

專有

116

100◄─►123

Metallama-3.1-405b-instruct-fp8

1334

±3

60,272

Meta

Llama 3.1 Community

117

95◄─►133

Stepfunstep-2-16k-exp-202412

1333

±9

4,895

StepFun

專有

118

106◄─►134

01.AIyi-lightning

1328

±5

27,624

01 AI

專有

119

109◄─►135

Metallama-4-maverick-17b-128e-instruct

1327

±4

41,204

Meta

Llama 4

120

110◄─►137

qwen3-30b-a3b

1326

±5

27,492

Alibaba

Apache 2.0

121

100◄─►145

Nvidiallama-3.3-nemotron-49b-super-v1

1326

±12

2,243

Nvidia

Nvidia

122

104◄─►144

Tencenthunyuan-large-2025-02-10

1325

±10

3,760

Tencent

專有

123

116◄─►138

gpt-4-turbo-2024-04-09

1324

±4

98,965

OpenAI

專有

124

117◄─►140

Anthropicclaude-3-5-haiku-20241022

1323

±3

71,383

Anthropic

專有

125

117◄─►140

Metallama-4-scout-17b-16e-instruct

1322

±5

31,200

Meta

Llama

126

110◄─►145

deepseek-v2.5-1210

1322

±8

6,877

DeepSeek

DeepSeek

127

117◄─►140

Anthropicclaude-3-opus-20240229

1322

±3

196,368

Anthropic

專有

128

117◄─►140

gemini-1.5-pro-001

1322

±4

79,769

Google

專有

129

116◄─►145

gpt-4.1-nano-2025-04-14

1321

±8

6,143

OpenAI

專有

130

117◄─►145

ring-flash-2.0

1320

±7

7,282

Ant Group

MIT

131

117◄─►145

Stepfunstep-1o-turbo-202506

1320

±7

9,665

StepFun

專有

132

120◄─►144

Metallama-3.3-70b-instruct

1319

±3

56,012

Meta

Llama-3.3

133

118◄─►145

gemma-3n-e4b-it

1319

±5

23,471

Google

Gemma

134

119◄─►145

glm-4-plus

1318

±5

26,342

Zhipu AI

專有

135

117◄─►146

gpt-oss-20b

1318

±6

10,850

OpenAI

Apache 2.0

136

120◄─►146

qwen-max-0919

1317

±6

16,598

Alibaba

Qwen

137

122◄─►145

gpt-4o-mini-2024-07-18

1316

±3

69,291

OpenAI

專有

138

121◄─►151

qwen2.5-plus-1127

1314

±6

10,252

Alibaba

專有

139

126◄─►150

mistral-large-2407

1313

±4

45,968

Mistral

Mistral Research

140

126◄─►151

athene-v2-chat

1313

±4

24,880

NexusFlow

NexusFlow

141

126◄─►150

gpt-4-1106-preview

1313

±4

101,117

OpenAI

專有

142

126◄─►151

gpt-4-0125-preview

1313

±4

94,534

OpenAI

專有

143

117◄─►155

mercury

1311

±14

1,968

Inception AI

專有

144

128◄─►152

gemini-1.5-flash-002

1310

±4

35,180

Google

專有

145

122◄─►155

Tencenthunyuan-standard-2025-02-10

1310

±10

3,920

Tencent

專有

146

138◄─►155

grok-2-mini-2024-08-13

1307

±4

52,789

xAI

專有

147

138◄─►155

deepseek-v2.5

1306

±5

24,839

DeepSeek

DeepSeek

148

138◄─►155

magistral-medium-2506

1305

±6

12,000

Mistral

專有

149

140◄─►155

mistral-large-2411

1305

±4

28,455

Mistral

MRL

150

138◄─►155

athene-70b-0725

1305

±6

19,796

NexusFlow

CC-BY-NC-4.0

151

143◄─►155

mistral-small-3.1-24b-instruct-2503

1303

±4

34,145

Mistral

Apache 2.0

152

136◄─►160

gemma-3-4b-it

1303

±9

4,195

Google

Gemma

153

144◄─►155

qwen2.5-72b-instruct

1302

±4

39,632

Alibaba

Qwen

154

144◄─►163

Nvidiallama-3.1-nemotron-70b-instruct

1297

±8

7,216

Nvidia

Llama 3.1

155

144◄─►164

Tencenthunyuan-large-vision

1295

±9

5,599

Tencent

專有

156

153◄─►163

Metallama-3.1-70b-instruct

1293

±4

56,003

Meta

Llama 3.1 Community

157

154◄─►166

amazon-nova-pro-v1.0

1288

±4

25,218

Amazon

專有

158

153◄─►168

jamba-1.5-large

1288

±7

8,730

AI21 Labs

Jamba Open

159

153◄─►168

reka-core-20240904

1287

±7

7,380

Reka AI

專有

160

154◄─►166

gemma-2-27b-it

1287

±3

76,195

Google

Gemma license

161

153◄─►174

Nvidiallama-3.1-nemotron-51b-instruct

1286

±10

3,777

Nvidia

Llama 3.1

162

153◄─►174

llama-3.1-tulu-3-70b

1286

±10

2,881

Ai2

Llama 3.1

163

154◄─►168

gpt-4-0314

1286

±5

54,754

OpenAI

專有

164

156◄─►168

gemini-1.5-flash-001

1284

±4

63,418

Google

專有

165

157◄─►174

Anthropicclaude-3-sonnet-20240229

1281

±4

110,173

Anthropic

專有

166

157◄─►174

gemma-2-9b-it-simpo

1279

±7

10,108

Princeton

MIT

167

159◄─►174

Nvidianemotron-4-340b-instruct

1278

±5

19,913

Nvidia

NVIDIA Open Model

168

159◄─►175

Coherecommand-r-plus-08-2024

1277

±7

9,931

Cohere

CC-BY-NC-4.0

169

163◄─►174

Metallama-3-70b-instruct

1276

±3

158,908

Meta

Llama 3 Community

170

163◄─►175

gpt-4-0613

1275

±4

89,612

OpenAI

專有

171

163◄─►177

mistral-small-24b-instruct-2501

1274

±6

14,830

Mistral

Apache 2.0

172

162◄─►179

glm-4-0520

1273

±7

9,857

Zhipu AI

專有

173

163◄─►179

reka-flash-20240904

1273

±7

7,583

Reka AI

專有

174

163◄─►183

qwen2.5-coder-32b-instruct

1269

±8

5,452

Alibaba

Apache 2.0

175

169◄─►183

Coherec4ai-aya-expanse-32b

1267

±5

27,362

Cohere

CC-BY-NC-4.0

176

171◄─►183

gemma-2-9b-it

1265

±4

54,954

Google

Gemma license

177

171◄─►185

deepseek-coder-v2

1264

±6

15,242

DeepSeek AI

DeepSeek 許可證

178

172◄─►184

Coherecommand-r-plus

1263

±4

78,401

Cohere

CC-BY-NC-4.0

179

172◄─►185

qwen2-72b-instruct

1262

±5

37,688

Alibaba

Qianwen LICENSE

180

174◄─►185

Anthropicclaude-3-haiku-20240307

1261

±4

118,626

Anthropic

專有

181

174◄─►185

amazon-nova-lite-v1.0

1260

±5

19,760

Amazon

專有

182

174◄─►185

gemini-1.5-flash-8b-001

1260

±4

35,914

Google

專有

183

177◄─►185

Azurephi-4

1255

±4

24,354

Microsoft

MIT

184

174◄─►190

olmo-2-0325-32b-instruct

1253

±11

3,377

Allen AI

Apache-2.0

185

178◄─►189

Coherecommand-r-08-2024

1252

±7

10,229

Cohere

CC-BY-NC-4.0

186

184◄─►194

mistral-large-2402

1242

±5

63,404

Mistral

專有

187

184◄─►194

amazon-nova-micro-v1.0

1241

±5

19,774

Amazon

專有

188

184◄─►199

jamba-1.5-mini

1239

±7

8,918

AI21 Labs

Jamba Open

189

184◄─►202

ministral-8b-2410

1237

±9

4,833

Mistral

MRL

190

186◄─►200

qwen1.5-110b-chat

1234

±5

26,679

Alibaba

Qianwen LICENSE

191

186◄─►203

gemini-pro-dev-api

1234

±7

18,454

Google

專有

192

186◄─►202

qwen1.5-72b-chat

1233

±5

39,689

Alibaba

Qianwen LICENSE

193

186◄─►203

reka-flash-21b-20240226-online

1233

±7

15,606

Reka AI

專有

194

185◄─►204

Tencenthunyuan-standard-256k

1233

±12

2,761

Tencent

專有

195

188◄─►203

mixtral-8x22b-instruct-v0.1

1230

±4

52,214

Mistral

Apache 2.0

196

188◄─►204

Coherecommand-r

1228

±5

54,710

Cohere

CC-BY-NC-4.0

197

188◄─►205

reka-flash-21b-20240226

1227

±6

25,026

Reka AI

專有

198

190◄─►205

gpt-3.5-turbo-0125

1224

±5

67,214

OpenAI

專有

199

189◄─►206

Coherec4ai-aya-expanse-8b

1224

±7

9,922

Cohere

CC-BY-NC-4.0

200

190◄─►206

mistral-medium

1223

±5

34,893

Mistral

專有

201

192◄─►205

Metallama-3-8b-instruct

1223

±4

106,055

Meta

Llama 3 Community

202

188◄─►207

llama-3.1-tulu-3-8b

1222

±11

2,943

Ai2

Llama 3.1

203

188◄─►209

gemini-pro

1221

±12

6,418

Google

專有

204

195◄─►210

HuggingFacezephyr-orpo-141b-A35b-v0.1

1213

±11

4,712

HuggingFace

Apache 2.0

205

200◄─►209

01.AIyi-1.5-34b-chat

1213

±5

24,417

01 AI

Apache-2.0

206

202◄─►209

Metallama-3.1-8b-instruct

1211

±4

50,234

Meta

Llama 3.1 Community

207

197◄─►215

granite-3.1-8b-instruct

1210

±11

3,142

IBM

Apache 2.0

208

203◄─►215

qwen1.5-32b-chat

1205

±6

22,068

Alibaba

Qianwen LICENSE

209

203◄─►217

gpt-3.5-turbo-1106

1201

±9

16,760

OpenAI

專有

210

206◄─►217

Azurephi-3-medium-4k-instruct

1198

±5

25,301

Microsoft

MIT

211

207◄─►216

gemma-2-2b-it

1198

±4

46,901

Google

Gemma license

212

207◄─►217

mixtral-8x7b-instruct-v0.1

1198

±4

74,303

Mistral

Apache 2.0

213

207◄─►222

dbrx-instruct-preview

1196

±6

32,760

Databricks

DBRX LICENSE

214

207◄─►226

InternLMinternlm2_5-20b-chat

1193

±7

10,038

InternLM

Other

215

207◄─►226

qwen1.5-14b-chat

1192

±7

18,066

Alibaba

Qianwen LICENSE

216

210◄─►232

Azurewizardlm-70b

1184

±9

8,270

Microsoft

Llama 2 Community

217

213◄─►232

granite-3.0-8b-instruct

1184

±9

6,727

IBM

Apache 2.0

218

213◄─►230

01.AIyi-34b-chat

1184

±7

15,624

01 AI

Yi License

219

209◄─►233

deepseek-llm-67b-chat

1183

±12

4,950

DeepSeek AI

DeepSeek 許可證

220

213◄─►233

OpenChatopenchat-3.5-0106

1182

±8

12,712

OpenChat

Apache-2.0

221

213◄─►233

OpenChatopenchat-3.5

1182

±10

8,009

OpenChat

Apache-2.0

222

213◄─►234

granite-3.1-2b-instruct

1181

±11

3,235

IBM

Apache 2.0

223

214◄─►233

Snowflakesnowflake-arctic-instruct

1180

±6

33,272

Snowflake

Apache 2.0

224

214◄─►233

gemma-1.1-7b-it

1180

±6

24,327

Google

Gemma license

225

214◄─►235

tulu-2-dpo-70b

1178

±10

6,579

AllenAI/UW

AI2 ImpACT Low-risk

226

214◄─►238

openhermes-2.5-mistral-7b

1176

±10

5,026

NousResearch

Apache-2.0

227

216◄─►235

vicuna-33b

1173

±6

22,613

LMSYS

Non-commercial

228

216◄─►238

starling-lm-7b-beta

1172

±7

16,190

Nexusflow

Apache-2.0

229

216◄─►237

Azurephi-3-small-8k-instruct

1172

±6

17,983

Microsoft

MIT

230

217◄─►237

Metallama-2-70b-chat

1171

±5

38,767

Meta

Llama 2 Community

231

217◄─►240

starling-lm-7b-alpha

1168

±8

10,267

UC Berkeley

CC-BY-NC-4.0

232

219◄─►240

Metallama-3.2-3b-instruct

1167

±8

8,043

Meta

Llama 3.2

233

216◄─►243

nous-hermes-2-mixtral-8x7b-dpo

1165

±12

3,792

NousResearch

Apache-2.0

234

224◄─►246

qwq-32b-preview

1159

±11

3,256

Alibaba

Apache 2.0

235

229◄─►246

granite-3.0-2b-instruct

1157

±8

6,922

IBM

Apache 2.0

236

225◄─►250

Nvidiallama2-70b-steerlm-chat

1156

±13

3,605

Nvidia

Llama 2 Community

237

227◄─►251

solar-10.7b-instruct-v1.0

1153

±13

4,187

Upstage AI

CC-BY-NC-4.0

238

227◄─►255

dolphin-2.2.1-mistral-7b

1151

±15

1,685

Cognitive Computations

Apache-2.0

239

233◄─►250

mistral-7b-instruct-v0.2

1150

±7

19,603

Mistral

Apache-2.0

240

231◄─►254

mpt-30b-chat

1150

±12

2,606

MosaicML

CC-BY-NC-SA-4.0

241

233◄─►252

Azurewizardlm-13b

1149

±9

7,122

Microsoft

Llama 2 Community

242

231◄─►258

falcon-180b-chat

1146

±17

1,312

TII

Falcon-180B TII License

243

233◄─►257

qwen1.5-7b-chat

1144

±10

4,782

Alibaba

Qianwen LICENSE

244

234◄─►255

Azurephi-3-mini-4k-instruct-june-2024

1143

±6

12,415

Microsoft

MIT

245

234◄─►255

Metallama-2-13b-chat

1142

±7

19,357

Meta

Llama 2 Community

246

236◄─►256

vicuna-13b

1141

±7

19,539

LMSYS

Llama 2 Community

247

234◄─►258

qwen-14b-chat

1138

±11

5,004

Alibaba

Qianwen LICENSE

248

236◄─►258

Metacodellama-34b-instruct

1136

±9

7,417

Meta

Llama 2 Community

249

236◄─►258

palm-2

1136

±9

8,634

Google

專有

250

236◄─►258

gemma-7b-it

1134

±9

9,034

Google

Gemma license

251

239◄─►259

HuggingFacezephyr-7b-beta

1131

±9

11,220

HuggingFace

MIT

252

240◄─►258

Azurephi-3-mini-128k-instruct

1131

±7

21,024

Microsoft

MIT

253

243◄─►259

Azurephi-3-mini-4k-instruct

1129

±6

20,539

Microsoft

MIT

254

238◄─►263

HuggingFacezephyr-7b-alpha

1128

±16

1,803

HuggingFace

MIT

255

240◄─►263

guanaco-33b

1127

±12

2,955

UW

Non-commercial

256

246◄─►263

stripedhyena-nous-7b

1120

±11

5,214

Together AI

Apache 2.0

257

245◄─►263

HuggingFacesmollm2-1.7b-instruct

1120

±14

2,244

HuggingFace

Apache 2.0

258

241◄─►264

Metacodellama-70b-instruct

1119

±18

1,151

Meta

Llama 2 Community

259

252◄─►263

vicuna-7b

1114

±9

6,972

LMSYS

Llama 2 Community

260

254◄─►263

Metallama-3.2-1b-instruct

1114

±8

8,166

Meta

Llama 3.2

261

254◄─►263

gemma-1.1-2b-it

1114

±8

11,035

Google

Gemma license

262

254◄─►264

mistral-7b-instruct

1110

±9

9,042

Mistral

Apache 2.0

263

254◄─►264

Metallama-2-7b-chat

1108

±7

14,272

Meta

Llama 2 Community

264

264◄─►266

qwen1.5-4b-chat

1091

±9

7,662

Alibaba

Qianwen LICENSE

265

261◄─►268

gemma-2b-it

1090

±12

4,817

Google

Gemma license

266

264◄─►271

olmo-7b-instruct

1074

±11

6,412

Allen AI

Apache-2.0

267

265◄─►271

koala-13b

1069

±10

6,998

UC Berkeley

Non-commercial

268

266◄─►271

alpaca-13b

1065

±12

5,828

Stanford

Non-commercial

269

265◄─►272

gpt4all-13b-snoozy

1064

±15

1,773

Nomic AI

Non-commercial

270

266◄─►272

mpt-7b-chat

1060

±12

3,977

MosaicML

CC-BY-NC-SA-4.0

271

266◄─►272

chatglm3-6b

1056

±12

4,692

Tsinghua

Apache-2.0

272

269◄─►274

RWKVRWKV-4-Raven-14B

1040

±11

4,898

RWKV

Apache 2.0

273

272◄─►274

chatglm2-6b

1025

±14

2,683

Tsinghua

Apache-2.0

274

272◄─►274

oasst-pythia-12b

1021

±11

6,343

OpenAssistant

Apache 2.0

275

275◄─►278

chatglm-6b

994

±13

4,968

Tsinghua

Non-commercial

276

275◄─►278

fastchat-t5-3b

990

±12

4,270

LMSYS

Apache 2.0

277

275◄─►278

dolly-v2-12b

977

±14

3,471

Databricks

MIT

278

275◄─►279

Metallama-13b

968

±16

2,441

Meta

Non-commercial

279

278◄─►279

Stabilitystablelm-tuned-alpha-7b

951

±13

3,325

Stability AI

CC-BY-NC-SA-4.0

說明

  • 排名 (UB):基於 Bradley-Terry 模型計算嘅排名。此排名反映咗模型喺競技場中嘅綜合表現,並提供咗其 Elo 分數嘅 上界 估計,幫助理解模型嘅潛在競爭力。

  • 模型:大型語言模型 (LLM) 嘅名稱。部分模型名稱可能已嵌入相關鏈接。

  • 分數:模型喺競技場中通過用戶投票獲得嘅 Elo 評分。Elo 評分係一種相對排名系統,分數越高表示模型表現越好。

  • 95% 信心區間 (±):模型 Elo 評分嘅95%置信區間(例如:±6)。呢個區間越細,表示模型嘅評分越穩定同可靠。

  • 票數:該模型喺競技場中收到嘅總投票數量。投票數越多,通常意味住其評分嘅統計可靠性越高。

  • 組織/公司:提供該模型嘅組織或公司。

  • 許可證:模型嘅許可協議類型,例如專有 (Proprietary)、Apache 2.0、MIT 等。

數據來源與更新頻率

本排行榜數據由自動化腳本直接從 1 2 官方網站獲取。此排行榜由 GitHub Actions 每日自動更新。

免責聲明

本報告僅供參考。排行榜數據係動態變化嘅,並基於特定時間段內用戶喺 Chatbot Arena 上嘅偏好投票。數據嘅完整性同準確性取決於上游數據源。唔同模型可能採用唔同嘅許可協議,使用時請務必參考模型提供商嘅官方說明。

Last updated

Was this helpful?