模型榜單
呢個係基於 Chatbot Arena (lmarena.ai) 數據嘅排行榜,透過自動化流程生成。
數據更新時間: 2025-12-05 08:08:31 UTC / 2025-12-05 16:08:31 CST (北京時間)
排行榜
1
1◄─►2
gemini-3-pro
1491
±7
13,423
專有
2
1◄─►3
grok-4.1-thinking
1481
±7
14,001
xAI
專有
3
2◄─►6
Anthropicclaude-opus-4-5-20251101-thinking-32k
1469
±8
7,552
Anthropic
專有
4
3◄─►6
Anthropicclaude-opus-4-5-20251101
1465
±8
8,321
Anthropic
專有
5
3◄─►6
grok-4.1
1463
±7
13,890
xAI
專有
6
3◄─►10
gpt-5.1-high
1457
±7
11,559
OpenAI
專有
7
6◄─►11
gemini-2.5-pro
1451
±4
74,528
專有
8
6◄─►12
Anthropicclaude-sonnet-4-5-20250929-thinking-32k
1448
±5
25,546
Anthropic
專有
9
6◄─►11
Anthropicclaude-opus-4-1-20250805-thinking-16k
1448
±4
41,341
Anthropic
專有
10
6◄─►15
Anthropicclaude-sonnet-4-5-20250929
1445
±5
20,675
Anthropic
專有
11
7◄─►17
gpt-4.5-preview-2025-02-27
1443
±6
14,644
OpenAI
專有
12
9◄─►18
Anthropicclaude-opus-4-1-20250805
1440
±4
54,404
Anthropic
專有
13
10◄─►18
chatgpt-4o-latest-20250326
1440
±3
60,767
OpenAI
專有
14
10◄─►19
gpt-5-high
1437
±5
32,896
OpenAI
專有
15
10◄─►24
gpt-5.1
1435
±7
12,389
OpenAI
專有
16
11◄─►21
o3-2025-04-16
1434
±4
61,602
OpenAI
專有
17
11◄─►24
qwen3-max-preview
1433
±5
28,135
Alibaba
專有
18
12◄─►39
grok-4-1-fast-reasoning
1429
±8
6,534
xAI
專有
19
14◄─►39
MoonshotAIkimi-k2-thinking-turbo
1428
±6
13,222
Moonshot
Modified MIT
20
15◄─►39
glm-4.6
1425
±5
22,311
Z.ai
MIT
21
16◄─►39
gpt-5-chat
1425
±4
32,139
OpenAI
專有
22
16◄─►39
qwen3-max-2025-09-23
1424
±6
9,256
Alibaba
專有
23
18◄─►39
Anthropicclaude-opus-4-20250514-thinking-16k
1423
±4
37,879
Anthropic
專有
24
16◄─►40
deepseek-v3.2-exp
1423
±7
11,980
DeepSeek AI
MIT
25
18◄─►39
qwen3-235b-a22b-instruct-2507
1421
±4
48,918
Alibaba
Apache 2.0
26
18◄─►42
deepseek-v3.2-exp-thinking
1421
±7
9,228
DeepSeek AI
MIT
27
15◄─►46
mistral-large-3
1420Preliminary
±10
3,951
Mistral
Apache 2.0
28
18◄─►45
grok-4-fast
1420
±8
7,060
xAI
專有
29
18◄─►46
MoonshotAIkimi-k2-0905-preview
1418
±7
11,843
Moonshot
Modified MIT
30
18◄─►45
deepseek-r1-0528
1418
±6
19,241
DeepSeek
MIT
31
18◄─►47
ernie-5.0-preview-1022
1418
±9
4,702
Baidu
專有
32
18◄─►45
MoonshotAIkimi-k2-0711-preview
1417
±5
28,672
Moonshot
Modified MIT
33
18◄─►46
deepseek-v3.1
1417
±6
15,259
DeepSeek
MIT
34
18◄─►47
deepseek-v3.1-thinking
1416
±7
11,987
DeepSeek
MIT
35
18◄─►50
deepseek-v3.1-terminus
1415
±10
3,746
DeepSeek AI
MIT
36
18◄─►47
qwen3-vl-235b-a22b-instruct
1415
±7
8,535
Alibaba
Apache 2.0
37
18◄─►52
deepseek-v3.1-terminus-thinking
1414
±10
3,522
DeepSeek AI
MIT
38
18◄─►56
deepseek-v3.2
1413
±10
4,053
DeepSeek AI
MIT
39
25◄─►47
Anthropicclaude-opus-4-20250514
1412
±4
45,676
Anthropic
專有
40
26◄─►47
gpt-4.1-2025-04-14
1412
±4
52,588
OpenAI
專有
41
18◄─►56
deepseek-v3.2-thinking
1411
±11
3,575
DeepSeek AI
MIT
42
26◄─►47
mistral-medium-2508
1411
±4
43,003
Mistral
專有
43
27◄─►50
grok-3-preview-02-24
1410
±4
34,127
xAI
專有
44
27◄─►52
grok-4-0709
1409
±4
42,578
xAI
專有
45
27◄─►53
glm-4.5
1409
±5
24,827
Z.ai
MIT
46
30◄─►52
gemini-2.5-flash
1408
±3
73,910
專有
47
33◄─►57
gemini-2.5-flash-preview-09-2025
1405
±5
27,015
專有
48
39◄─►59
grok-4-fast-reasoning
1402
±5
18,886
xAI
專有
49
39◄─►59
Anthropicclaude-haiku-4-5-20251001
1402
±5
23,785
Anthropic
專有
50
41◄─►59
o1-2024-12-17
1401
±4
28,039
OpenAI
專有
51
41◄─►61
qwen3-next-80b-a3b-instruct
1400
±5
23,119
Alibaba
Apache 2.0
52
39◄─►63
longcat-flash-chat
1400
±6
11,502
Meituan
MIT
53
45◄─►62
Anthropicclaude-sonnet-4-20250514-thinking-32k
1399
±4
36,216
Anthropic
專有
54
44◄─►62
qwen3-235b-a22b-no-thinking
1399
±5
39,380
Alibaba
Apache 2.0
55
45◄─►66
qwen3-235b-a22b-thinking-2507
1397
±6
9,346
Alibaba
Apache 2.0
56
48◄─►66
deepseek-r1
1396
±5
18,718
DeepSeek
MIT
57
47◄─►68
qwen3-vl-235b-a22b-thinking
1394
±7
7,984
Alibaba
Apache 2.0
58
48◄─►68
gpt-5-mini-high
1392
±5
27,447
OpenAI
專有
59
51◄─►67
deepseek-v3-0324
1392
±4
46,786
DeepSeek
MIT
60
45◄─►73
Tencenthunyuan-vision-1.5-thinking
1391
±12
2,213
Tencent
專有
61
52◄─►68
o4-mini-2025-04-16
1391
±4
46,849
OpenAI
專有
62
51◄─►70
mai-1-preview
1391
±5
18,186
Microsoft AI
專有
63
55◄─►71
Anthropicclaude-sonnet-4-20250514
1389
±4
41,655
Anthropic
專有
64
55◄─►72
o1-preview
1387
±5
31,505
OpenAI
專有
65
55◄─►72
Anthropicclaude-3-7-sonnet-20250219-thinking-32k
1387
±4
39,914
Anthropic
專有
66
57◄─►72
qwen3-coder-480b-a35b-instruct
1385
±5
23,156
Alibaba
Apache 2.0
67
54◄─►75
Tencenthunyuan-t1-20250711
1385
±9
4,819
Tencent
專有
68
58◄─►74
mistral-medium-2505
1383
±5
34,529
Mistral
專有
69
61◄─►74
qwen3-30b-a3b-instruct-2507
1382
±5
24,200
Alibaba
Apache 2.0
70
62◄─►75
gpt-4.1-mini-2025-04-14
1381
±4
40,494
OpenAI
專有
71
61◄─►78
Tencenthunyuan-turbos-20250416
1380
±6
11,130
Tencent
專有
72
63◄─►77
gemini-2.5-flash-lite-preview-09-2025-no-thinking
1379
±5
26,924
專有
73
66◄─►79
gemini-2.5-flash-lite-preview-06-17-thinking
1375
±4
33,971
專有
74
67◄─►80
qwen3-235b-a22b
1374
±5
27,167
Alibaba
Apache 2.0
75
69◄─►80
qwen2.5-max
1373
±4
33,548
Alibaba
專有
76
71◄─►80
Anthropicclaude-3-5-sonnet-20241022
1372
±3
89,850
Anthropic
專有
77
71◄─►83
Anthropicclaude-3-7-sonnet-20250219
1371
±4
44,562
Anthropic
專有
78
72◄─►83
glm-4.5-air
1370
±4
31,676
Z.ai
MIT
79
73◄─►86
qwen3-next-80b-a3b-thinking
1367
±6
13,824
Alibaba
Apache 2.0
80
74◄─►86
Minimaxminimax-m1
1366
±4
36,885
MiniMax
Apache 2.0
81
77◄─►86
gemma-3-27b-it
1365
±4
49,315
Gemma
82
77◄─►89
o3-mini-high
1363
±5
18,735
OpenAI
專有
83
77◄─►90
grok-3-mini-high
1362
±5
17,590
xAI
專有
84
79◄─►92
gemini-2.0-flash-001
1360
±4
45,110
專有
85
79◄─►100
deepseek-v3
1357
±5
21,994
DeepSeek
DeepSeek
86
79◄─►101
grok-3-mini-beta
1357
±5
23,794
xAI
專有
87
82◄─►106
mistral-small-2506
1355
±5
18,329
Mistral
Apache 2.0
88
84◄─►106
gemini-2.0-flash-lite-preview-02-05
1353
±4
25,215
專有
89
84◄─►107
gpt-oss-120b
1352
±4
31,278
OpenAI
Apache 2.0
90
85◄─►106
Coherecommand-a-03-2025
1352
±3
57,833
Cohere
CC-BY-NC-4.0
91
82◄─►109
glm-4.5v
1352
±8
4,977
Z.ai
MIT
92
85◄─►107
gemini-1.5-pro-002
1351
±3
56,012
專有
93
87◄─►109
o3-mini
1348
±3
58,816
OpenAI
專有
94
85◄─►112
amazon-nova-experimental-chat-10-20
1348
±9
5,524
Amazon
專有
95
82◄─►118
Tencenthunyuan-turbos-20250226
1346
±12
2,250
Tencent
專有
96
85◄─►112
ling-flash-2.0
1346
±7
7,161
Ant Group
MIT
97
85◄─►115
Minimaxminimax-m2
1346
±8
7,123
MiniMax
Apache 2.0
98
85◄─►114
Stepfunstep-3
1346
±7
6,641
StepFun
Apache 2.0
99
83◄─►119
Nvidiallama-3.1-nemotron-ultra-253b-v1
1346
±12
2,573
Nvidia
Nvidia Open Model
100
85◄─►119
amazon-nova-experimental-chat-10-09
1345
±11
2,892
Amazon
專有
101
90◄─►109
gpt-4o-2024-05-13
1345
±3
113,568
OpenAI
專有
102
85◄─►118
qwen3-32b
1345
±9
3,943
Alibaba
Apache 2.0
103
86◄─►118
qwen-plus-0125
1345
±8
5,861
Alibaba
專有
104
87◄─►118
glm-4-plus-0111
1343
±8
5,806
Zhipu
專有
105
92◄─►112
Anthropicclaude-3-5-sonnet-20240620
1342
±3
82,864
Anthropic
專有
106
87◄─►121
gemma-3-12b-it
1340
±9
3,866
Gemma
107
87◄─►123
Nvidianvidia-llama-3.3-nemotron-super-49b-v1.5
1340
±10
3,492
Nvidia
Nvidia Open
108
92◄─►120
gpt-5-nano-high
1339
±7
8,388
OpenAI
專有
109
87◄─►125
Tencenthunyuan-turbo-0110
1339
±11
2,322
Tencent
專有
110
95◄─►120
o1-mini
1335
±4
52,301
OpenAI
專有
111
95◄─►120
Metallama-3.1-405b-instruct-bf16
1335
±4
41,932
Meta
Llama 3.1 Community
112
98◄─►123
gpt-4o-2024-08-06
1335
±4
45,787
OpenAI
專有
113
100◄─►122
grok-2-2024-08-13
1334
±4
63,725
xAI
專有
114
99◄─►123
qwq-32b
1334
±4
26,273
Alibaba
Apache 2.0
115
98◄─►123
gemini-advanced-0514
1334
±5
50,654
專有
116
100◄─►123
Metallama-3.1-405b-instruct-fp8
1334
±3
60,272
Meta
Llama 3.1 Community
117
95◄─►133
Stepfunstep-2-16k-exp-202412
1333
±9
4,895
StepFun
專有
118
106◄─►134
01.AIyi-lightning
1328
±5
27,624
01 AI
專有
119
109◄─►135
Metallama-4-maverick-17b-128e-instruct
1327
±4
41,204
Meta
Llama 4
120
110◄─►137
qwen3-30b-a3b
1326
±5
27,492
Alibaba
Apache 2.0
121
100◄─►145
Nvidiallama-3.3-nemotron-49b-super-v1
1326
±12
2,243
Nvidia
Nvidia
122
104◄─►144
Tencenthunyuan-large-2025-02-10
1325
±10
3,760
Tencent
專有
123
116◄─►138
gpt-4-turbo-2024-04-09
1324
±4
98,965
OpenAI
專有
124
117◄─►140
Anthropicclaude-3-5-haiku-20241022
1323
±3
71,383
Anthropic
專有
125
117◄─►140
Metallama-4-scout-17b-16e-instruct
1322
±5
31,200
Meta
Llama
126
110◄─►145
deepseek-v2.5-1210
1322
±8
6,877
DeepSeek
DeepSeek
127
117◄─►140
Anthropicclaude-3-opus-20240229
1322
±3
196,368
Anthropic
專有
128
117◄─►140
gemini-1.5-pro-001
1322
±4
79,769
專有
129
116◄─►145
gpt-4.1-nano-2025-04-14
1321
±8
6,143
OpenAI
專有
130
117◄─►145
ring-flash-2.0
1320
±7
7,282
Ant Group
MIT
131
117◄─►145
Stepfunstep-1o-turbo-202506
1320
±7
9,665
StepFun
專有
132
120◄─►144
Metallama-3.3-70b-instruct
1319
±3
56,012
Meta
Llama-3.3
133
118◄─►145
gemma-3n-e4b-it
1319
±5
23,471
Gemma
134
119◄─►145
glm-4-plus
1318
±5
26,342
Zhipu AI
專有
135
117◄─►146
gpt-oss-20b
1318
±6
10,850
OpenAI
Apache 2.0
136
120◄─►146
qwen-max-0919
1317
±6
16,598
Alibaba
Qwen
137
122◄─►145
gpt-4o-mini-2024-07-18
1316
±3
69,291
OpenAI
專有
138
121◄─►151
qwen2.5-plus-1127
1314
±6
10,252
Alibaba
專有
139
126◄─►150
mistral-large-2407
1313
±4
45,968
Mistral
Mistral Research
140
126◄─►151
athene-v2-chat
1313
±4
24,880
NexusFlow
NexusFlow
141
126◄─►150
gpt-4-1106-preview
1313
±4
101,117
OpenAI
專有
142
126◄─►151
gpt-4-0125-preview
1313
±4
94,534
OpenAI
專有
143
117◄─►155
mercury
1311
±14
1,968
Inception AI
專有
144
128◄─►152
gemini-1.5-flash-002
1310
±4
35,180
專有
145
122◄─►155
Tencenthunyuan-standard-2025-02-10
1310
±10
3,920
Tencent
專有
146
138◄─►155
grok-2-mini-2024-08-13
1307
±4
52,789
xAI
專有
147
138◄─►155
deepseek-v2.5
1306
±5
24,839
DeepSeek
DeepSeek
148
138◄─►155
magistral-medium-2506
1305
±6
12,000
Mistral
專有
149
140◄─►155
mistral-large-2411
1305
±4
28,455
Mistral
MRL
150
138◄─►155
athene-70b-0725
1305
±6
19,796
NexusFlow
CC-BY-NC-4.0
151
143◄─►155
mistral-small-3.1-24b-instruct-2503
1303
±4
34,145
Mistral
Apache 2.0
152
136◄─►160
gemma-3-4b-it
1303
±9
4,195
Gemma
153
144◄─►155
qwen2.5-72b-instruct
1302
±4
39,632
Alibaba
Qwen
154
144◄─►163
Nvidiallama-3.1-nemotron-70b-instruct
1297
±8
7,216
Nvidia
Llama 3.1
155
144◄─►164
Tencenthunyuan-large-vision
1295
±9
5,599
Tencent
專有
156
153◄─►163
Metallama-3.1-70b-instruct
1293
±4
56,003
Meta
Llama 3.1 Community
157
154◄─►166
amazon-nova-pro-v1.0
1288
±4
25,218
Amazon
專有
158
153◄─►168
jamba-1.5-large
1288
±7
8,730
AI21 Labs
Jamba Open
159
153◄─►168
reka-core-20240904
1287
±7
7,380
Reka AI
專有
160
154◄─►166
gemma-2-27b-it
1287
±3
76,195
Gemma license
161
153◄─►174
Nvidiallama-3.1-nemotron-51b-instruct
1286
±10
3,777
Nvidia
Llama 3.1
162
153◄─►174
llama-3.1-tulu-3-70b
1286
±10
2,881
Ai2
Llama 3.1
163
154◄─►168
gpt-4-0314
1286
±5
54,754
OpenAI
專有
164
156◄─►168
gemini-1.5-flash-001
1284
±4
63,418
專有
165
157◄─►174
Anthropicclaude-3-sonnet-20240229
1281
±4
110,173
Anthropic
專有
166
157◄─►174
gemma-2-9b-it-simpo
1279
±7
10,108
Princeton
MIT
167
159◄─►174
Nvidianemotron-4-340b-instruct
1278
±5
19,913
Nvidia
NVIDIA Open Model
168
159◄─►175
Coherecommand-r-plus-08-2024
1277
±7
9,931
Cohere
CC-BY-NC-4.0
169
163◄─►174
Metallama-3-70b-instruct
1276
±3
158,908
Meta
Llama 3 Community
170
163◄─►175
gpt-4-0613
1275
±4
89,612
OpenAI
專有
171
163◄─►177
mistral-small-24b-instruct-2501
1274
±6
14,830
Mistral
Apache 2.0
172
162◄─►179
glm-4-0520
1273
±7
9,857
Zhipu AI
專有
173
163◄─►179
reka-flash-20240904
1273
±7
7,583
Reka AI
專有
174
163◄─►183
qwen2.5-coder-32b-instruct
1269
±8
5,452
Alibaba
Apache 2.0
175
169◄─►183
Coherec4ai-aya-expanse-32b
1267
±5
27,362
Cohere
CC-BY-NC-4.0
176
171◄─►183
gemma-2-9b-it
1265
±4
54,954
Gemma license
177
171◄─►185
deepseek-coder-v2
1264
±6
15,242
DeepSeek AI
DeepSeek 許可證
178
172◄─►184
Coherecommand-r-plus
1263
±4
78,401
Cohere
CC-BY-NC-4.0
179
172◄─►185
qwen2-72b-instruct
1262
±5
37,688
Alibaba
Qianwen LICENSE
180
174◄─►185
Anthropicclaude-3-haiku-20240307
1261
±4
118,626
Anthropic
專有
181
174◄─►185
amazon-nova-lite-v1.0
1260
±5
19,760
Amazon
專有
182
174◄─►185
gemini-1.5-flash-8b-001
1260
±4
35,914
專有
183
177◄─►185
Azurephi-4
1255
±4
24,354
Microsoft
MIT
184
174◄─►190
olmo-2-0325-32b-instruct
1253
±11
3,377
Allen AI
Apache-2.0
185
178◄─►189
Coherecommand-r-08-2024
1252
±7
10,229
Cohere
CC-BY-NC-4.0
186
184◄─►194
mistral-large-2402
1242
±5
63,404
Mistral
專有
187
184◄─►194
amazon-nova-micro-v1.0
1241
±5
19,774
Amazon
專有
188
184◄─►199
jamba-1.5-mini
1239
±7
8,918
AI21 Labs
Jamba Open
189
184◄─►202
ministral-8b-2410
1237
±9
4,833
Mistral
MRL
190
186◄─►200
qwen1.5-110b-chat
1234
±5
26,679
Alibaba
Qianwen LICENSE
191
186◄─►203
gemini-pro-dev-api
1234
±7
18,454
專有
192
186◄─►202
qwen1.5-72b-chat
1233
±5
39,689
Alibaba
Qianwen LICENSE
193
186◄─►203
reka-flash-21b-20240226-online
1233
±7
15,606
Reka AI
專有
194
185◄─►204
Tencenthunyuan-standard-256k
1233
±12
2,761
Tencent
專有
195
188◄─►203
mixtral-8x22b-instruct-v0.1
1230
±4
52,214
Mistral
Apache 2.0
196
188◄─►204
Coherecommand-r
1228
±5
54,710
Cohere
CC-BY-NC-4.0
197
188◄─►205
reka-flash-21b-20240226
1227
±6
25,026
Reka AI
專有
198
190◄─►205
gpt-3.5-turbo-0125
1224
±5
67,214
OpenAI
專有
199
189◄─►206
Coherec4ai-aya-expanse-8b
1224
±7
9,922
Cohere
CC-BY-NC-4.0
200
190◄─►206
mistral-medium
1223
±5
34,893
Mistral
專有
201
192◄─►205
Metallama-3-8b-instruct
1223
±4
106,055
Meta
Llama 3 Community
202
188◄─►207
llama-3.1-tulu-3-8b
1222
±11
2,943
Ai2
Llama 3.1
203
188◄─►209
gemini-pro
1221
±12
6,418
專有
204
195◄─►210
HuggingFacezephyr-orpo-141b-A35b-v0.1
1213
±11
4,712
HuggingFace
Apache 2.0
205
200◄─►209
01.AIyi-1.5-34b-chat
1213
±5
24,417
01 AI
Apache-2.0
206
202◄─►209
Metallama-3.1-8b-instruct
1211
±4
50,234
Meta
Llama 3.1 Community
207
197◄─►215
granite-3.1-8b-instruct
1210
±11
3,142
IBM
Apache 2.0
208
203◄─►215
qwen1.5-32b-chat
1205
±6
22,068
Alibaba
Qianwen LICENSE
209
203◄─►217
gpt-3.5-turbo-1106
1201
±9
16,760
OpenAI
專有
210
206◄─►217
Azurephi-3-medium-4k-instruct
1198
±5
25,301
Microsoft
MIT
211
207◄─►216
gemma-2-2b-it
1198
±4
46,901
Gemma license
212
207◄─►217
mixtral-8x7b-instruct-v0.1
1198
±4
74,303
Mistral
Apache 2.0
213
207◄─►222
dbrx-instruct-preview
1196
±6
32,760
Databricks
DBRX LICENSE
214
207◄─►226
InternLMinternlm2_5-20b-chat
1193
±7
10,038
InternLM
Other
215
207◄─►226
qwen1.5-14b-chat
1192
±7
18,066
Alibaba
Qianwen LICENSE
216
210◄─►232
Azurewizardlm-70b
1184
±9
8,270
Microsoft
Llama 2 Community
217
213◄─►232
granite-3.0-8b-instruct
1184
±9
6,727
IBM
Apache 2.0
218
213◄─►230
01.AIyi-34b-chat
1184
±7
15,624
01 AI
Yi License
219
209◄─►233
deepseek-llm-67b-chat
1183
±12
4,950
DeepSeek AI
DeepSeek 許可證
220
213◄─►233
OpenChatopenchat-3.5-0106
1182
±8
12,712
OpenChat
Apache-2.0
221
213◄─►233
OpenChatopenchat-3.5
1182
±10
8,009
OpenChat
Apache-2.0
222
213◄─►234
granite-3.1-2b-instruct
1181
±11
3,235
IBM
Apache 2.0
223
214◄─►233
Snowflakesnowflake-arctic-instruct
1180
±6
33,272
Snowflake
Apache 2.0
224
214◄─►233
gemma-1.1-7b-it
1180
±6
24,327
Gemma license
225
214◄─►235
tulu-2-dpo-70b
1178
±10
6,579
AllenAI/UW
AI2 ImpACT Low-risk
226
214◄─►238
openhermes-2.5-mistral-7b
1176
±10
5,026
NousResearch
Apache-2.0
227
216◄─►235
vicuna-33b
1173
±6
22,613
LMSYS
Non-commercial
228
216◄─►238
starling-lm-7b-beta
1172
±7
16,190
Nexusflow
Apache-2.0
229
216◄─►237
Azurephi-3-small-8k-instruct
1172
±6
17,983
Microsoft
MIT
230
217◄─►237
Metallama-2-70b-chat
1171
±5
38,767
Meta
Llama 2 Community
231
217◄─►240
starling-lm-7b-alpha
1168
±8
10,267
UC Berkeley
CC-BY-NC-4.0
232
219◄─►240
Metallama-3.2-3b-instruct
1167
±8
8,043
Meta
Llama 3.2
233
216◄─►243
nous-hermes-2-mixtral-8x7b-dpo
1165
±12
3,792
NousResearch
Apache-2.0
234
224◄─►246
qwq-32b-preview
1159
±11
3,256
Alibaba
Apache 2.0
235
229◄─►246
granite-3.0-2b-instruct
1157
±8
6,922
IBM
Apache 2.0
236
225◄─►250
Nvidiallama2-70b-steerlm-chat
1156
±13
3,605
Nvidia
Llama 2 Community
237
227◄─►251
solar-10.7b-instruct-v1.0
1153
±13
4,187
Upstage AI
CC-BY-NC-4.0
238
227◄─►255
dolphin-2.2.1-mistral-7b
1151
±15
1,685
Cognitive Computations
Apache-2.0
239
233◄─►250
mistral-7b-instruct-v0.2
1150
±7
19,603
Mistral
Apache-2.0
240
231◄─►254
mpt-30b-chat
1150
±12
2,606
MosaicML
CC-BY-NC-SA-4.0
241
233◄─►252
Azurewizardlm-13b
1149
±9
7,122
Microsoft
Llama 2 Community
242
231◄─►258
falcon-180b-chat
1146
±17
1,312
TII
Falcon-180B TII License
243
233◄─►257
qwen1.5-7b-chat
1144
±10
4,782
Alibaba
Qianwen LICENSE
244
234◄─►255
Azurephi-3-mini-4k-instruct-june-2024
1143
±6
12,415
Microsoft
MIT
245
234◄─►255
Metallama-2-13b-chat
1142
±7
19,357
Meta
Llama 2 Community
246
236◄─►256
vicuna-13b
1141
±7
19,539
LMSYS
Llama 2 Community
247
234◄─►258
qwen-14b-chat
1138
±11
5,004
Alibaba
Qianwen LICENSE
248
236◄─►258
Metacodellama-34b-instruct
1136
±9
7,417
Meta
Llama 2 Community
249
236◄─►258
palm-2
1136
±9
8,634
專有
250
236◄─►258
gemma-7b-it
1134
±9
9,034
Gemma license
251
239◄─►259
HuggingFacezephyr-7b-beta
1131
±9
11,220
HuggingFace
MIT
252
240◄─►258
Azurephi-3-mini-128k-instruct
1131
±7
21,024
Microsoft
MIT
253
243◄─►259
Azurephi-3-mini-4k-instruct
1129
±6
20,539
Microsoft
MIT
254
238◄─►263
HuggingFacezephyr-7b-alpha
1128
±16
1,803
HuggingFace
MIT
255
240◄─►263
guanaco-33b
1127
±12
2,955
UW
Non-commercial
256
246◄─►263
stripedhyena-nous-7b
1120
±11
5,214
Together AI
Apache 2.0
257
245◄─►263
HuggingFacesmollm2-1.7b-instruct
1120
±14
2,244
HuggingFace
Apache 2.0
258
241◄─►264
Metacodellama-70b-instruct
1119
±18
1,151
Meta
Llama 2 Community
259
252◄─►263
vicuna-7b
1114
±9
6,972
LMSYS
Llama 2 Community
260
254◄─►263
Metallama-3.2-1b-instruct
1114
±8
8,166
Meta
Llama 3.2
261
254◄─►263
gemma-1.1-2b-it
1114
±8
11,035
Gemma license
262
254◄─►264
mistral-7b-instruct
1110
±9
9,042
Mistral
Apache 2.0
263
254◄─►264
Metallama-2-7b-chat
1108
±7
14,272
Meta
Llama 2 Community
264
264◄─►266
qwen1.5-4b-chat
1091
±9
7,662
Alibaba
Qianwen LICENSE
265
261◄─►268
gemma-2b-it
1090
±12
4,817
Gemma license
266
264◄─►271
olmo-7b-instruct
1074
±11
6,412
Allen AI
Apache-2.0
267
265◄─►271
koala-13b
1069
±10
6,998
UC Berkeley
Non-commercial
268
266◄─►271
alpaca-13b
1065
±12
5,828
Stanford
Non-commercial
269
265◄─►272
gpt4all-13b-snoozy
1064
±15
1,773
Nomic AI
Non-commercial
270
266◄─►272
mpt-7b-chat
1060
±12
3,977
MosaicML
CC-BY-NC-SA-4.0
271
266◄─►272
chatglm3-6b
1056
±12
4,692
Tsinghua
Apache-2.0
272
269◄─►274
RWKVRWKV-4-Raven-14B
1040
±11
4,898
RWKV
Apache 2.0
273
272◄─►274
chatglm2-6b
1025
±14
2,683
Tsinghua
Apache-2.0
274
272◄─►274
oasst-pythia-12b
1021
±11
6,343
OpenAssistant
Apache 2.0
275
275◄─►278
chatglm-6b
994
±13
4,968
Tsinghua
Non-commercial
276
275◄─►278
fastchat-t5-3b
990
±12
4,270
LMSYS
Apache 2.0
277
275◄─►278
dolly-v2-12b
977
±14
3,471
Databricks
MIT
278
275◄─►279
Metallama-13b
968
±16
2,441
Meta
Non-commercial
279
278◄─►279
Stabilitystablelm-tuned-alpha-7b
951
±13
3,325
Stability AI
CC-BY-NC-SA-4.0
說明
排名 (UB):基於 Bradley-Terry 模型計算嘅排名。此排名反映咗模型喺競技場中嘅綜合表現,並提供咗其 Elo 分數嘅 上界 估計,幫助理解模型嘅潛在競爭力。
模型:大型語言模型 (LLM) 嘅名稱。部分模型名稱可能已嵌入相關鏈接。
分數:模型喺競技場中通過用戶投票獲得嘅 Elo 評分。Elo 評分係一種相對排名系統,分數越高表示模型表現越好。
95% 信心區間 (±):模型 Elo 評分嘅95%置信區間(例如:
±6)。呢個區間越細,表示模型嘅評分越穩定同可靠。票數:該模型喺競技場中收到嘅總投票數量。投票數越多,通常意味住其評分嘅統計可靠性越高。
組織/公司:提供該模型嘅組織或公司。
許可證:模型嘅許可協議類型,例如專有 (Proprietary)、Apache 2.0、MIT 等。
數據來源與更新頻率
本排行榜數據由自動化腳本直接從 1 2 官方網站獲取。此排行榜由 GitHub Actions 每日自動更新。
免責聲明
本報告僅供參考。排行榜數據係動態變化嘅,並基於特定時間段內用戶喺 Chatbot Arena 上嘅偏好投票。數據嘅完整性同準確性取決於上游數據源。唔同模型可能採用唔同嘅許可協議,使用時請務必參考模型提供商嘅官方說明。
Last updated
Was this helpful?