Κατάταξη μοντέλων

Αυτός είναι ένας πίνακας κατάταξης βασισμένος σε δεδομένα από το Chatbot Arena (lmarena.ai), δημιουργημένος μέσω αυτοματοποιημένης διαδικασίας.

Χρονική στιγμή ενημέρωσης δεδομένων: 2025-11-14 08:07:48 UTC / 2025-11-14 16:07:48 CST (Ώρα Πεκίνου)

Πίνακας Κατάταξης

Κατάταξη (UB)
Μοντέλο
Βαθμολογία
Διάστημα εμπιστοσύνης 95% (±)
Ψήφοι
Οργάνωση/Εταιρεία
Άδεια

1

gemini-2.5-pro 1

1452

±4

62,764

Google

Ιδιόκτητο

1

claude-sonnet-4-5-20250929-thinking-32k 1

1449

±6

13,853

Anthropic

Ιδιόκτητο

1

claude-opus-4-1-20250805-thinking-16k 1

1448

±5

29,426

Anthropic

Ιδιόκτητο

1

claude-sonnet-4-5-20250929 1

1444

±7

8,318

Anthropic

Ιδιόκτητο

2

gpt-4.5-preview-2025-02-27 1

1442

±6

14,644

OpenAI

Ιδιόκτητο

2

claude-opus-4-1-20250805 1

1439

±4

41,950

Anthropic

Ιδιόκτητο

4

chatgpt-4o-latest-20250326 1

1438

±4

48,510

OpenAI

Ιδιόκτητο

4

gpt-5-high 1

1436

±5

30,974

OpenAI

Ιδιόκτητο

4

o3-2025-04-16 1

1434

±4

59,391

OpenAI

Ιδιόκτητο

5

qwen3-max-preview 1

1432

±5

25,932

Alibaba

Ιδιόκτητο

7

glm-4.6 1

1428

±6

11,320

Z.ai

MIT

10

gpt-5-chat 1

1424

±5

29,793

OpenAI

Ιδιόκτητο

10

qwen3-max-2025-09-23 1

1423

±6

9,297

Alibaba

Ιδιόκτητο

11

claude-opus-4-20250514-thinking-16k 1

1423

±4

37,961

Anthropic

Ιδιόκτητο

8

kimi-k2-thinking 1

1422

±11

3,068

Moonshot

Modified MIT

8

ernie-5.0-preview-1022 1

1421Προκαταρκτικό

±11

2,972

Baidu

Ιδιόκτητο

11

deepseek-v3.2-exp-thinking 1

1421

±7

9,254

DeepSeek AI

MIT

11

qwen3-235b-a22b-instruct-2507 1

1420

±4

37,318

Alibaba

Apache 2.0

11

grok-4-fast 1

1420

±8

7,081

xAI

Ιδιόκτητο

11

deepseek-r1-0528 1

1417

±6

19,260

DeepSeek

MIT

11

kimi-k2-0905-preview 1

1416

±7

10,681

Moonshot

Modified MIT

11

deepseek-v3.1 1

1416

±6

15,282

DeepSeek

MIT

11

deepseek-v3.1-thinking 1

1416

±7

12,013

DeepSeek

MIT

12

kimi-k2-0711-preview 1

1415

±5

28,236

Moonshot

Modified MIT

12

qwen3-vl-235b-a22b-instruct 1

1415

±7

8,576

Alibaba

Apache 2.0

11

deepseek-v3.1-terminus 1

1415

±10

3,760

DeepSeek AI

MIT

11

deepseek-v3.1-terminus-thinking 1

1414

±10

3,532

DeepSeek AI

MIT

13

deepseek-v3.2-exp 1

1413

±6

11,091

DeepSeek AI

MIT

15

gpt-4.1-2025-04-14 1

1412

±4

50,257

OpenAI

Ιδιόκτητο

15

claude-opus-4-20250514 1

1412

±4

45,766

Anthropic

Ιδιόκτητο

16

mistral-medium-2508 1

1411

±5

31,642

Mistral

Ιδιόκτητο

17

grok-3-preview-02-24 1

1410

±4

34,170

xAI

Ιδιόκτητο

17

grok-4-0709 1

1409

±4

36,897

xAI

Ιδιόκτητο

17

glm-4.5 1

1408

±5

24,897

Z.ai

MIT

18

gemini-2.5-flash 1

1408

±4

61,994

Google

Ιδιόκτητο

20

gemini-2.5-flash-preview-09-2025 1

1405

±6

14,987

Google

Ιδιόκτητο

25

grok-4-fast-reasoning 1

1403

±6

13,001

xAI

Ιδιόκτητο

25

claude-haiku-4-5-20251001 1

1402

±6

11,357

Anthropic

Ιδιόκτητο

28

qwen3-next-80b-a3b-instruct 1

1402

±5

20,854

Alibaba

Apache 2.0

33

o1-2024-12-17 1

1400

±4

28,039

OpenAI

Ιδιόκτητο

35

claude-sonnet-4-20250514-thinking-32k 1

1399

±4

36,299

Anthropic

Ιδιόκτητο

31

longcat-flash-chat 1

1399

±6

11,543

Meituan

MIT

36

qwen3-235b-a22b-no-thinking 1

1399

±5

39,447

Alibaba

Apache 2.0

35

qwen3-235b-a22b-thinking-2507 1

1397

±6

9,364

Alibaba

Apache 2.0

36

deepseek-r1 1

1395

±5

18,718

DeepSeek

MIT

36

qwen3-vl-235b-a22b-thinking 1

1393

±7

8,017

Alibaba

Apache 2.0

39

gpt-5-mini-high 1

1392

±5

25,436

OpenAI

Ιδιόκτητο

41

deepseek-v3-0324 1

1391

±4

46,874

DeepSeek

MIT

41

o4-mini-2025-04-16 1

1391

±4

46,940

OpenAI

Ιδιόκτητο

41

mai-1-preview 1

1390

±5

18,232

Microsoft AI

Ιδιόκτητο

43

claude-sonnet-4-20250514 1

1389

±4

41,727

Anthropic

Ιδιόκτητο

44

o1-preview 1

1387

±5

31,505

OpenAI

Ιδιόκτητο

45

claude-3-7-sonnet-20250219-thinking-32k 1

1386

±4

39,960

Anthropic

Ιδιόκτητο

46

qwen3-coder-480b-a35b-instruct 1

1385

±5

23,216

Alibaba

Apache 2.0

43

hunyuan-t1-20250711 1

1385

±9

4,830

Tencent

Ιδιόκτητο

48

mistral-medium-2505 1

1383

±5

34,543

Mistral

Ιδιόκτητο

48

qwen3-30b-a3b-instruct-2507 1

1382

±5

24,249

Alibaba

Apache 2.0

50

gemini-2.5-flash-lite-preview-09-2025-no-thinking 1

1380

±5

14,912

Google

Ιδιόκτητο

52

gpt-4.1-mini-2025-04-14 1

1380

±4

40,538

OpenAI

Ιδιόκτητο

50

hunyuan-turbos-20250416 1

1380

±6

11,144

Tencent

Ιδιόκτητο

55

gemini-2.5-flash-lite-preview-06-17-thinking 1

1375

±5

34,062

Google

Ιδιόκτητο

55

qwen3-235b-a22b 1

1373

±5

27,194

Alibaba

Apache 2.0

57

qwen2.5-max 1

1372

±4

33,563

Alibaba

Ιδιόκτητο

60

Claude 3.5 Sonnet (10/22) 1

1371

±3

89,879

Anthropic

Ιδιόκτητο

60

glm-4.5-air 1

1370

±4

29,531

Z.ai

MIT

61

qwen3-next-80b-a3b-thinking 1

1367

±6

13,880

Alibaba

Apache 2.0

62

minimax-m1 1

1366

±4

36,957

MiniMax

Apache 2.0

65

gemma-3-27b-it 1

1364

±4

49,410

Google

Gemma

65

grok-3-mini-high 1

1362

±5

17,612

xAI

Ιδιόκτητο

65

o3-mini-high 1

1362

±5

18,735

OpenAI

Ιδιόκτητο

67

deepseek-v3 1

1357

±5

21,994

DeepSeek

DeepSeek

66

grok-3-mini-beta 1

1357

±5

23,839

xAI

Ιδιόκτητο

62

amazon-nova-experimental-chat-10-20 1

1355Προκαταρκτικό

±15

1,622

Amazon

Ιδιόκτητο

69

mistral-small-2506 1

1354

±5

18,370

Mistral

Apache 2.0

71

gemini-2.0-flash-lite-preview-02-05 1

1352

±4

25,215

Google

Ιδιόκτητο

71

gpt-oss-120b 1

1352

±5

29,046

OpenAI

Apache 2.0

69

glm-4.5v 1

1352

±8

4,993

Z.ai

MIT

71

Gemini-1.5-Pro-002 1

1351

±3

56,012

Google

Ιδιόκτητο

71

command-a-03-2025 1

1351

±4

55,573

Cohere

CC-BY-NC-4.0

73

o3-mini 1

1347

±3

58,866

OpenAI

Ιδιόκτητο

69

hunyuan-turbos-20250226 1

1346

±12

2,250

Tencent

Ιδιόκτητο

71

ling-flash-2.0 1

1345

±7

7,187

Ant Group

MIT

71

llama-3.1-nemotron-ultra-253b-v1 1

1345

±12

2,573

Nvidia

Nvidia Open Model

72

step-3 1

1345

±7

6,662

StepFun

Apache 2.0

76

gpt-4o-2024-05-13 1

1345

±3

113,568

OpenAI

Ιδιόκτητο

71

minimax-m2 1

1344

±9

5,402

MiniMax

Apache 2.0

71

amazon-nova-experimental-chat-10-09 1

1344

±11

2,900

Amazon

Ιδιόκτητο

71

qwen3-32b 1

1344

±9

3,943

Alibaba

Apache 2.0

72

qwen-plus-0125 1

1344

±8

5,861

Alibaba

Ιδιόκτητο

73

glm-4-plus-0111 1

1343

±8

5,806

Zhipu

Ιδιόκτητο

78

Claude 3.5 Sonnet (06/20) 1

1342

±3

82,864

Anthropic

Ιδιόκτητο

73

gemma-3-12b-it 1

1340

±9

3,866

Google

Gemma

73

nvidia-llama-3.3-nemotron-super-49b-v1.5 1

1339

±10

3,499

Nvidia

Nvidia Open

78

gpt-5-nano-high 1

1339

±7

8,413

OpenAI

Ιδιόκτητο

73

hunyuan-turbo-0110 1

1338

±11

2,322

Tencent

Ιδιόκτητο

82

llama-3.1-405b-instruct-bf16 1

1335

±4

41,932

Meta

Llama 3.1 Community

83

o1-mini 1

1335

±3

52,301

OpenAI

Ιδιόκτητο

83

GPT-4o (08/06) 1

1334

±4

45,787

OpenAI

Ιδιόκτητο

85

grok-2-2024-08-13 1

1333

±4

63,725

xAI

Ιδιόκτητο

85

llama-3.1-405b-instruct-fp8 1

1333

±3

60,272

Meta

Llama 3.1 Community

83

gemini-advanced-0514 1

1333

±5

50,654

Google

Ιδιόκτητο

84

qwq-32b 1

1333

±4

26,298

Alibaba

Apache 2.0

81

step-2-16k-exp-202412 1

1332

±8

4,895

StepFun

Ιδιόκτητο

92

yi-lightning 1

1328

±5

27,624

01 AI

Ιδιόκτητο

94

llama-4-maverick-17b-128e-instruct 1

1327

±4

41,266

Meta

Llama 4

96

qwen3-30b-a3b 1

1326

±5

27,522

Alibaba

Apache 2.0

85

llama-3.3-nemotron-49b-super-v1 1

1325

±12

2,243

Nvidia

Nvidia

90

hunyuan-large-2025-02-10 1

1324

±10

3,760

Tencent

Ιδιόκτητο

102

gpt-4-turbo-2024-04-09 1

1324

±4

98,965

OpenAI

Ιδιόκτητο

102

llama-4-scout-17b-16e-instruct 1

1322

±5

31,269

Meta

Llama

103

claude-3-opus-20240229 1

1322

±3

196,368

Anthropic

Ιδιόκτητο

103

claude-3-5-haiku-20241022 1

1322

±3

71,453

Anthropic

Ιδιόκτητο

99

deepseek-v2.5-1210 1

1322

±8

6,877

DeepSeek

DeepSeek

103

gemini-1.5-pro-001 1

1321

±4

79,769

Google

Ιδιόκτητο

102

gpt-4.1-nano-2025-04-14 1

1320

±8

6,143

OpenAI

Ιδιόκτητο

102

ring-flash-2.0 1

1320

±7

7,310

Ant Group

MIT

103

step-1o-turbo-202506 1

1319

±7

9,676

StepFun

Ιδιόκτητο

106

llama-3.3-70b-instruct 1

1319

±3

56,037

Meta

Llama-3.3

104

gemma-3n-e4b-it 1

1318

±5

23,509

Google

Gemma

106

glm-4-plus 1

1318

±5

26,342

Zhipu AI

Ιδιόκτητο

103

gpt-oss-20b 1

1318

±6

10,872

OpenAI

Apache 2.0

106

qwen-max-0919 1

1317

±6

16,598

Alibaba

Qwen

108

GPT-4o-mini (07/18) 1

1316

±3

69,291

OpenAI

Ιδιόκτητο

107

qwen2.5-plus-1127 1

1314

±6

10,252

Alibaba

Ιδιόκτητο

112

gpt-4-1106-preview 1

1313

±4

101,117

OpenAI

Ιδιόκτητο

112

gpt-4-0125-preview 1

1313

±4

94,534

OpenAI

Ιδιόκτητο

112

mistral-large-2407 1

1313

±4

45,968

Mistral

Mistral Research

112

athene-v2-chat 1

1313

±4

24,880

NexusFlow

NexusFlow

114

Gemini-1.5-Flash-002 1

1310

±4

35,180

Google

Ιδιόκτητο

108

hunyuan-standard-2025-02-10 1

1310

±10

3,920

Tencent

Ιδιόκτητο

124

grok-2-mini-2024-08-13 1

1306

±4

52,789

xAI

Ιδιόκτητο

124

deepseek-v2.5 1

1306

±5

24,839

DeepSeek

DeepSeek

124

magistral-medium-2506 1

1304

±6

12,012

Mistral

Ιδιόκτητο

124

athene-70b-0725 1

1304

±6

19,796

NexusFlow

CC-BY-NC-4.0

127

mistral-large-2411 1

1304

±4

28,455

Mistral

MRL

128

mistral-small-3.1-24b-instruct-2503 1

1303

±5

34,211

Mistral

Apache 2.0

122

gemma-3-4b-it 1

1302

±9

4,195

Google

Gemma

130

qwen2.5-72b-instruct 1

1301

±4

39,632

Alibaba

Qwen

130

llama-3.1-nemotron-70b-instruct 1

1297

±8

7,216

Nvidia

Llama 3.1

130

hunyuan-large-vision 1

1294

±9

5,603

Tencent

Ιδιόκτητο

138

Meta-Llama-3.1-70B-Instruct 1

1293

±4

56,003

Meta

Llama 3.1 Community

138

jamba-1.5-large 1

1288

±7

8,730

AI21 Labs

Jamba Open

139

amazon-nova-pro-v1.0 1

1288

±4

25,218

Amazon

Ιδιόκτητο

138

reka-core-20240904 1

1287

±7

7,380

Reka AI

Ιδιόκτητο

139

gemma-2-27b-it 1

1287

±3

76,195

Google

Gemma license

139

gpt-4-0314 1

1286

±5

54,754

OpenAI

Ιδιόκτητο

138

llama-3.1-nemotron-51b-instruct 1

1286

±10

3,777

Nvidia

Llama 3.1

138

llama-3.1-tulu-3-70b 1

1286

±10

2,881

Ai2

Llama 3.1

141

gemini-1.5-flash-001 1

1284

±4

63,418

Google

Ιδιόκτητο

141

claude-3-sonnet-20240229 1

1281

±4

110,173

Anthropic

Ιδιόκτητο

141

gemma-2-9b-it-simpo 1

1278

±7

10,108

Princeton

MIT

144

nemotron-4-340b-instruct 1

1278

±5

19,913

Nvidia

NVIDIA Open Model

142

command-r-plus-08-2024 1

1277

±6

9,931

Cohere

CC-BY-NC-4.0

148

llama-3-70b-instruct 1

1276

±3

158,908

Meta

Llama 3 Community

148

gpt-4-0613 1

1275

±4

89,612

OpenAI

Ιδιόκτητο

146

glm-4-0520 1

1273

±7

9,857

Zhipu AI

Ιδιόκτητο

148

mistral-small-24b-instruct-2501 1

1273

±6

14,830

Mistral

Apache 2.0

148

reka-flash-20240904 1

1272

±7

7,583

Reka AI

Ιδιόκτητο

149

qwen2.5-coder-32b-instruct 1

1269

±8

5,452

Alibaba

Apache 2.0

155

c4ai-aya-expanse-32b 1

1266

±5

27,362

Cohere

CC-BY-NC-4.0

156

gemma-2-9b-it 1

1264

±4

54,954

Google

Gemma license

156

deepseek-coder-v2 1

1263

±6

15,242

DeepSeek AI

DeepSeek License

156

command-r-plus 1

1263

±4

78,401

Cohere

CC-BY-NC-4.0

157

qwen2-72b-instruct 1

1262

±5

37,688

Alibaba

Qianwen LICENSE

159

claude-3-haiku-20240307 1

1261

±4

118,626

Anthropic

Ιδιόκτητο

159

amazon-nova-lite-v1.0 1

1259

±5

19,760

Amazon

Ιδιόκτητο

159

gemini-1.5-flash-8b-001 1

1259

±4

35,914

Google

Ιδιόκτητο

162

phi-4 1

1255

±4

24,354

Microsoft

MIT

159

olmo-2-0325-32b-instruct 1

1252

±11

3,377

Allen AI

Apache-2.0

163

command-r-08-2024 1

1251

±7

10,229

Cohere

CC-BY-NC-4.0

169

mistral-large-2402 1

1242

±5

63,404

Mistral

Ιδιόκτητο

169

amazon-nova-micro-v1.0 1

1241

±5

19,774

Amazon

Ιδιόκτητο

169

jamba-1.5-mini 1

1238

±7

8,918

AI21 Labs

Jamba Open

169

ministral-8b-2410 1

1236

±9

4,833

Mistral

MRL

171

qwen1.5-110b-chat 1

1235

±5

26,679

Alibaba

Qianwen LICENSE

171

gemini-pro-dev-api 1

1234

±7

18,454

Google

Ιδιόκτητο

171

qwen1.5-72b-chat 1

1234

±5

39,689

Alibaba

Qianwen LICENSE

171

reka-flash-21b-20240226-online 1

1234

±7

15,606

Reka AI

Ιδιόκτητο

170

hunyuan-standard-256k 1

1233

±12

2,761

Tencent

Ιδιόκτητο

173

mixtral-8x22b-instruct-v0.1 1

1230

±4

52,214

Mistral

Apache 2.0

173

command-r 1

1228

±5

54,710

Cohere

CC-BY-NC-4.0

173

reka-flash-21b-20240226 1

1227

±6

25,026

Reka AI

Ιδιόκτητο

175

gpt-3.5-turbo-0125 1

1224

±5

67,214

OpenAI

Ιδιόκτητο

174

mistral-medium 1

1224

±5

34,893

Mistral

Ιδιόκτητο

177

llama-3-8b-instruct 1

1223

±4

106,055

Meta

Llama 3 Community

174

c4ai-aya-expanse-8b 1

1223

±7

9,922

Cohere

CC-BY-NC-4.0

173

llama-3.1-tulu-3-8b 1

1222

±11

2,943

Ai2

Llama 3.1

173

gemini-pro 1

1221

±12

6,418

Google

Ιδιόκτητο

180

zephyr-orpo-141b-A35b-v0.1 1

1214

±11

4,712

HuggingFace

Apache 2.0

185

yi-1.5-34b-chat 1

1214

±5

24,417

01 AI

Apache-2.0

187

llama-3.1-8b-instruct 1

1211

±4

50,234

Meta

Llama 3.1 Community

183

granite-3.1-8b-instruct 1

1210

±11

3,142

IBM

Apache 2.0

187

qwen1.5-32b-chat 1

1206

±6

22,068

Alibaba

Qianwen LICENSE

188

gpt-3.5-turbo-1106 1

1202

±9

16,760

OpenAI

Ιδιόκτητο

191

phi-3-medium-4k-instruct 1

1199

±5

25,301

Microsoft

MIT

192

mixtral-8x7b-instruct-v0.1 1

1198

±4

74,303

Mistral

Apache 2.0

192

gemma-2-2b-it 1

1198

±4

46,901

Google

Gemma license

192

dbrx-instruct-preview 1

1196

±6

32,760

Databricks

DBRX LICENSE

192

qwen1.5-14b-chat 1

1193

±7

18,066

Alibaba

Qianwen LICENSE

193

internlm2_5-20b-chat 1

1192

±7

10,038

InternLM

Άλλο

194

wizardlm-70b 1

1185

±9

8,270

Microsoft

Llama 2 Community

194

deepseek-llm-67b-chat 1

1184

±11

4,950

DeepSeek AI

DeepSeek License

198

yi-34b-chat 1

1184

±7

15,624

01 AI

Yi License

198

granite-3.0-8b-instruct 1

1183

±9

6,727

IBM

Apache 2.0

198

openchat-3.5-0106 1

1183

±8

12,712

OpenChat

Apache-2.0

198

openchat-3.5 1

1182

±10

8,009

OpenChat

Apache-2.0

198

granite-3.1-2b-instruct 1

1181

±11

3,235

IBM

Apache 2.0

199

snowflake-arctic-instruct 1

1180

±6

33,272

Snowflake

Apache 2.0

199

tulu-2-dpo-70b 1

1179

±10

6,579

AllenAI/UW

AI2 ImpACT Low-risk

200

gemma-1.1-7b-it 1

1179

±6

24,327

Google

Gemma license

199

openhermes-2.5-mistral-7b 1

1176

±10

5,026

NousResearch

Apache-2.0

201

vicuna-33b 1

1174

±6

22,613

LMSYS

Μη εμπορική

201

starling-lm-7b-beta 1

1173

±7

16,190

Nexusflow

Apache-2.0

201

phi-3-small-8k-instruct 1

1172

±6

17,983

Microsoft

MIT

202

llama-2-70b-chat 1

1172

±5

38,767

Meta

Llama 2 Community

202

starling-lm-7b-alpha 1

1169

±8

10,267

UC Berkeley

CC-BY-NC-4.0

206

llama-3.2-3b-instruct 1

1167

±8

8,043

Meta

Llama 3.2

201

nous-hermes-2-mixtral-8x7b-dpo 1

1166

±12

3,792

NousResearch

Apache-2.0

209

qwq-32b-preview 1

1160

±11

3,256

Alibaba

Apache 2.0

209

llama2-70b-steerlm-chat 1

1157

±13

3,605

Nvidia

Llama 2 Community

216

granite-3.0-2b-instruct 1

1157

±8

6,922

IBM

Apache 2.0

212

solar-10.7b-instruct-v1.0 1

1154

±13

4,187

Upstage AI

CC-BY-NC-4.0

211

dolphin-2.2.1-mistral-7b 1

1152

±15

1,685

Cognitive Computations

Apache-2.0

218

mistral-7b-instruct-v0.2 1

1151

±7

19,603

Mistral

Apache-2.0

216

mpt-30b-chat 1

1151

±12

2,606

MosaicML

CC-BY-NC-SA-4.0

217

wizardlm-13b 1

1150

±9

7,122

Microsoft

Llama 2 Community

216

falcon-180b-chat 1

1147

±17

1,312

TII

Falcon-180B TII License

219

qwen1.5-7b-chat 1

1144

±10

4,782

Alibaba

Qianwen LICENSE

219

phi-3-mini-4k-instruct-june-2024 1

1143

±6

12,415

Microsoft

MIT

219

llama-2-13b-chat 1

1143

±7

19,357

Meta

Llama 2 Community

219

vicuna-13b 1

1142

±7

19,539

LMSYS

Llama 2 Community

219

qwen-14b-chat 1

1139

±11

5,004

Alibaba

Qianwen LICENSE

221

codellama-34b-instruct 1

1137

±9

7,417

Meta

Llama 2 Community

221

palm-2 1

1137

±9

8,634

Google

Ιδιόκτητο

223

gemma-7b-it 1

1135

±9

9,034

Google

Gemma license

225

zephyr-7b-beta 1

1132

±9

11,220

HuggingFace

MIT

226

phi-3-mini-128k-instruct 1

1131

±7

21,024

Microsoft

MIT

229

phi-3-mini-4k-instruct 1

1129

±6

20,539

Microsoft

MIT

223

zephyr-7b-alpha 1

1129

±16

1,803

HuggingFace

MIT

225

guanaco-33b 1

1128

±12

2,955

UW

Μη εμπορική

231

stripedhyena-nous-7b 1

1121

±11

5,214

Together AI

Apache 2.0

226

codellama-70b-instruct 1

1119

±18

1,151

Meta

Llama 2 Community

231

smollm2-1.7b-instruct 1

1118

±14

2,244

HuggingFace

Apache 2.0

236

vicuna-7b 1

1115

±9

6,972

LMSYS

Llama 2 Community

239

gemma-1.1-2b-it 1

1113

±8

11,035

Google

Gemma license

239

llama-3.2-1b-instruct 1

1113

±8

8,166

Meta

Llama 3.2

239

mistral-7b-instruct 1

1111

±9

9,042

Mistral

Apache 2.0

240

llama-2-7b-chat 1

1109

±7

14,272

Meta

Llama 2 Community

249

qwen1.5-4b-chat 1

1091

±9

7,662

Alibaba

Qianwen LICENSE

246

gemma-2b-it 1

1091

±12

4,817

Google

Gemma license

249

olmo-7b-instruct 1

1075

±11

6,412

Allen AI

Apache-2.0

250

koala-13b 1

1070

±10

6,998

UC Berkeley

Μη εμπορική

251

alpaca-13b 1

1066

±11

5,828

Stanford

Μη εμπορική

250

gpt4all-13b-snoozy 1

1065

±15

1,773

Nomic AI

Μη εμπορική

251

mpt-7b-chat 1

1061

±12

3,977

MosaicML

CC-BY-NC-SA-4.0

251

chatglm3-6b 1

1057

±12

4,692

Tsinghua

Apache-2.0

254

RWKV-4-Raven-14B 1

1042

±11

4,898

RWKV

Apache 2.0

257

chatglm2-6b 1

1026

±14

2,683

Tsinghua

Apache-2.0

257

oasst-pythia-12b 1

1022

±11

6,343

OpenAssistant

Apache 2.0

260

chatglm-6b 1

996

±13

4,968

Tsinghua

Μη εμπορική

260

fastchat-t5-3b 1

991

±12

4,270

LMSYS

Apache 2.0

260

dolly-v2-12b 1

978

±14

3,471

Databricks

MIT

260

llama-13b 1

970

±16

2,441

Meta

Μη εμπορική

262

stablelm-tuned-alpha-7b 1

952

±13

3,325

Stability AI

CC-BY-NC-SA-4.0

Επεξήγηση

  • Κατάταξη (UB): Βασισμένη σε υπολογισμούς του μοντέλου Bradley-Terry. Η κατάταξη αυτή αντικατοπτρίζει τη συνολική επίδοση του μοντέλου στο Arena και παρέχει μια εκτίμηση του άνω ορίου της βαθμολογίας Elo του, βοηθώντας στην κατανόηση της δυνητικής ανταγωνιστικότητας του μοντέλου.

  • Μοντέλο: Το όνομα του μεγάλου γλωσσικού μοντέλου (LLM). Τα ονόματα ορισμένων μοντέλων ενδέχεται να περιέχουν σχετικούς συνδέσμους.

  • Βαθμολογία: Η βαθμολογία Elo του μοντέλου στο Arena, που λαμβάνεται μέσω ψήφων χρηστών. Η βαθμολογία Elo είναι ένα σχετικό σύστημα κατάταξης, όπου υψηλότερη βαθμολογία υποδηλώνει καλύτερη επίδοση.

  • Διάστημα εμπιστοσύνης 95% (±): Το 95% διάστημα εμπιστοσύνης της βαθμολογίας Elo του μοντέλου (π.χ.: ±6). Όσο μικρότερο είναι το διάστημα, τόσο πιο σταθερή και αξιόπιστη είναι η βαθμολογία του μοντέλου.

  • Ψήφοι: Ο συνολικός αριθμός ψήφων που έλαβε το μοντέλο στο Arena. Όσο περισσότερες οι ψήφοι, τόσο μεγαλύτερη η στατιστική αξιοπιστία της βαθμολογίας.

  • Οργάνωση/Εταιρεία: Η οργάνωση ή εταιρεία που παρέχει το μοντέλο.

  • Άδεια: Ο τύπος της άδειας χρήσης του μοντέλου, π.χ. ιδιόκτητο (Proprietary), Apache 2.0, MIT κ.λπ.

Πηγές Δεδομένων & Συχνότητα Ενημέρωσης

Τα δεδομένα αυτού του πίνακα κατάταξης λαμβάνονται αυτοματοποιημένα από το επίσημο ιστοσελίδα 1 2. Αυτός ο πίνακας ενημερώνεται αυτόματα καθημερινά από το GitHub Actions.

Αποποίηση Ευθυνών

Αυτή η αναφορά παρέχεται για ενημερωτικούς σκοπούς μόνο. Τα δεδομένα του πίνακα κατάταξης είναι δυναμικά μεταβαλλόμενα και βασίζονται σε ψήφους προτιμήσεων χρηστών στο Chatbot Arena κατά συγκεκριμένη χρονική περίοδο. Η πληρότητα και η ακρίβεια των δεδομένων εξαρτάται από την πηγή των αρχικών δεδομένων. Διαφορετικά μοντέλα ενδέχεται να χρησιμοποιούν διαφορετικές άδειες χρήσης· κατά τη χρήση, παρακαλούμε να αναφέρεστε πάντα στις επίσημες οδηγίες του παρόχου του μοντέλου.

Last updated

Was this helpful?