Ranking de modelos

Este es un ranking basado en los datos de Chatbot Arena (lmarena.ai), generado mediante un proceso automatizado.

Hora de actualización de los datos: 2025-10-18 08:07:11 UTC / 2025-10-18 16:07:11 CST (hora de Beijing)

Tabla de clasificación

Clasificación (UB)
Modelo
Puntuación
Intervalo de confianza del 95% (±)
Votos
Organización/Empresa
Licencia

1

gemini-2.5-pro 1

1451

±4

54,087

Google

Propietaria

1

claude-opus-4-1-20250805-thinking-16k 1

1447

±5

21,306

Anthropic

Propietaria

1

claude-sonnet-4-5-20250929-thinking-32k 1

1445

±8

6,287

Anthropic

Propietaria

1

gpt-4.5-preview-2025-02-27 1

1441

±6

14,644

OpenAI

Propietaria

2

chatgpt-4o-latest-20250326 1

1440

±4

40,013

OpenAI

Propietaria

2

o3-2025-04-16 1

1440

±4

51,293

OpenAI

Propietaria

2

claude-sonnet-4-5-20250929 1

1438

±8

6,144

Anthropic

Propietaria

2

gpt-5-high 1

1437

±5

23,580

OpenAI

Propietaria

2

claude-opus-4-1-20250805 1

1437

±5

33,298

Anthropic

Propietaria

3

qwen3-max-preview 1

1434

±6

18,078

Alibaba

Propietaria

10

gpt-5-chat 1

1425

±5

21,630

OpenAI

Propietaria

10

qwen3-max-2025-09-23 1

1423

±7

6,919

Alibaba

Propietaria

10

glm-4.6 1

1422

±9

4,401

Z.ai

MIT

11

grok-4-fast 1

1420

±8

7,104

xAI

Propietaria

11

claude-opus-4-20250514-thinking-16k 1

1419

±5

35,522

Anthropic

Propietaria

11

deepseek-v3.2-exp-thinking 1

1419

±9

4,320

DeepSeek AI

MIT

11

qwen3-vl-235b-a22b-instruct 1

1418

±8

6,312

Alibaba

Apache 2.0

11

qwen3-235b-a22b-instruct-2507 1

1418

±5

29,343

Alibaba

Apache 2.0

11

deepseek-r1-0528 1

1417

±6

19,284

DeepSeek

MIT

11

kimi-k2-0905-preview 1

1417

±7

10,772

Moonshot

MIT Modificada

11

deepseek-v3.1 1

1416

±6

15,380

DeepSeek

MIT

11

deepseek-v3.1-thinking 1

1415

±7

12,098

DeepSeek

MIT

11

kimi-k2-0711-preview 1

1415

±5

28,321

Moonshot

MIT Modificada

11

deepseek-v3.1-terminus 1

1414

±10

3,775

DeepSeek AI

MIT

11

deepseek-v3.1-terminus-thinking 1

1413

±10

3,541

DeepSeek AI

MIT

12

grok-4-0709 1

1413

±5

29,264

xAI

Propietaria

12

claude-opus-4-20250514 1

1411

±4

43,310

Anthropic

Propietaria

12

deepseek-v3.2-exp 1

1408

±9

4,684

DeepSeek AI

MIT

13

gpt-4.1-2025-04-14 1

1411

±4

41,918

OpenAI

Propietaria

14

grok-3-preview-02-24 1

1409

±4

34,154

xAI

Propietaria

18

mistral-medium-2508 1

1406

±5

23,844

Mistral

Propietaria

18

glm-4.5 1

1406

±5

22,612

Z.ai

MIT

18

gemini-2.5-flash-preview-09-2025 1

1404

±7

6,730

Google

Propietaria

23

claude-haiku-4-5-20251001 1

1397

±12

2,380

Anthropic

Propietaria

24

qwen3-next-80b-a3b-instruct 1

1402

±6

12,793

Alibaba

Apache 2.0

29

o1-2024-12-17 1

1400

±4

28,039

OpenAI

Propietaria

29

longcat-flash-chat 1

1398

±6

11,667

Meituan

MIT

29

qwen3-235b-a22b-thinking-2507 1

1397

±6

9,386

Alibaba

Apache 2.0

30

claude-sonnet-4-20250514-thinking-32k 1

1398

±5

33,827

Anthropic

Propietaria

30

qwen3-235b-a22b-no-thinking 1

1398

±5

39,528

Alibaba

Apache 2.0

32

gpt-5-mini-high 1

1395

±6

18,172

OpenAI

Propietaria

32

deepseek-r1 1

1394

±5

18,718

DeepSeek

MIT

32

qwen3-vl-235b-a22b-thinking 1

1392

±8

5,956

Alibaba

Apache 2.0

36

deepseek-v3-0324 1

1391

±4

44,482

DeepSeek

MIT

36

o4-mini-2025-04-16 1

1391

±4

41,513

OpenAI

Propietaria

36

mai-1-preview 1

1389

±6

14,528

Microsoft AI

Propietaria

38

claude-sonnet-4-20250514 1

1389

±5

39,329

Anthropic

Propietaria

38

hunyuan-t1-20250711 1

1384

±9

4,845

Tencent

Propietaria

39

o1-preview 1

1386

±5

31,505

OpenAI

Propietaria

39

qwen3-30b-a3b-instruct-2507 1

1385

±5

21,853

Alibaba

Apache 2.0

40

claude-3-7-sonnet-20250219-thinking-32k 1

1386

±4

39,987

Anthropic

Propietaria

41

qwen3-coder-480b-a35b-instruct 1

1384

±5

23,287

Alibaba

Apache 2.0

44

mistral-medium-2505 1

1381

±5

34,539

Mistral

Propietaria

44

hunyuan-turbos-20250416 1

1379

±6

11,135

Tencent

Propietaria

47

gpt-4.1-mini-2025-04-14 1

1379

±4

40,621

OpenAI

Propietaria

50

gemini-2.5-flash-lite-preview-09-2025-no-thinking 1

1374

±7

6,765

Google

Propietaria

52

gemini-2.5-flash-lite-preview-06-17-thinking 1

1374

±5

31,701

Google

Propietaria

52

qwen3-235b-a22b 1

1372

±5

27,210

Alibaba

Apache 2.0

54

qwen2.5-max 1

1372

±4

33,541

Alibaba

Propietaria

54

glm-4.5-air 1

1369

±5

21,945

Z.ai

MIT

55

claude-3-5-sonnet-20241022 1

1370

±3

89,889

Anthropic

Propietaria

55

claude-3-7-sonnet-20250219 1

1370

±4

44,619

Anthropic

Propietaria

55

qwen3-next-80b-a3b-thinking 1

1367

±6

11,522

Alibaba

Apache 2.0

56

minimax-m1 1

1368

±5

31,897

MiniMax

Apache 2.0

59

grok-3-mini-high 1

1362

±5

17,615

xAI

Propietaria

59

o3-mini-high 1

1362

±5

18,735

OpenAI

Propietaria

60

gemma-3-27b-it 1

1363

±4

44,508

Google

Gemma

64

gemini-2.0-flash-001 1

1360

±4

45,135

Google

Propietaria

64

grok-3-mini-beta 1

1356

±5

23,839

xAI

Propietaria

64

deepseek-v3 1

1356

±5

21,994

DeepSeek

DeepSeek

65

glm-4.5v 1

1351

±8

5,028

Z.ai

MIT

66

mistral-small-2506 1

1353

±5

18,374

Mistral

Apache 2.0

68

hunyuan-turbos-20250226 1

1345

±12

2,250

Tencent

Propietaria

68

llama-3.1-nemotron-ultra-253b-v1 1

1344

±12

2,573

Nvidia

Modelo abierto de Nvidia

69

gemini-2.0-flash-lite-preview-02-05 1

1352

±4

25,215

Google

Propietaria

69

gemini-1.5-pro-002 1

1351

±3

56,012

Google

Propietaria

69

command-a-03-2025 1

1349

±4

47,441

Cohere

CC-BY-NC-4.0

69

gpt-oss-120b 1

1348

±5

21,119

OpenAI

Apache 2.0

69

amazon-nova-experimental-chat-10-09 1

1344Preliminar

±11

2,911

Amazon

Propietaria

69

qwen3-32b 1

1344

±9

3,943

Alibaba

Apache 2.0

70

qwen-plus-0125 1

1343

±8

5,861

Alibaba

Propietaria

71

o3-mini 1

1347

±3

58,935

OpenAI

Propietaria

71

step-3 1

1344

±7

6,686

StepFun

Apache 2.0

71

glm-4-plus-0111 1

1343

±8

5,806

Zhipu

Propietaria

71

ling-flash-2.0 1

1341Preliminar

±9

4,893

Ant Group

MIT

71

gemma-3-12b-it 1

1340

±10

3,866

Google

Gemma

71

nvidia-llama-3.3-nemotron-super-49b-v1.5 1

1339

±10

3,488

Nvidia

Nvidia Open

71

hunyuan-turbo-0110 1

1337

±11

2,322

Tencent

Propietaria

74

gpt-4o-2024-05-13 1

1344

±3

113,568

OpenAI

Propietaria

75

claude-3-5-sonnet-20240620 1

1341

±3

82,864

Anthropic

Propietaria

75

gpt-5-nano-high 1

1337

±7

8,465

OpenAI

Propietaria

79

llama-3.1-405b-instruct-bf16 1

1335

±4

41,932

Meta

Comunidad Llama 3.1

79

step-2-16k-exp-202412 1

1331

±8

4,895

StepFun

Propietaria

80

o1-mini 1

1334

±3

52,301

OpenAI

Propietaria

80

gpt-4o-2024-08-06 1

1333

±4

45,787

OpenAI

Propietaria

80

gemini-advanced-0514 1

1332

±5

50,654

Google

Propietaria

80

qwq-32b 1

1332

±4

26,309

Alibaba

Apache 2.0

81

llama-3.1-405b-instruct-fp8 1

1333

±3

60,272

Meta

Comunidad Llama 3.1

81

grok-2-2024-08-13 1

1333

±3

63,725

xAI

Propietaria

81

llama-3.3-nemotron-49b-super-v1 1

1324

±12

2,243

Nvidia

Nvidia

85

hunyuan-large-2025-02-10 1

1323

±10

3,760

Tencent

Propietaria

88

yi-lightning 1

1327

±5

27,624

01 AI

Propietaria

89

llama-4-maverick-17b-128e-instruct 1

1327

±4

41,319

Meta

Llama 4

93

qwen3-30b-a3b 1

1325

±5

27,520

Alibaba

Apache 2.0

95

deepseek-v2.5-1210 1

1321

±8

6,877

DeepSeek

DeepSeek

98

gpt-4-turbo-2024-04-09 1

1323

±4

98,965

OpenAI

Propietaria

98

llama-4-scout-17b-16e-instruct 1

1322

±5

31,329

Meta

Llama

98

gpt-4.1-nano-2025-04-14 1

1319

±8

6,143

OpenAI

Propietaria

99

claude-3-opus-20240229 1

1321

±3

196,368

Anthropic

Propietaria

99

claude-3-5-haiku-20241022 1

1320

±3

71,507

Anthropic

Propietaria

99

gemini-1.5-pro-001 1

1320

±4

79,769

Google

Propietaria

99

step-1o-turbo-202506 1

1319

±7

9,685

StepFun

Propietaria

99

gemma-3n-e4b-it 1

1318

±5

23,541

Google

Gemma

99

gpt-oss-20b 1

1317

±6

10,906

OpenAI

Apache 2.0

99

ring-flash-2.0 1

1314Preliminar

±9

4,971

Ant Group

MIT

102

llama-3.3-70b-instruct 1

1319

±3

56,024

Meta

Llama-3.3

102

glm-4-plus 1

1317

±5

26,342

Zhipu AI

Propietaria

102

qwen-max-0919 1

1316

±6

16,598

Alibaba

Qwen

103

qwen2.5-plus-1127 1

1313

±6

10,252

Alibaba

Propietaria

104

gpt-4o-mini-2024-07-18 1

1315

±3

69,290

OpenAI

Propietaria

104

hunyuan-standard-2025-02-10 1

1309

±10

3,920

Tencent

Propietaria

107

gpt-4-1106-preview 1

1313

±4

101,117

OpenAI

Propietaria

108

gpt-4-0125-preview 1

1313

±4

94,534

OpenAI

Propietaria

108

mistral-large-2407 1

1312

±4

45,968

Mistral

Investigación Mistral

108

athene-v2-chat 1

1312

±4

24,880

NexusFlow

NexusFlow

109

gemini-1.5-flash-002 1

1310

±4

35,180

Google

Propietaria

116

gemma-3-4b-it 1

1302

±9

4,195

Google

Gemma

119

magistral-medium-2506 1

1304

±6

12,018

Mistral

Propietaria

120

grok-2-mini-2024-08-13 1

1306

±4

52,789

xAI

Propietaria

120

deepseek-v2.5 1

1305

±5

24,839

DeepSeek

DeepSeek

120

athene-70b-0725 1

1304

±6

19,796

NexusFlow

CC-BY-NC-4.0

122

mistral-large-2411 1

1303

±4

28,455

Mistral

MRL

124

mistral-small-3.1-24b-instruct-2503 1

1301

±5

31,747

Mistral

Apache 2.0

126

qwen2.5-72b-instruct 1

1300

±4

39,632

Alibaba

Qwen

126

llama-3.1-nemotron-70b-instruct 1

1296

±8

7,216

Nvidia

Llama 3.1

127

hunyuan-large-vision 1

1293

±9

5,606

Tencent

Propietaria

134

llama-3.1-70b-instruct 1

1292

±4

56,003

Meta

Comunidad Llama 3.1

134

jamba-1.5-large 1

1287

±7

8,730

AI21 Labs

Jamba Open

134

reka-core-20240904 1

1286

±7

7,380

Reka AI

Propietaria

134

llama-3.1-tulu-3-70b 1

1285

±10

2,881

Ai2

Llama 3.1

134

llama-3.1-nemotron-51b-instruct 1

1285

±10

3,777

Nvidia

Llama 3.1

135

amazon-nova-pro-v1.0 1

1287

±4

25,218

Amazon

Propietaria

135

gpt-4-0314 1

1285

±5

54,754

OpenAI

Propietaria

136

gemma-2-27b-it 1

1285

±3

76,195

Google

Licencia Gemma

137

gemini-1.5-flash-001 1

1283

±4

63,418

Google

Propietaria

137

claude-3-sonnet-20240229 1

1280

±4

110,173

Anthropic

Propietaria

137

gemma-2-9b-it-simpo 1

1277

±7

10,108

Princeton

MIT

138

command-r-plus-08-2024 1

1276

±6

9,931

Cohere

CC-BY-NC-4.0

139

nemotron-4-340b-instruct 1

1277

±5

19,913

Nvidia

Modelo abierto de Nvidia

142

glm-4-0520 1

1272

±7

9,857

Zhipu AI

Propietaria

143

reka-flash-20240904 1

1272

±7

7,583

Reka AI

Propietaria

144

llama-3-70b-instruct 1

1275

±3

158,908

Meta

Comunidad Llama 3

144

gpt-4-0613 1

1274

±4

89,612

OpenAI

Propietaria

144

mistral-small-24b-instruct-2501 1

1272

±6

14,830

Mistral

Apache 2.0

145

qwen2.5-coder-32b-instruct 1

1268

±8

5,452

Alibaba

Apache 2.0

150

c4ai-aya-expanse-32b 1

1266

±5

27,362

Cohere

CC-BY-NC-4.0

152

command-r-plus 1

1263

±4

78,401

Cohere

CC-BY-NC-4.0

152

deepseek-coder-v2 1

1262

±6

15,242

DeepSeek AI

Licencia DeepSeek

153

gemma-2-9b-it 1

1263

±4

54,954

Google

Licencia Gemma

153

qwen2-72b-instruct 1

1261

±5

37,688

Alibaba

Licencia Qianwen

155

claude-3-haiku-20240307 1

1260

±4

118,626

Anthropic

Propietaria

155

gemini-1.5-flash-8b-001 1

1259

±4

35,914

Google

Propietaria

155

amazon-nova-lite-v1.0 1

1259

±5

19,760

Amazon

Propietaria

155

olmo-2-0325-32b-instruct 1

1252

±11

3,377

Allen AI

Apache-2.0

158

phi-4 1

1254

±4

24,354

Microsoft

MIT

159

command-r-08-2024 1

1251

±6

10,229

Cohere

CC-BY-NC-4.0

165

mistral-large-2402 1

1242

±5

63,404

Mistral

Propietaria

165

amazon-nova-micro-v1.0 1

1240

±5

19,774

Amazon

Propietaria

165

jamba-1.5-mini 1

1237

±7

8,918

AI21 Labs

Jamba Open

165

ministral-8b-2410 1

1235

±9

4,833

Mistral

MRL

166

hunyuan-standard-256k 1

1232

±12

2,761

Tencent

Propietaria

167

qwen1.5-110b-chat 1

1234

±5

26,679

Alibaba

Licencia Qianwen

167

qwen1.5-72b-chat 1

1233

±5

39,689

Alibaba

Licencia Qianwen

167

reka-flash-21b-20240226-online 1

1233

±7

15,606

Reka AI

Propietaria

167

gemini-pro-dev-api 1

1233

±7

18,454

Google

Propietaria

169

mixtral-8x22b-instruct-v0.1 1

1229

±4

52,214

Mistral

Apache 2.0

169

command-r 1

1228

±5

54,710

Cohere

CC-BY-NC-4.0

169

reka-flash-21b-20240226 1

1226

±6

25,026

Reka AI

Propietaria

169

llama-3.1-tulu-3-8b 1

1221

±11

2,943

Ai2

Llama 3.1

169

gemini-pro 1

1220

±12

6,418

Google

Propietaria

170

mistral-medium 1

1223

±5

34,893

Mistral

Propietaria

170

c4ai-aya-expanse-8b 1

1222

±7

9,922

Cohere

CC-BY-NC-4.0

172

gpt-3.5-turbo-0125 1

1223

±5

67,214

OpenAI

Propietaria

173

llama-3-8b-instruct 1

1222

±4

106,055

Meta

Comunidad Llama 3

176

zephyr-orpo-141b-A35b-v0.1 1

1213

±11

4,712

HuggingFace

Apache 2.0

177

granite-3.1-8b-instruct 1

1209

±11

3,142

IBM

Apache 2.0

181

yi-1.5-34b-chat 1

1213

±5

24,417

01 AI

Apache-2.0

183

llama-3.1-8b-instruct 1

1210

±4

50,234

Meta

Comunidad Llama 3.1

183

qwen1.5-32b-chat 1

1205

±6

22,068

Alibaba

Licencia Qianwen

184

gpt-3.5-turbo-1106 1

1200

±9

16,760

OpenAI

Propietaria

187

phi-3-medium-4k-instruct 1

1198

±5

25,301

Microsoft

MIT

188

mixtral-8x7b-instruct-v0.1 1

1197

±4

74,303

Mistral

Apache 2.0

188

gemma-2-2b-it 1

1197

±4

46,901

Google

Licencia Gemma

188

dbrx-instruct-preview 1

1195

±6

32,760

Databricks

Licencia DBRX

188

qwen1.5-14b-chat 1

1192

±7

18,066

Alibaba

Licencia Qianwen

188

internlm2_5-20b-chat 1

1192

±7

10,038

InternLM

Otros

190

wizardlm-70b 1

1185

±9

8,270

Microsoft

Comunidad Llama 2

190

deepseek-llm-67b-chat 1

1183

±11

4,950

DeepSeek AI

Licencia DeepSeek

194

yi-34b-chat 1

1184

±7

15,624

01 AI

Licencia Yi

194

granite-3.0-8b-instruct 1

1182

±9

6,727

IBM

Apache 2.0

194

openchat-3.5-0106 1

1182

±8

12,712

OpenChat

Apache-2.0

194

openchat-3.5 1

1181

±10

8,009

OpenChat

Apache-2.0

194

granite-3.1-2b-instruct 1

1180

±11

3,235

IBM

Apache 2.0

195

snowflake-arctic-instruct 1

1180

±6

33,272

Snowflake

Apache 2.0

195

tulu-2-dpo-70b 1

1179

±10

6,579

AllenAI/UW

Bajo riesgo AI2 ImpACT

195

openhermes-2.5-mistral-7b 1

1175

±10

5,026

NousResearch

Apache-2.0

197

gemma-1.1-7b-it 1

1178

±6

24,327

Google

Licencia Gemma

197

vicuna-33b 1

1173

±6

22,613

LMSYS

No comercial

197

starling-lm-7b-beta 1

1173

±7

16,190

Nexusflow

Apache-2.0

197

phi-3-small-8k-instruct 1

1172

±6

17,983

Microsoft

MIT

197

nous-hermes-2-mixtral-8x7b-dpo 1

1166

±12

3,792

NousResearch

Apache-2.0

198

llama-2-70b-chat 1

1171

±5

38,767

Meta

Comunidad Llama 2

198

starling-lm-7b-alpha 1

1168

±8

10,267

UC Berkeley

CC-BY-NC-4.0

200

llama-3.2-3b-instruct 1

1166

±8

8,043

Meta

Llama 3.2

203

qwq-32b-preview 1

1160

±11

3,256

Alibaba

Apache 2.0

205

llama2-70b-steerlm-chat 1

1157

±13

3,605

Nvidia

Comunidad Llama 2

207

dolphin-2.2.1-mistral-7b 1

1151

±15

1,685

Cognitive Computations

Apache-2.0

208

solar-10.7b-instruct-v1.0 1

1154

±13

4,187

Upstage AI

CC-BY-NC-4.0

212

granite-3.0-2b-instruct 1

1156

±8

6,922

IBM

Apache 2.0

212

mpt-30b-chat 1

1150

±12

2,606

MosaicML

CC-BY-NC-SA-4.0

212

falcon-180b-chat 1

1146

±17

1,312

TII

Licencia Falcon-180B TII

213

wizardlm-13b 1

1149

±9

7,122

Microsoft

Comunidad Llama 2

214

mistral-7b-instruct-v0.2 1

1150

±7

19,603

Mistral

Apache-2.0

215

qwen1.5-7b-chat 1

1144

±10

4,782

Alibaba

Licencia Qianwen

215

qwen-14b-chat 1

1138

±11

5,004

Alibaba

Licencia Qianwen

216

phi-3-mini-4k-instruct-june-2024 1

1143

±6

12,415

Microsoft

MIT

216

llama-2-13b-chat 1

1142

±7

19,357

Meta

Comunidad Llama 2

216

vicuna-13b 1

1141

±7

19,539

LMSYS

Comunidad Llama 2

217

codellama-34b-instruct 1

1136

±9

7,417

Meta

Comunidad Llama 2

217

palm-2 1

1135

±9

8,634

Google

Propietaria

219

gemma-7b-it 1

1133

±9

9,034

Google

Licencia Gemma

219

zephyr-7b-beta 1

1132

±9

11,220

HuggingFace

MIT

219

zephyr-7b-alpha 1

1128

±16

1,803

HuggingFace

MIT

221

guanaco-33b 1

1128

±12

2,955

UW

No comercial

222

phi-3-mini-128k-instruct 1

1130

±7

21,024

Microsoft

MIT

222

codellama-70b-instruct 1

1119

±18

1,151

Meta

Comunidad Llama 2

225

phi-3-mini-4k-instruct 1

1129

±6

20,539

Microsoft

MIT

227

stripedhyena-nous-7b 1

1120

±11

5,214

Together AI

Apache 2.0

227

smollm2-1.7b-instruct 1

1118

±14

2,244

HuggingFace

Apache 2.0

232

vicuna-7b 1

1114

±9

6,972

LMSYS

Comunidad Llama 2

235

llama-3.2-1b-instruct 1

1112

±8

8,166

Meta

Llama 3.2

235

gemma-1.1-2b-it 1

1112

±8

11,035

Google

Licencia Gemma

235

mistral-7b-instruct 1

1110

±9

9,042

Mistral

Apache 2.0

236

llama-2-7b-chat 1

1108

±7

14,272

Meta

Comunidad Llama 2

243

gemma-2b-it 1

1089

±11

4,817

Google

Licencia Gemma

245

qwen1.5-4b-chat 1

1090

±9

7,662

Alibaba

Licencia Qianwen

245

olmo-7b-instruct 1

1075

±11

6,412

Allen AI

Apache-2.0

246

koala-13b 1

1070

±10

6,998

UC Berkeley

No comercial

246

gpt4all-13b-snoozy 1

1064

±15

1,773

Nomic AI

No comercial

247

alpaca-13b 1

1064

±11

5,828

Stanford

No comercial

247

mpt-7b-chat 1

1060

±12

3,977

MosaicML

CC-BY-NC-SA-4.0

247

chatglm3-6b 1

1056

±12

4,692

Tsinghua

Apache-2.0

250

RWKV-4-Raven-14B 1

1041

±11

4,898

RWKV

Apache 2.0

253

chatglm2-6b 1

1025

±14

2,683

Tsinghua

Apache-2.0

253

oasst-pythia-12b 1

1021

±11

6,343

OpenAssistant

Apache 2.0

256

chatglm-6b 1

995

±13

4,968

Tsinghua

No comercial

256

fastchat-t5-3b 1

990

±12

4,270

LMSYS

Apache 2.0

256

dolly-v2-12b 1

977

±14

3,471

Databricks

MIT

256

llama-13b 1

968

±16

2,441

Meta

No comercial

258

stablelm-tuned-alpha-7b 1

952

±13

3,325

Stability AI

CC-BY-NC-SA-4.0

Notas

  • Clasificación (UB): Clasificación calculada según el modelo Bradley-Terry. Esta clasificación refleja el rendimiento integral del modelo en la arena y proporciona una estimación del límite superior de su puntuación Elo, ayudando a comprender la competitividad potencial del modelo.

  • Modelo: Nombre del modelo de lenguaje grande (LLM). Algunos nombres de modelos pueden incluir enlaces relacionados.

  • Puntuación: Puntuación Elo obtenida por el modelo en la arena a través de votos de usuarios. La puntuación Elo es un sistema de clasificación relativo, donde una puntuación más alta indica un mejor rendimiento del modelo.

  • Intervalo de confianza del 95% (±): Intervalo de confianza del 95% de la puntuación Elo del modelo (por ejemplo: ±6). Cuanto más pequeño sea este intervalo, más estable y confiable será la puntuación del modelo.

  • Votos: Número total de votos recibidos por este modelo en la arena. Generalmente, cuanto más votos, mayor será la fiabilidad estadística de su puntuación.

  • Organización/Empresa: Organización o empresa que proporciona el modelo.

  • Licencia: Tipo de licencia del modelo, por ejemplo, Propietaria, Apache 2.0, MIT, etc.

Fuentes de datos y frecuencia de actualización

Los datos de esta tabla de clasificación se obtienen directamente del sitio web oficial 1 2 mediante un script automatizado. Esta tabla de clasificación se actualiza automáticamente cada día mediante GitHub Actions.

Descargo de responsabilidad

Este informe se proporciona únicamente con fines informativos. Los datos de la tabla de clasificación están en constante cambio y se basan en votos de preferencia de los usuarios en Chatbot Arena durante un período específico. La integridad y precisión de los datos dependen de la fuente de datos de origen. Diferentes modelos pueden utilizar distintos acuerdos de licencia; al utilizarlos, consulte siempre las instrucciones oficiales del proveedor del modelo.

Última actualización

¿Te fue útil?