Бенчмарки моделей

Этот рейтинг основан на данных Chatbot Arena (lmarena.ai) и генерируется автоматически.

Время обновления данных: 2025-07-24 11:44:24 UTC / 2025-07-24 19:44:24 CST (время по Пекину)

Нажмите на название модели в таблице лидеров, чтобы перейти на страницу с подробной информацией или попробовать модель.

Таблица лидеров

Рейтинг (UB)
Рейтинг (StyleCtrl)
Название модели
Очки
Доверительный интервал
Количество голосов
Провайдер
Лицензия
Дата обновления знаний

1

1

1474

+5/-4

19,209

Google

Proprietary

Нет данных

2

2

1446

+4/-5

13,692

Google

Proprietary

Нет данных

2

3

1443

+7/-8

5,725

xAI

Proprietary

Нет данных

4

3

1429

+4/-4

26,230

OpenAI

Proprietary

Нет данных

4

2

1428

+5/-3

25,442

OpenAI

Proprietary

Нет данных

4

7

1424

+5/-5

14,514

DeepSeek

MIT

Нет данных

4

9

1423

+4/-3

27,643

xAI

Proprietary

Нет данных

6

7

1417

+4/-3

24,656

Google

Proprietary

Нет данных

8

3

1413

+5/-5

15,271

OpenAI

Proprietary

Нет данных

10

11

1397

+5/-4

18,607

Google

Proprietary

Нет данных

10

14

1392

+5/-4

19,352

Alibaba

Apache 2.0

Нет данных

11

7

1384

+5/-4

20,325

OpenAI

Proprietary

Нет данных

12

14

1382

+5/-4

23,031

DeepSeek

MIT

Нет данных

12

22

1378

+5/-5

8,950

Tencent

Proprietary

Нет данных

12

6

1374

+12/-11

3,166

Moonshot

Modified MIT

Нет данных

14

15

1373

+3/-5

19,430

DeepSeek

MIT

Нет данных

14

21

1372

+4/-3

23,574

Mistral

Proprietary

Нет данных

14

7

1371

+6/-5

13,582

Anthropic

Proprietary

Нет данных

15

7

1368

+4/-3

21,663

Anthropic

Proprietary

Нет данных

15

26

1367

+5/-4

16,482

Alibaba

Apache 2.0

Нет данных

15

21

1364

+6/-4

11,524

MiniMax

Apache 2.0

Нет данных

17

14

1365

+3/-3

29,038

OpenAI

Proprietary

Нет данных

17

14

1363

+5/-4

20,096

OpenAI

Proprietary

Нет данных

17

27

1363

+3/-3

32,937

Alibaba

Proprietary

Нет данных

17

32

1361

+7/-6

6,020

xAI

Proprietary

Нет данных

18

31

1361

+3/-2

37,796

Google

Proprietary

Нет данных

20

35

1357

+6/-5

12,522

xAI

Proprietary

Нет данных

21

29

1359

+3/-3

28,099

Google

Gemma

Нет данных

26

12

1351

+7/-5

12,534

Anthropic

Proprietary

Нет данных

28

22

1350

+4/-3

33,177

OpenAI

Proprietary

2023/10

29

35

1344

+8/-8

4,074

Alibaba

Apache 2.0

Нет данных

31

15

1341

+5/-4

17,996

Anthropic

Proprietary

Нет данных

31

28

1340

+5/-3

19,404

OpenAI

Proprietary

Нет данных

31

25

1337

+4/-4

19,404

OpenAI

Proprietary

Нет данных

31

36

1337

+8/-8

3,976

Google

Gemma

Нет данных

31

35

1335

+9/-7

4,940

Mistral

Apache 2.0

Нет данных

31

34

1334

+3/-4

22,841

DeepSeek

DeepSeek

Нет данных

31

44

1332

+5/-3

19,232

Alibaba

Apache 2.0

Нет данных

34

37

1325

+8/-7

6,055

Alibaba

Proprietary

Нет данных

35

35

1328

+3/-3

26,104

Google

Proprietary

Нет данных

35

36

1327

+4/-4

26,540

Cohere

CC-BY-NC-4.0

Нет данных

35

42

1326

+7/-7

6,028

Zhipu

Proprietary

Нет данных

35

62

1325

+6/-5

9,753

Amazon

Proprietary

Нет данных

35

35

1321

+11/-10

2,656

Nvidia

Nvidia Open Model

Нет данных

39

51

1321

+6/-5

16,285

Alibaba

Apache 2.0

Нет данных

39

44

1320

+8/-7

5,126

StepFun

Proprietary

Нет данных

39

35

1318

+8/-10

2,452

Tencent

Proprietary

Нет данных

40

46

1312

+13/-9

2,371

Nvidia

Nvidia

Нет данных

41

46

1319

+3/-3

54,951

OpenAI

Proprietary

2023/10

41

37

1318

+4/-3

38,885

OpenAI

Proprietary

Нет данных

42

36

1317

+3/-2

58,645

Google

Proprietary

Нет данных

42

37

1311

+8/-11

2,510

Tencent

Proprietary

Нет данных

46

21

1312

+4/-3

28,145

Anthropic

Proprietary

Нет данных

49

64

1305

+6/-6

9,350

Google

Gemma

Нет данных

50

25

1305

+5/-4

32,904

Anthropic

Proprietary

Нет данных

52

52

1303

+2/-2

67,084

xAI

Proprietary

2024/3

52

56

1302

+3/-3

28,968

01 AI

Proprietary

Нет данных

53

40

1300

+1/-2

117,747

OpenAI

Proprietary

2023/10

53

66

1297

+5/-5

10,715

Alibaba

Proprietary

Нет данных

54

76

1291

+10/-7

4,321

Google

Gemma

Нет данных

55

29

1298

+2/-2

79,949

Anthropic

Proprietary

2024/4

55

60

1294

+6/-6

7,243

DeepSeek

DeepSeek

Нет данных

59

48

1292

+5/-4

20,106

Meta

Llama 4

Нет данных

59

57

1287

+10/-12

3,856

Tencent

Proprietary

Нет данных

60

69

1290

+3/-3

26,074

NexusFlow

NexusFlow

Нет данных

60

60

1287

+8/-6

6,302

OpenAI

Proprietary

Нет данных

61

65

1289

+3/-3

27,788

Zhipu AI

Proprietary

Нет данных

61

66

1287

+2/-2

72,423

OpenAI

Proprietary

202极/10

61

75

1287极 +3/-3

37,021

Google

Proprietary

Нет данных

61

84

1284

+6/-7

7,577

Nvidia

Llama 3.1

2023/12

64

46

1284

+2/-3

43,788

Meta

Llama 3.1 Community

2023/12

65

48

1283

+2/-3

63,038

Meta

Llama 3.1 Community

2023/12

66

42

1283

+1/-2

86,159

Anthropic

Proprietary

2024/4

66

46

1282

+3/-3

52,144

Google

Proprietary

Online

66

58

1279

+6/-6

9,771

Meta

Llama

Нет данных

67

81

1281

+2/-3

55,442

xAI

Proprietary

2024/3

67

65

1276

+8/-8

4,014

Tencent

Proprietary

Нет данных

68

50

1280

+2/-3

47,973

OpenAI

Proprietary

2023/10

68

68

1278

+4/-3

17,432

Alibaba

Qwen

Нет данных

75

63

1275

+2/-2

82,435

Google

Proprietary

2023/11

76

80

1273

+3/-3

26,344

DeepSeek

DeepSeek

Нет данных

78

66

1273

+2/-2

48,583

Meta

Llama-3.3

Нет данных

78

84

1272

+3/-3

41,519

Alibaba

Qwen

2024/9

78

61

1271

+2/-2

102,133

OpenAI

Proprietary

2023/12

78

88

1268

+6/-6

9,738

Mistral

Apache 2.0

Нет данных

84

69

1267

+2/-3

48,217

Mistral

Mistral Research

2024/7

84

82

1265

+4/-4

20,580

NexusFlow

CC-BY-NC-4.0

2024/7

84

88

1259

+8/-11

3,010

Ai2

Llama 3.1

Нет данных

85

66

1265

+2/-2

103,748

OpenAI

Proprietary

2023/4

85

84

1264

+3/-3

29,633

Mistral

MRL

Нет данных

85

91

1263

+2/-3

58,637 极 Meta

Llama 3.1 Community

2023/12

85

63

1262

+1/-2

202,641

Anthropic

Proprietary

2023/8

86

92

1260

+3/-4

26,371

Amazon

Proprietary

Нет данных

88

70

1260

+2/-2

97,079

OpenAI

Proprietary

2023/12

88

91

1255

+7/-9

4,995

Tencent

Proprietary

Нет данных

88

74

1253

+8/-7

5,732

Mistral

Proprietary

Нет данных

94

65

1254

+3/-3

51,504

Anthropic

Propretary

Нет данных

94

91

1250

+5/-7

7,948

Reka AI

Proprietary

Нет данных

98

95

1242

+2/-2

65,661

Google

Proprietary

2023/11

99

92

1237

+5/-6

9,125

AI21 Labs

Jamba Open

2024/3

100

94

1235

+2/-2

79,538

Google

Gemma license

2024/6

100

104

1233

+5/-4

15,321

Mistral

Apache 2.0

Нет данных

100

103

1232

+6/-6

5,730

Alibaba

Apache 2.0

Нет данных

100

111

1232

+3/-5

20,646

Amazon

Proprietary

Нет данных

100

97

1231

+4/-7

10,548

Princeton

MIT

2024/7

100

98

1230

+5/-6

10,535

Cohere

CC-BY-NC-4.0

2024/8

100

92

1227

+8/-8

3,889

Nvidia

Llama 3.1

2023/12

101

111

1222

+9/-11

3,460

Allen AI

Apache-2.0

Нет данных

102

114

1228

+2/-3

37,697

Google

Proprietary

Нет данных

103

101

1224

+4/-3

20,608

Nvidia

NVIDIA Open Model

2023/6

104

110

1224

+3/-4

28,768

Cohere

CC-BY-NC-4.0

Нет данных

104

106

1222

+5/-5

10,221

Zhipu AI

Proprietary

Нет данных

105

102

1221

+5/-6

8,132

Reka AI

Proprietary

Нет данных

108

102

1222

+2/-2

163,629

Meta

Llama 3 Community

2023/12

108

116

1221

+4/-3

25,213

Microsoft

MIT

Нет данных

112

100

1216

+2/-2

113,067

Anthropic

Proprietary

2023/8

114

125

1213

+3/-4

20,654

Amazon

Proprietary

Нет данных

116

125

1204

+8/-9

2,901

Tencent

Proprietary

Нет данных

117

114

1207

+2/-2

57,197

Google

Gemma license

2024/6

118

111

1205

+2/-3

80,846

Cohere

CC-BY-NC-4.0

2024/3

118

111

1202

+3/-3

38,872

Alibaba

Qianwen LICENSE

2024/6

118

126

1200

+9/-12

3,074

Ai2

Llama 3.1

Нет данных

119

97

1201

+2/-3

55,962

OpenAI

Proprietary

2021/9

119

125

1197

+7/-8

5,111

Mistral

MRL

Нет данных

120

126

1195

+6/-5

10,391

Cohere

CC-BY-NC-4.0

Нет данных

120

114

1195

+5/-5

10,851

Cohere

CC-BY-NC-4.0

2024/8

121

111

1193

+5/-4

15,753

DeepSeek AI

DeepSeek License

2024/6

122

116

1194

+2/-2

122,309

Anthropic

Proprietary

2023/8

122

125

1191

+5/-6

9,274

AI21 Labs

Jamba Open

2024/3

123

141

1191

+2/-3

52,578

Meta

Llama 3.1 Community

2023/12

131

109

1178

+2/-2

91,614

OpenAI

Proprietary

2021/9

131

126

1176

+3/-4

27,430

Alibaba

Qianwen LICENSE

2024/4

131

141

1172

+4/-3

25,135

01 AI

Apache-2.0

2024/5

131

158

1168

+9/-8

3,410

Alibaba

Apache 2.0

Нет данных

132

125

1172

+2/-3

64,926

Mistral

Proprietary

Нет данных

132

126

1171

+5/-4

16,027

Reka AI

Proprietary

Online

133

148

1164

+6/-6

10,599

InternLM

Other

2024/8

134

134

1167

+2/-2

109,056

Meta

Llama 3 Community

2023/3

135

134

1158

+10/-10

3,289

IBM

Apache 2.0

Нет данных

136

130

1164

+3/-3

56,398

Cohere

CC-BY-NC-4.0

2024/3极

136

135

1163

+3/-4

35,556

Mistral

Proprietary

Нет данных

136

133

1162

+4/-3

25,803

Reka AI

Proprietary

2023/11

137

128

1163

+3/-3

53,751

Mistral

Apache 2.0

2024/4

137

130

1162

+3/-3

40,658

Alibaba

Qianwen LICENSE

2024/2

137

148

1159

+3/-3

48,892

Google

Gemma license

2024/7

145

128

1146

+4/-5

18,800

Google

Proprietary

2023/4

145

138

1142

+8/-8

4,854

HuggingFace

Apache 2.0

2024/4

146

143

1140

+3/-4

22,765

Alibaba

Qianwen LICENSE

2024/2

146

150

1135

+10/-11

3,380

IBM

Apache 2.0

Нет данных

147

148

1138

+3/-4

26,105

Microsoft

MIT

2023/10

147

160

1134

+4/-5

16,676

Nexusflow

Apache-2.0

2024/3

150

148

1129

+3/-3

76,126

Mistral

Apache 2.0

2023/12

150

154

1126

+5/-5

15,917

01 AI

Yi License

2023/6

150

138

1126

+7/-5

6,557

Google

Proprietary

2023/4

151

151

1124

+4/-5

18,687

Alibaba

Qianwen LICENSE

2024/2

151

152

1121

+6/-8

8,383

Microsoft

Llama 2 Community

2023/8

152

138

1121

+3/-2

68,867

OpenAI

Proprietary

2021/9

152

157

1118

+6/-7

8,390

Meta

Llama 3.2

2023/12

153

148

1118

+3/-3

33,743

Databricks

DBRX LICENSE

2023/12

153

157

1114

+7/-7

6,658

AllenAI/UW

AI2 ImpACT Low-risk

2023/11

154

155

1117

+4/-4

18,476

Microsoft

MIT

2023/10

158

148

1108

+7/-8

7,002

IBM

Apache 2.0

Нет данных

160

167

1108

+3/-3

39,595

Meta

Llama 2 Community

2023/7

160

153

1106

+5/-5

12,990

OpenChat

Apache-2.0

2024/1

161

160

1106

+5/-5

22,936

LMSYS

Non-commercial

2023/8

161

153

1105

+4/-3

34,173

Snowflake

Apache 2.0

2024/4

161

164

1103

+5/-5

10,415

UC Berkeley

CC-BY-NC-4.0

2023/11

161

170

1099

+9/-7

3,836

NousResearch

Apache-2.0

2024/1

162

169

1096

+10/-8

3,636

Nvidia

Llama 2 Community

2023/11

163

154

1099

+4/-4

25,070

Google

Gemma license

2024/2

167

155

1092

+8/-10

4,988

DeepSeek AI

DeepSeek License

2023/11

167

158

1089

+10/-8

5,088

NousResearch

Apache-2.0

2023/11

168

155

1092

+7/-8

8,106

OpenChat

Apache-2.0

2023/11

169

164

1089

+6/-7

7,191

IBM

Apache 2.0

Нет данных

169

174

1085

+8/-9

4,872

Alibaba

Qianwen LICENSE

2024/2

170

174

1087

+4/-4

20,067

Mistral

Apache-2.0

2023/12

170

174

1086

+5/-6

12,808

Microsoft

MIT

2023/10

170

170

1078

+12/-14

1,714

Cognitive Computations

Apache-2.0

2023/10

171

149

1083

+5/-5

17,036

OpenAI

Proprietary

2021/9

171

178

1081

+5/-4

21,097

Microsoft

MIT

2023/10

171

173

1077

+8/-8

4,286

Upstage AI

CC-BY-NC-4.0

2023/11

173

179

1078

+5/-4

19,722

Meta

Llama 2 Community

2023/7

177

174

1074

+6/-8

7,176

Microsoft

Llama 2 Community

2023/7

180

184

1069

+6/-6

8,523

Meta

Llama 3.2

2023/12

180

175

1062

+13/-12

2,375

HuggingFace

Apache 2.0

Нет данных

181

182

1068

+5/-5

11,321

HuggingFace

MIT

2023/10

181

174

1061

+12/-10

2,644

MosaicML

CC-BY-NC-SA-4.0

2023/6

181

182

1056

+16/-17

1,192

Meta

Llama 2 Community

2024/1

182

179

1056

+11/-14

1,811

HuggingFace

MIT

2023/10

183

172

1049

+17/-18

1,327

TII

Falcon-180B TII License

2023/9

184

182

1058

+6/-7

7,509

Meta

Llama 2 Community

2023/7

186

177

1057

+5/-5

19,775

LMSYS

Llama 2 Community

2023/7

186

182

1052

+5/-5

9,176

Google

Gemma license

2024/2

186

183

1052

+4/-4

21,622

Microsoft

MIT

2023/10

186

198

1052

+5/-6

14,532

Meta

Llama 2 Community

2023/7

186

175

1050

+6/-10

5,065

Alibaba

Qianwen LICENSE

2023/8

186

185

1048

+12/-9

2,996

UW

Non-commercial

2023/5

193

187

1036

+6/-6

11,351

Google

Gemma license

2024/2

195

190

1032

+7/-8

5,276

Together AI

Apache 2.0

2023/12

197

205

1030

+7/-8

6,503

Allen AI

Apache-2.0

2024/2

199

197

1023

+6/-7

9,142

Mistral

Apache 2.0

2023/9

199

199

1020

+7/-7

7,017

LMSYS

Llama 2 Community

2023/7

199

185

1018

+8/-6

8,713

Google

Proprietary

2021/6

204

201

1004

+8/-10

4,918

Google

Gemma license

2024/2

204

199

1003

+极6/-6

7,816

Alibaba

Qianwen LICENSE

2024/2

206

206

979

+7/-7

7,020

UC Berkeley

Non-commercial

2023/4

206

206

970

+8/-8

4,763

Tsinghua

Apache-2.0

2023/10

208

206

947

+13/-14

1,788

Nomic AI

Non-commercial

2023/3

208

206

943

+10/-12

3,997

MosaicML

CC-BY-NC-SA-4.0

2023/5

208

211

939

+11/-11

2,713

Tsinghua

Apache-2.0

2023/6

208

209

937

+11/-9

4,920

RWKV

Apache 2.0

2023/4

212

206

916

+7/-8

5,864

Stanford

Non-commercial

2023/3

212

212

908

+8/-7

6,368

OpenAssistant

Apache 2.0

2023/4

213

214

894

+9/-10

4,983

Tsinghua

Non-commercial

2023/3

214

214

883

+8/-9

4,288

LMSYS

Apache 2.0

2023/4

216

217

855

+10/-10

3,336

Stability AI

CC-BY-NC-SA-4.0

2023/4

216

214

837

+12/-9

3,480

Databricks

MIT

2023/4

218

215

814

+10/-12

2,446

Meta

Non-commercial

2023/2

Пояснения

  • Рейтинг (UB): Рейтинг, рассчитанный на основе модели Брэдли-Терри. Отражает общую производительность модели в арене и показывает верхнюю границу оценки рейтинга Эло, что помогает понять потенциал модели.

  • Рейтинг (StyleCtrl): Рейтинг после контроля стиля общения. Уменьшает влияние предпочтений из-за стиля ответов моделей (например, длинные или краткие ответы), более точно оценивая их ключевые способности.

  • Название модели: Название большой языковой модели (LLM). Колонка содержит ссылки — нажмите для перехода к детальной информации или тестированию модели.

  • Очки: Рейтинг Эло, полученный через голоса пользователей в арене. Чем выше балл, тем лучше производительность модели. Значение динамическое и отражает текущую конкурентную среду.

  • Доверительный интервал: 95% доверительный интервал оценки Эло (например, +6/-6). Чем меньше интервал, тем стабильнее рейтинг; широкий интервал может означать недостаточные данные или нестабильную производительность модели.

  • Количество голосов: Общее число голосов, полученных моделью в арене. Чем больше голосов, тем выше статистическая надежность оценки.

  • Провайдер: Организация или компания, предоставляющая модель.

  • Лицензия: Тип лицензии (e.g., собственническая (Proprietary), Apache 2.0, MIT и т.д.).

  • Дата обновления знаний: Срок актуальности обучающих данных. Нет данных означает отсутствие информации.

Источник данных и частота обновлений

Данные для этого рейтинга автоматически предоставляются и генерируются проектом fboulnois/llm-leaderboard-csv, который получает и обрабатывает данные с lmarena.ai. Рейтинг обновляется ежедневно через GitHub Actions.

Отказ от ответственности

Этот отчёт предназначен только для справки. Данные в таблице лидеров динамичны и основаны на предпочтениях пользователей в Chatbot Arena за определённый период. Полнота и точность данных зависят от первоисточника и обработки в проекте fboulnois/llm-leaderboard-csv. Разные модели могут использовать разные лицензии; при использовании обращайтесь к официальной документации провайдеров моделей.

最后更新于

这有帮助吗?