Κατάταξη μοντέλων

Αυτή είναι μια λίστα κατάταξης βασισμένη σε δεδομένα από το Chatbot Arena (lmarena.ai), που δημιουργείται μέσω αυτοματοποιημένης διαδικασίας.

Χρονική σήμανση ενημέρωσης δεδομένων: 2025-07-12 11:41:46 UTC / 2025-07-12 19:41:46 CST (Ώρα Πεκίνου)

Κάντε κλικ στο όνομα μοντέλου στη λίστα κατάταξης για να μεταβείτε στη σελίδα λεπτομερειών ή δοκιμαστικής χρήσης.

Λίστα Κατάταξης

Κατάταξη(UB)
Κατάταξη(StyleCtrl)
Όνομα Μοντέλου
Βαθμολογία
Διάστημα Εμπιστοσύνης
Ψήφοι
Πάροχος
Άδεια Χρήσης
Ημερομηνία Τερματισμού Γνώσης

1

1

1477

+5/-5

15,769

Google

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

2

2

1446

+4/-5

13,997

Google

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

3

3

1429

+4/-4

24,237

OpenAI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

3

2

1427

+3/-4

21,965

OpenAI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

3

6

1425

+4/-5

12,847

DeepSeek

MIT

Δεν υπάρχουν δεδομένα

3

7

1422

+3/-4

25,763

xAI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

5

6

1418

+4/-4

21,209

Google

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

6

4

1414

+5/-4

15,271

OpenAI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

9

7

1398

+5/-5

17,002

Google

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

9

11

1392

+5/-4

15,758

Alibaba

Apache 2.0

Δεν υπάρχουν δεδομένα

11

6

1384

+3/-4

18,275

OpenAI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

11

12

1382

+3/-3

21,008

DeepSeek

MIT

Δεν υπάρχουν δεδομένα

11

17

1380

+6/-5

8,247

Tencent

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

11

11

1376

+6/-6

8,058

MiniMax

Apache 2.0

Δεν υπάρχουν δεδομένα

13

12

1374

+3/-5

19,430

DeepSeek

MIT

Δεν υπάρχουν δεδομένα

14

19

1370

+4/-4

19,980

Mistral

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

14

6

1370

+4/-4

20,056

Anthropic

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

15

23

1367

+4/-4

14,597

Alibaba

Apache 2.0

Δεν υπάρχουν δεδομένα

16

11

1366

+2/-3

29,038

OpenAI

Ιδιόκτητο

2023/10

16

11

1363

+4/-4

17,974

OpenAI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

17

23

1363

+3/-3

32,074

Alibaba

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

18

25

1363

+3/-3

36,915

Google

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

18

31

1359

+6/-5

10,561

xAI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

19

25

1360

+3/-3

26,443

Google

Gemma

Δεν υπάρχουν δεδομένα

24

31

1344

+12/-7

4,074

Alibaba

Apache 2.0

Δεν υπάρχουν δεδομένα

25

19

1351

+3/-4

33,177

OpenAI

Ιδιόκτητο

2023/10

25

12

1343

+4/-5

16,050

Anthropic

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

26

25

1340

+4/-4

19,404

OpenAI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

26

32

1337

+7/-8

3,976

Google

Gemma

Δεν υπάρχουν δεδομένα

26

23

1337

+5/-4

17,292

OpenAI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

26

31

1334

+4/-4

22,841

DeepSeek

DeepSeek

Δεν υπάρχουν δεδομένα

26

31

1332

+13/-13

2,061

Mistral

Apache 2.0

Δεν υπάρχουν δεδομένα

28

38

1333

+4/-5

18,386

Alibaba

Apache 2.0

Δεν υπάρχουν δεδομένα

29

36

1327

+8/-6

6,028

Zhipu

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

30

31

1329

+4/-4

26,104

Google

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

30

56

1327

+5/-7

7,517

Amazon

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

30

32

1326

+7/-6

6,055

Alibaba

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

30

31

1321

+10/-11

2,656

Nvidia

Nvidia Open Model

Δεν υπάρχουν δεδομένα

32

32

1326

+3/-3

24,524

Cohere

CC-BY-NC-4.0

Δεν υπάρχουν δεδομένα

33

42

1323

+4/-4

14,229

Alibaba

Apache 2.0

Δεν υπάρχουν δεδομένα

33

38

1321

+7/-8

5,126

StepFun

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

33

31

1318

+8/-10

2,452

Tencent

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

34

39

1312

+11/-12

2,371

Nvidia

Nvidia

Δεν υπάρχουν δεδομένα

35

39

1320

+2/-2

54,951

OpenAI

Ιδιόκτητο

2023/10

35

32

1319

+3/-3

36,971

OpenAI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

38

32

1318

+2/-2

58,645

Google

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

38

33

1312

+8/-10

2,510

Tencent

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

41

18

1313

+4/-4

25,955

Anthropic

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

43

58

1307

+7/-8

7,379

Google

Gemma

Δεν υπάρχουν δεδομένα

44

21

1306

+4/-3

30,677

Anthropic

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

47

48

1304

+2/-2

67,084

xAI

Ιδιόκτητο

2024/3

47

50

1303

+4/-3

28,968

01 AI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

48

35

1301

+2/-2

117,747

OpenAI

Ιδιόκτητο

2023/10

48

63

1298

+4/-6

10,715

Alibaba

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

50

25

1299

+2/-2

77,905

Anthropic

Ιδιόκτητο

2024/4

50

55

1295

+6/-6

7,243

DeepSeek

DeepSeek

Δεν υπάρχουν δεδομένα

52

74

1292

+8/-9

4,321

Google

Gemma

Δεν υπάρχουν δεδομένα

55

43

1292

+4/-4

18,010

Meta

Llama 4

Δεν υπάρχουν δεδομένα

55

64

1291

+3/-3

26,074

NexusFlow

NexusFlow

Δεν υπάρχουν δεδομένα

55

60

1290

+3/-3

27,788

Zhipu AI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

55

49

1288

+8/-7

3,856

Tencent

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

55

56

1287

+6/-8

6,302

OpenAI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

56

70

1287

+3/-3

37,021

Google

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

56

79

1284

+5/-7

7,577

Nvidia

Llama 3.1

2023/12

57

61

1288

+2/-2

72,473

OpenAI

Ιδιόκτητο

2023/10

59

41

1285

+2/-3

43,788

Meta

Llama 3.1 Community

2023/12

60

36

1284

+2/-2

86,159

Anthropic

Ιδιόκτητο

2024/4

60

42

1283

+2/-2

63,038

Meta

Llama 3.1 Community

2023/12

61

41

1282

+3/-2

52,144

Google

Ιδιόκτητο

Διαδικτυακά

61

60

1277

+8/-10

4,014

Tencent

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

62

79

1282

+2/-3

55,442

xAI

Ιδιόκτητο

2024/3

62

43

1281

+2/-2

47,973

OpenAI

Ιδιόκτητο

2023/10

63

63

1279

+3/-4

17,432

Alibaba

Qwen

Δεν υπάρχουν δεδομένα

63

56

1277

+6/-6

7,451

Meta

Llama

Δεν υπάρχουν δεδομένα

71

79

1271

+7/-6

7,367

Mistral

Apache 2.0

Δεν υπάρχουν δεδομένα

72

57

1276

+2/-2

82,435

Google

Ιδιόκτητο

2023/11

72

74

1274

+3/-3

26,344

DeepSeek

DeepSeek

Δεν υπάρχουν δεδομένα

72

61

1273

+3/-3

47,631

Meta

Llama-3.3

Δεν υπάρχουν δεδομένα

72

79

1273

+3/-3

41,519

Alibaba

Qwen

2024/9

73

56

1272

+2/-2

102,133

OpenAI

Ιδιόκτητο

2023/12

78

86

1260

+10/-10

3,010

Ai2

Llama 3.1

Δεν υπάρχουν δεδομένα

79

64

1267

+2/-2

48,217

Mistral

Mistral Research

2024/7

79

79

1266

+4/-3

20,580

NexusFlow

CC-BY-NC-4.0

2024/7

79

61

1266

+2/-2

103,748

OpenAI

Ιδιόκτητο

2023/4

79

79

1265

+3/-3

29,633

Mistral

MRL

Δεν υπάρχουν δεδομένα

79

62

1258

+9/-8

4,287

Mistral

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

80

86

1264

+2/-2

58,637

Meta

Llama 3.1 Community

2023/12

81

58

1263

+2/-1

202,641

Anthropic

Ιδιόκτητο

2023/8

83

87

1261

+3/-3

26,371

Amazon

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

83

65

1261

+2/-2

97,079

OpenAI

Ιδιόκτητο

2023/12

89

60

1254

+2/-2

49,399

Anthropic

Propretary

Δεν υπάρχουν δεδομένα

89

86

1251

+6/-7

7,948

Reka AI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

89

88

1246

+7/-10

4,210

Tencent

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

92

90

1243

+2/-2

65,661

Google

Ιδιόκτητο

2023/11

93

88

1237

+4/-6

9,125

AI21 Labs

Jamba Open

2024/3

93

96

1233

+8/-6

5,730

Alibaba

Apache 2.0

Δεν υπάρχουν δεδομένα

94

89

1236

+2/-2

79,538

Google

Gemma license

2024/6

94

98

1233

+4/-4

15,321

Mistral

Apache 2.0

Δεν υπάρχουν δεδομένα

94

106

1233

+3/-4

20,646

Amazon

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

94

90

1232

+5/-5

10,548

Princeton

MIT

2024/7

94

86

1228

+9/-10

3,889

Nvidia

Llama 3.1

2023/12

95

94

1231

+4/-6

10,535

Cohere

CC-BY-NC-4.0

2024/8

96

110

1228

+3/-3

37,697

Google

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

97

106

1222

+9/-11

3,460

Allen AI

Apache-2.0

Δεν υπάρχουν δεδομένα

99

105

1225

+3/-3

28,768

Cohere

CC-BY-NC-4.0

Δεν υπάρχουν δεδομένα

99

96

1225

+3/-4

20,608

Nvidia

NVIDIA Open Model

2023/6

99

99

1222

+5/-5

10,221

Zhipu AI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

101

96

1221

+5/-5

8,132

Reka AI

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

102

110

1221

+4/-4

25,213

Microsoft

MIT

Δεν υπάρχουν δεδομένα

103

97

1222

+2/-1

163,629

Meta

Llama 3 Community

2023/12

106

96

1217

+2/-2

113,067

Anthropic

Ιδιόκτητο

2023/8

109

119

1214

+3/-3

20,654

Amazon

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

111

120

1205

+10/-10

2,901

Tencent

Ιδιόκτητο

Δεν υπάρχουν δεδομένα

112

121

1201

+10/-9

3,074

Ai2

Llama 3.1

Δεν υπάρχουν δεδομένα

Οι τρεις πρώτες κολύμβηση-ποιόνες συνεχίζουν μεταξύ των υπόλοιπων θέσεων με παρόμοια δομή

Επεξήγηση

  • Κατάταξη(UB): Κατάταξη με βάση το μοντέλο Bradley-Terry. Αυτή η κατάταξη αντικατοπτρίζει τη συνολική απόδοση των μοντέλων στην αρένα και παρέχει μια εκτίμηση του ανώτατου ορίου του σκορ Elo του μοντέλου, βοηθώντας στην κατανόηση της δυνητικής ανταγωνιστικότητάς του.

  • Κατάταξη(StyleCtrl): Κατάταξη μετά από έλεγχο του στυλ συνομιλίας. Στόχος είναι να ελαχιστοποιηθεί η μεροληψία προτίμησης λόγω στυλ απαντήσεων (π.χ. λίαν εκτενείς, σύντομες), αξιολογώντας καθαρότερα τη βασική ικανότητα του μοντέλου.

  • Όνομα Μοντέλου: Το όνομα του Μεγάλου Γλωσσικού Μοντέλου (LLM). Η στήλη περιλαμβάνει σύνδεσμους για σχετικές πληροφορίες.

  • Βαθμολογία: Η βαθμολογία Elo που κέρδισε το μοντέλο μέσω ψηφοφορίας χρηστών στην αρένα. Το Elo είναι ένα σχετικό σύστημα κατάταξης — υψηλότερες τιμές δείχνουν καλύτερη απόδοση. Είναι δυναμικό και αντικατοπτρίζει σχετική απόδοση.

  • Διάστημα Εμπιστοσύνης: Το 95% διάστημα εμπιστοσύνης για τη βαθμολογία Elo (π.χ. +6/-6). Μικρότερο διάστημα υποδηλώνει σταθερότητα/αξιοπιστία, ενώ μεγαλύτερο μπορεί να υποδηλώνει ανεπαρκή δείγματα ή διακυμάνσεις.

  • Ψήφοι: Ο συνολικός αριθμός ψήφων που έλαβε το μοντέλο στην αρένα. Περισσότερες ψήφοι συνήθως σημαίνουν υψηλότερη στατιστική αξιοπιστία.

  • Πάροχος: Ο οργανισμός ή εταιρεία που παρέχει το μοντέλο.

  • Άδεια Χρήσης: Ο τύπος αδειοδότησης (π.χ. Ιδιόκτητο, Apache 2.0, MIT).

  • Ημερομηνία Τερματισμού Γνώσης: Ημερομηνία τερματισμού γνώσης για τα δεδομένα εκπαίδευσης. Δεν υπάρχουν δεδομένα σημαίνει πως οι πληροφορίες δεν είναι διαθέσιμες.

Πηγή Δεδομένων & Συχνότητα Ενημέρωσης

Τα δεδομένα προέρχονται από το έργο fboulnois/llm-leaderboard-csv και επεξεργάζονται από το lmarena.ai. Η λίστα ενημερώνεται αυτόματα καθημερινά μέσω GitHub Actions.

Αποποίηση Ευθυνών

Αυτή η έκθεση παρέχεται μόνο για ενημερωτικούς σκοπούς. Τα δεδομένα είναι δυναμικά και βασίζονται σε προτιμήσεις χρηστών στο Chatbot Arena για συγκεκριμένες χρονικές περιόδους Η πληρότητα και ακρίβεια εξαρτώνται από την πηγή δεδομένων και την επεξεργασία του έργου fboulnois/llm-leaderboard-csv. Τα μοντέλα μπορεί να υπόκεινται σε διαφορετικές άδειες — ανατρέξτε στις επίσημες οδηγίες των παρόχων πριν τη χρήση.

最后更新于

这有帮助吗?