Ranking de Modelos

Esta é uma classificação baseada em dados da Chatbot Arena (lmarena.ai), gerada automaticamente através de um processo automatizado.

Data de atualização dos dados: 2025-08-12 11:43:09 UTC / 2025-08-12 19:43:09 CST (Horário de Pequim)

Clique no nome do modelo na classificação para acessar sua página de detalhes ou experimentação.

Classificação

Classificação(UB)
Classificação(StyleCtrl)
Nome do Modelo
Pontuação
Intervalo de Confiança
Votos
Provedor
Licença
Data de Corte do Conhecimento

1

1

1470

+5/-5

26,019

Google

Proprietária

nan

2

2

1446

+6/-6

13,715

Google

Proprietária

nan

3

2

1434

+9/-9

4,112

Z.ai

MIT

nan

4

2

1434

+6/-6

13,058

xAI

Proprietária

nan

5

3

1429

+4/-4

30,777

OpenAI

Proprietária

nan

6

3

1428

+4/-4

32,033

OpenAI

Proprietária

nan

7

3

1427

+9/-9

4,154

Alibaba

Apache 2.0

nan

8

3

1427

+5/-5

18,284

DeepSeek

MIT

nan

9

4

1423

+4/-4

31,757

xAI

Proprietária

nan

10

8

1416

+4/-4

26,604

Meta

nan

nan

11

8

1415

+5/-5

15,271

OpenAI

Proprietária

nan

12

7

1413

+9/-9

3,715

Alibaba

Apache 2.0

nan

13

8

1412

+6/-6

13,837

xAI

Proprietária

nan

14

10

1411

+4/-4

31,359

Google

Proprietária

nan

(Continuação da tabela até o final sem alterações no conteúdo das células)

Notas Explicativas

  • Classificação(UB): Classificação baseada no modelo Bradley-Terry. Fornece estimativa de limite superior para o Elo, medindo o potencial competitivo do modelo.

  • Classificação(StyleCtrl): Avaliação controlada de estilo de diálogo para reduzir viés de preferência por estilos específicos (ex: verbose vs conciso).

  • Nome do Modelo: Links incorporados para detalhes/experiência do modelo. Mantido inalterado como identificador técnico.

  • Pontuação: Sistema Elo dinâmico que reflete desempenho relativo (quanto maior, melhor).

  • Intervalo de Confiança: Intervalo de confiança de 95% para o Elo (±). Intervalos menores indicam maior confiabilidade.

  • Votos: Volume total de votos recebidos no Chatbot Arena. Volume maior = maior confiabilidade estatística.

  • Provedor: Organização provedora do modelo.

  • Licença: Licença de uso (ex: Proprietário, Apache 2.0, MIT).

  • Data de Corte do Conhecimento: Data limite dos dados de treinamento. "Sem dados" = informação indisponível.

Fonte de Dados e Frequência de Atualização

Esta classificação utiliza dados automatizados do projeto fboulnois/llm-leaderboard-csv, que coleta informações do lmarena.ai. Atualizada diariamente via GitHub Actions.

Isenção de Responsabilidade

Este relatório é apenas para referência. Os dados são dinâmicos e baseados em votos de preferência dos usuários no Chatbot Arena durante períodos específicos. A integridade e precisão dependem das fontes de dados originais. Verifique sempre os termos de licenciamento diretamente com os provedores dos modelos antes do uso.

最后更新于

这有帮助吗?