Ranking de Modelos
Este documento foi traduzido do chinês por IA e ainda não foi revisado.
Esta é uma classificação baseada em dados da Chatbot Arena (lmarena.ai), gerada automaticamente através de um processo automatizado.
Data de atualização dos dados: 2025-08-12 11:43:09 UTC / 2025-08-12 19:43:09 CST (Horário de Pequim)
Classificação
(Continuação da tabela até o final sem alterações no conteúdo das células)
Notas Explicativas
Classificação(UB): Classificação baseada no modelo Bradley-Terry. Fornece estimativa de limite superior para o Elo, medindo o potencial competitivo do modelo.
Classificação(StyleCtrl): Avaliação controlada de estilo de diálogo para reduzir viés de preferência por estilos específicos (ex: verbose vs conciso).
Nome do Modelo: Links incorporados para detalhes/experiência do modelo. Mantido inalterado como identificador técnico.
Pontuação: Sistema Elo dinâmico que reflete desempenho relativo (quanto maior, melhor).
Intervalo de Confiança: Intervalo de confiança de 95% para o Elo (±). Intervalos menores indicam maior confiabilidade.
Votos: Volume total de votos recebidos no Chatbot Arena. Volume maior = maior confiabilidade estatística.
Provedor: Organização provedora do modelo.
Licença: Licença de uso (ex: Proprietário, Apache 2.0, MIT).
Data de Corte do Conhecimento: Data limite dos dados de treinamento. "Sem dados" = informação indisponível.
Fonte de Dados e Frequência de Atualização
Esta classificação utiliza dados automatizados do projeto fboulnois/llm-leaderboard-csv, que coleta informações do lmarena.ai. Atualizada diariamente via GitHub Actions.
Isenção de Responsabilidade
Este relatório é apenas para referência. Os dados são dinâmicos e baseados em votos de preferência dos usuários no Chatbot Arena durante períodos específicos. A integridade e precisão dependem das fontes de dados originais. Verifique sempre os termos de licenciamento diretamente com os provedores dos modelos antes do uso.
最后更新于
这有帮助吗?