Ranking de modelos
Este documento ha sido traducido del chino por IA y aún no ha sido revisado.
Este es un ranking basado en los datos de Chatbot Arena (lmarena.ai), generado mediante un proceso automatizado.
Hora de actualización de los datos: 2025-10-18 08:07:11 UTC / 2025-10-18 16:07:11 CST (hora de Beijing)
Tabla de clasificación
Notas
Clasificación (UB): Clasificación calculada según el modelo Bradley-Terry. Esta clasificación refleja el rendimiento integral del modelo en la arena y proporciona una estimación del límite superior de su puntuación Elo, ayudando a comprender la competitividad potencial del modelo.
Modelo: Nombre del modelo de lenguaje grande (LLM). Algunos nombres de modelos pueden incluir enlaces relacionados.
Puntuación: Puntuación Elo obtenida por el modelo en la arena a través de votos de usuarios. La puntuación Elo es un sistema de clasificación relativo, donde una puntuación más alta indica un mejor rendimiento del modelo.
Intervalo de confianza del 95% (±): Intervalo de confianza del 95% de la puntuación Elo del modelo (por ejemplo:
±6
). Cuanto más pequeño sea este intervalo, más estable y confiable será la puntuación del modelo.Votos: Número total de votos recibidos por este modelo en la arena. Generalmente, cuanto más votos, mayor será la fiabilidad estadística de su puntuación.
Organización/Empresa: Organización o empresa que proporciona el modelo.
Licencia: Tipo de licencia del modelo, por ejemplo, Propietaria, Apache 2.0, MIT, etc.
Fuentes de datos y frecuencia de actualización
Los datos de esta tabla de clasificación se obtienen directamente del sitio web oficial 1 2 mediante un script automatizado. Esta tabla de clasificación se actualiza automáticamente cada día mediante GitHub Actions.
Descargo de responsabilidad
Este informe se proporciona únicamente con fines informativos. Los datos de la tabla de clasificación están en constante cambio y se basan en votos de preferencia de los usuarios en Chatbot Arena durante un período específico. La integridad y precisión de los datos dependen de la fuente de datos de origen. Diferentes modelos pueden utilizar distintos acuerdos de licencia; al utilizarlos, consulte siempre las instrucciones oficiales del proveedor del modelo.
Última actualización
¿Te fue útil?