Ce document a été traducido del chino por IA y aún no ha sido revisado.
Ceci est un classement généré automatiquement à partir des données de Chatbot Arena (lmarena.ai).
Dernière mise à jour des données : 2025-07-15 11:44:08 UTC / 2025-07-15 19:44:08 CST (heure de Pékin)
... [le reste du tableau est conservé identique]
Rang (UB) : Classement basé sur le modèle Bradley-Terry. Ce classement reflète la performance globale des modèles dans l'arène et fournit une estimation supérieure du score Elo, aidant à comprendre leur potentiel compétitif.
Rang (StyleCtrl) : Classement après contrôle des styles conversationnels. Cherche à réduire les préférences biaisées par le style des réponses (longueur, concision), évaluant plus fidèlement les capacités fondamentales.
Nom du modèle : Nom du modèle de langage (LLM). Contient des liens cliquables vers des ressources associées.
Score : Score Elo des modèles obtenu via les votes des utilisateurs dans l'arène. Plus le score est élevé, meilleure est la performance. Évolue dynamiquement.
Intervalle de confiance : Intervalle de confiance à 95% du score Elo (ex : +6/-6
). Plus l'intervalle est étroit, plus le score est fiable.
Votes : Nombre total de votes reçus par le modèle. Plus le volume augmente, plus la fiabilité statistique s'améliore.
Fournisseur : Organisation ou entreprise proposant le modèle.
Licence : Type de licence (ex : Propriétaire, Apache 2.0, MIT).
Date de fin de connaissances : Limite temporelle des données d'entraînement. N/A signifie informations non fournies.
Ces données sont générées automatiquement par le projet fboulnois/llm-leaderboard-csv, qui collecte et traite les données depuis lmarena.ai. Ce classement est mis à jour quotidiennement via GitHub Actions.
Ce rapport est à titre informatif uniquement. Les données du classement évoluent dynamiquement et sont basées sur les préférences des utilisateurs dans Chatbot Arena pendant une période spécifique. L'exhaustivité et l'exactitude dépendent des sources amont et du traitement par fboulnois/llm-leaderboard-csv
. Les modèles utilisent différentes licences - consultez toujours les directives officielles des fournisseurs.