Classement des modèles
Ce document a été traducido del chino por IA y aún no ha sido revisado.
Il s'agit d'un classement généré automatiquement à partir des données de Chatbot Arena (lmarena.ai).
Dernière mise à jour des données : 2025-07-09 11:44:37 UTC / 2025-07-09 19:44:37 CST (heure de Pékin)
Classement
Explications
Rang(UB) : Classement calculé selon le modèle Bradley-Terry. Ce classement reflète la performance globale des modèles dans l'arène et fournit une estimation de la borne supérieure de leur score Elo, aidant à comprendre leur compétitivité potentielle.
Rang(StyleCtrl) : Classement après contrôle du style conversationnel. Ce classement vise à réduire les biais de préférence dus au style de réponse des modèles (par exemple, verbosité ou concision), évaluant plus purement leurs capacités fondamentales.
Nom du modèle : Nom du grand modèle de langage (LLM). Cette colonne contient des liens vers les modèles correspondants.
Score : Score Elo obtenu par le modèle via les votes des utilisateurs dans l'arène. Le score Elo est un système de classement relatif où un score plus élevé indique une meilleure performance. Ce score est dynamique et reflète la force relative du modèle dans l'environnement concurrentiel actuel.
Intervalle de confiance : Intervalle de confiance à 95% du score Elo du modèle (par exemple :
+6/-6
). Plus cet intervalle est petit, plus le score du modèle est stable et fiable ; inversement, un intervalle plus large peut indiquer des données insuffisantes ou une performance fluctuante. Il fournit une évaluation quantitative de la précision du score.Votes : Nombre total de votes reçus par le modèle dans l'arène. Plus le nombre de votes est élevé, plus la fiabilité statistique du score est généralement élevée.
Fournisseur : Organisation ou entreprise fournissant le modèle.
Licence : Type de licence du modèle, par exemple propriétaire (Proprietary), Apache 2.0, MIT, etc.
Date de mise à jour des connaissances : Date de fin des données d'entraînement du modèle. Données non disponibles signifie que les informations ne sont pas fournies ou inconnues.
Source des données et fréquence de mise à jour
Ce classement est généré automatiquement et fourni par le projet fboulnois/llm-leaderboard-csv, qui récupère et traite les données de lmarena.ai. Ce classement est mis à jour quotidiennement par GitHub Actions.
Clause de non-responsabilité
Ce rapport est fourni à titre informatif uniquement. Les données du classement sont dynamiques et basées sur les votes de préférence des utilisateurs dans Chatbot Arena pendant une période spécifique. L'exhaustivité et l'exactitude des données dépendent des sources en amont et des mises à jour/traitements du projet fboulnois/llm-leaderboard-csv
. Différents modèles peuvent utiliser différentes licences - veuillez consulter les instructions officielles des fournisseurs de modèles avant toute utilisation.
最后更新于
这有帮助吗?