所有页面
由 GitBook 提供支持
1 / 1

Classement des modèles

Ce document a été traducido del chino por IA y aún no ha sido revisado.

Ceci est un classement généré automatiquement à partir des données de Chatbot Arena (lmarena.ai).

Dernière mise à jour des données : 2025-07-15 11:44:08 UTC / 2025-07-15 19:44:08 CST (heure de Pékin)

Cliquez sur le nom du modèle dans le classement pour accéder à sa page de détails ou d'essai.

Classement

Rang (UB)
Rang (StyleCtrl)
Nom du modèle
Score
Intervalle de confiance
Votes
Fournisseur
Licence
Date de fin de connaissances

1

1

Gemini-2.5-Pro

1477

+5/-5

15,769

Google

Proprietary

N/A

... [le reste du tableau est conservé identique]

Explications

  • Rang (UB) : Classement basé sur le modèle Bradley-Terry. Ce classement reflète la performance globale des modèles dans l'arène et fournit une estimation supérieure du score Elo, aidant à comprendre leur potentiel compétitif.

  • Rang (StyleCtrl) : Classement après contrôle des styles conversationnels. Cherche à réduire les préférences biaisées par le style des réponses (longueur, concision), évaluant plus fidèlement les capacités fondamentales.

  • Nom du modèle : Nom du modèle de langage (LLM). Contient des liens cliquables vers des ressources associées.

  • Score : Score Elo des modèles obtenu via les votes des utilisateurs dans l'arène. Plus le score est élevé, meilleure est la performance. Évolue dynamiquement.

  • Intervalle de confiance : Intervalle de confiance à 95% du score Elo (ex : +6/-6). Plus l'intervalle est étroit, plus le score est fiable.

  • Votes : Nombre total de votes reçus par le modèle. Plus le volume augmente, plus la fiabilité statistique s'améliore.

  • Fournisseur : Organisation ou entreprise proposant le modèle.

  • Licence : Type de licence (ex : Propriétaire, Apache 2.0, MIT).

  • Date de fin de connaissances : Limite temporelle des données d'entraînement. N/A signifie informations non fournies.

Sources et fréquence de mise à jour

Ces données sont générées automatiquement par le projet fboulnois/llm-leaderboard-csv, qui collecte et traite les données depuis lmarena.ai. Ce classement est mis à jour quotidiennement via GitHub Actions.

Clause de non-responsabilité

Ce rapport est à titre informatif uniquement. Les données du classement évoluent dynamiquement et sont basées sur les préférences des utilisateurs dans Chatbot Arena pendant une période spécifique. L'exhaustivité et l'exactitude dépendent des sources amont et du traitement par fboulnois/llm-leaderboard-csv. Les modèles utilisent différentes licences - consultez toujours les directives officielles des fournisseurs.