Κατάταξη μοντέλων
Αυτό το έγγραφο μεταφράστηκε από τα Κινεζικά με AI και δεν έχει ακόμη ελεγχθεί.
Αυτός είναι ένας πίνακας κατάταξης βασισμένος σε δεδομένα από το Chatbot Arena (lmarena.ai), δημιουργημένος μέσω αυτοματοποιημένης διαδικασίας.
Χρονική στιγμή ενημέρωσης δεδομένων: 2025-11-14 08:07:48 UTC / 2025-11-14 16:07:48 CST (Ώρα Πεκίνου)
Πίνακας Κατάταξης
Επεξήγηση
Κατάταξη (UB): Βασισμένη σε υπολογισμούς του μοντέλου Bradley-Terry. Η κατάταξη αυτή αντικατοπτρίζει τη συνολική επίδοση του μοντέλου στο Arena και παρέχει μια εκτίμηση του άνω ορίου της βαθμολογίας Elo του, βοηθώντας στην κατανόηση της δυνητικής ανταγωνιστικότητας του μοντέλου.
Μοντέλο: Το όνομα του μεγάλου γλωσσικού μοντέλου (LLM). Τα ονόματα ορισμένων μοντέλων ενδέχεται να περιέχουν σχετικούς συνδέσμους.
Βαθμολογία: Η βαθμολογία Elo του μοντέλου στο Arena, που λαμβάνεται μέσω ψήφων χρηστών. Η βαθμολογία Elo είναι ένα σχετικό σύστημα κατάταξης, όπου υψηλότερη βαθμολογία υποδηλώνει καλύτερη επίδοση.
Διάστημα εμπιστοσύνης 95% (±): Το 95% διάστημα εμπιστοσύνης της βαθμολογίας Elo του μοντέλου (π.χ.:
±6). Όσο μικρότερο είναι το διάστημα, τόσο πιο σταθερή και αξιόπιστη είναι η βαθμολογία του μοντέλου.Ψήφοι: Ο συνολικός αριθμός ψήφων που έλαβε το μοντέλο στο Arena. Όσο περισσότερες οι ψήφοι, τόσο μεγαλύτερη η στατιστική αξιοπιστία της βαθμολογίας.
Οργάνωση/Εταιρεία: Η οργάνωση ή εταιρεία που παρέχει το μοντέλο.
Άδεια: Ο τύπος της άδειας χρήσης του μοντέλου, π.χ. ιδιόκτητο (Proprietary), Apache 2.0, MIT κ.λπ.
Πηγές Δεδομένων & Συχνότητα Ενημέρωσης
Τα δεδομένα αυτού του πίνακα κατάταξης λαμβάνονται αυτοματοποιημένα από το επίσημο ιστοσελίδα 1 2. Αυτός ο πίνακας ενημερώνεται αυτόματα καθημερινά από το GitHub Actions.
Αποποίηση Ευθυνών
Αυτή η αναφορά παρέχεται για ενημερωτικούς σκοπούς μόνο. Τα δεδομένα του πίνακα κατάταξης είναι δυναμικά μεταβαλλόμενα και βασίζονται σε ψήφους προτιμήσεων χρηστών στο Chatbot Arena κατά συγκεκριμένη χρονική περίοδο. Η πληρότητα και η ακρίβεια των δεδομένων εξαρτάται από την πηγή των αρχικών δεδομένων. Διαφορετικά μοντέλα ενδέχεται να χρησιμοποιούν διαφορετικές άδειες χρήσης· κατά τη χρήση, παρακαλούμε να αναφέρεστε πάντα στις επίσημες οδηγίες του παρόχου του μοντέλου.
Last updated
Was this helpful?