10 Punkte von xguru 2023-07-31 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Basierend auf dem AlpacaEval Leaderboard zur automatischen Bewertung von Instruction-Following-Sprachmodellen
  • GPT-4 95.28% > Llama Chat 70B 92.66% > Claude 2 91.36% > ChatGPT 89.37%
  • AlpacaEval führt die automatische Bewertung durch, indem es das AlpacaFarm-Evaluierungsset verwendet und die Antworten mit den von GPT-4 erzeugten Antworten vergleicht

Noch keine Kommentare.

Noch keine Kommentare.