Guanaco - $1M (130 Mio. KRW) LLM-Fine-Tuning-Wettbewerb

xguru · 2023-05-11T10:03:02+09:00

Weltweit die erste offene Community-Challenge, bei der Nutzer hochgeladene Modelle bewerten Start von Season 1, Episode 1 am 10. Juni, mit Preisgeldern von $250k über 12 Wochen Wettbewerbsformat Das Chai Reward Model (GPT-2), das direkt mit 170 Mio. nutzergenerierten Signalen trainiert wurde, wird als Open Source veröffentlicht Dieses Modell kann für die Offline-Evaluierung verwendet oder als Teil einer RLHF-Pipeline integriert werden Da das Training von Sprachmodellen teuer ist, sollen verschiedene Basismodelle getestet werden, damit jeder am Wettbewerb teilnehmen kann Für hochgeladene Modelle wird mit einem internen AI-Safety-Classifier geprüft, ob sie bereitstellbar sind, und sie werden für A/B-Tests mit Nutzern veröffentlicht Bewertung durch mehr als etwa 1 Mio. reale Nutzer

Weltweit die erste offene Community-Challenge, bei der Nutzer hochgeladene Modelle bewerten
Start von Season 1, Episode 1 am 10. Juni, mit Preisgeldern von $250k über 12 Wochen
Wettbewerbsformat
- Das Chai Reward Model (GPT-2), das direkt mit 170 Mio. nutzergenerierten Signalen trainiert wurde, wird als Open Source veröffentlicht
- Dieses Modell kann für die Offline-Evaluierung verwendet oder als Teil einer RLHF-Pipeline integriert werden
- Da das Training von Sprachmodellen teuer ist, sollen verschiedene Basismodelle getestet werden, damit jeder am Wettbewerb teilnehmen kann
- Für hochgeladene Modelle wird mit einem internen AI-Safety-Classifier geprüft, ob sie bereitstellbar sind, und sie werden für A/B-Tests mit Nutzern veröffentlicht
- Bewertung durch mehr als etwa 1 Mio. reale Nutzer

Guanaco - $1M (130 Mio. KRW) LLM-Fine-Tuning-Wettbewerb

Verwandte Beiträge

1 Kommentare