Yi – Open-Source-LLM der nächsten Generation mit Zweisprachigkeit
(github.com/01-ai)- Open-Source-LLM der nächsten Generation, das von Entwicklern von Grund auf trainiert wurde
- Als zweisprachiges Modell konzipiert und mit einem mehrsprachigen 3T-Korpus trainiert; zeigt starke Leistung bei Sprachverständnis, Common-Sense-Reasoning und Leseverständnis
- Basierend auf den vortrainierten Sprachmodellen 6B und 34B; erweitert um Chatbot-Modelle, Langkontext-Modelle mit 200K, Deep-Upscaling-Modelle und Vision-Language-Modelle
- Das Modell Yi-34B-Chat
- belegt im AlpacaEval-Leaderboard hinter GPT-4 Turbo den 2. Platz und übertrifft andere LLMs
- übertrifft bestehende Open-Source-Modelle sowohl in Englisch als auch in Chinesisch und erreicht in verschiedenen Benchmarks den 1. Platz
- Verwendet dieselbe Modellarchitektur wie Llama, ist aber kein von Llama abgeleitetes Modell. Nutzt keine Llama-Gewichte
- In verschiedenen Größen verfügbar; Modelle können für spezifische Anforderungen feinabgestimmt werden
- Chat-Modelle
- Yi-34B-Chat, Yi-34B-Chat-4bits, Yi-34B-Chat-8bits
- Yi-6B-Chat, Yi-6B-Chat-4bits, Yi-6B-Chat-8bits
- Basis-Modelle
- Yi-34B, Yi-34B-200K
- Yi-9B
- Yi-6B, Yi-6B-200K
- Chat-Modelle
1 Kommentare
Hacker-News-Kommentare