Meta veröffentlicht Llama 2, sein Sprachmodell der nächsten Generation

xguru · 2023-07-19T10:02:01+09:00

Open-Source-Großsprachmodell, das sowohl für Forschung als auch für kommerzielle Zwecke genutzt werden kann Mit 2 Billionen Token trainiert, 40 % mehr Daten als bei Llama 1 Doppelte Kontextlänge: 4096 Drei Modellgrößen: 7B, 13B, 70B Hervorragende Leistung gegenüber anderen Open-Source-Sprachmodellen in vielen Benchmarks wie Inferenz, Coding, Kompetenz und Wissenstests (MPT, Falcon, Llama-1) Mit öffentlich verfügbaren Datenquellen trainiert; das feinabgestimmte Llama-2-chat nutzt ebenfalls öffentliche Instruction-Sets und mehr als eine Million menschliche Annotationen Im Download enthalten Model code Model Weights README (User Guide) Responsible Use Guide License Acceptable Use Policy Model Card

(ai.meta.com)

19 Punkte von xguru 2023-07-19 | 3 Kommentare | Auf WhatsApp teilen

Open-Source-Großsprachmodell, das sowohl für Forschung als auch für kommerzielle Zwecke genutzt werden kann
Mit 2 Billionen Token trainiert, 40 % mehr Daten als bei Llama 1
Doppelte Kontextlänge: 4096
Drei Modellgrößen: 7B, 13B, 70B
Hervorragende Leistung gegenüber anderen Open-Source-Sprachmodellen in vielen Benchmarks wie Inferenz, Coding, Kompetenz und Wissenstests (MPT, Falcon, Llama-1)
Mit öffentlich verfügbaren Datenquellen trainiert; das feinabgestimmte Llama-2-chat nutzt ebenfalls öffentliche Instruction-Sets und mehr als eine Million menschliche Annotationen
Im Download enthalten
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card

3 Kommentare

kuroneko 2023-07-19

Wird diesmal wieder jemand zu angeblich „gemeinnützigen“ Zwecken einen Torrent-Magnet-Link veröffentlichen?

tpdns90321 2023-07-19

Diesmal musste man das nicht tun und es wurde direkt veröffentlicht.

xguru 2023-07-19

Je nach Bereich gibt es Unterschiede, aber die Bewertungen fallen so aus, dass es fast an GPT-3.5 heranreicht oder sogar besser ist.

Es wirkt wie vollständig Open Source, aber es gibt eine wichtige Einschränkung. Bei einem „Service mit mehr als 700 Millionen MAU“ muss eine Lizenz bei Meta beantragt werden, und Meta kann diese ablehnen.

Scheint also so etwas wie: „Google, TikTok, ihr benutzt das besser nicht!“ zu sein.

Microsoft hat schnell reagiert und Llama 2 zur Nutzung auf Azure verfügbar gemacht.
https://blogs.microsoft.com/blog/2023/…

Microsoft scheint also sowohl mit OpenAI als auch mit Meta gute Beziehungen zu pflegen.

Meta veröffentlicht Llama 2, sein Sprachmodell der nächsten Generation

Verwandte Beiträge

3 Kommentare