19 Punkte von xguru 2023-07-19 | 3 Kommentare | Auf WhatsApp teilen
  • Open-Source-Großsprachmodell, das sowohl für Forschung als auch für kommerzielle Zwecke genutzt werden kann
  • Mit 2 Billionen Token trainiert, 40 % mehr Daten als bei Llama 1
  • Doppelte Kontextlänge: 4096
  • Drei Modellgrößen: 7B, 13B, 70B
  • Hervorragende Leistung gegenüber anderen Open-Source-Sprachmodellen in vielen Benchmarks wie Inferenz, Coding, Kompetenz und Wissenstests (MPT, Falcon, Llama-1)
  • Mit öffentlich verfügbaren Datenquellen trainiert; das feinabgestimmte Llama-2-chat nutzt ebenfalls öffentliche Instruction-Sets und mehr als eine Million menschliche Annotationen
  • Im Download enthalten
    • Model code
    • Model Weights
    • README (User Guide)
    • Responsible Use Guide
    • License
    • Acceptable Use Policy
    • Model Card

3 Kommentare

 
kuroneko 2023-07-19

Wird diesmal wieder jemand zu angeblich „gemeinnützigen“ Zwecken einen Torrent-Magnet-Link veröffentlichen?

 
tpdns90321 2023-07-19

Diesmal musste man das nicht tun und es wurde direkt veröffentlicht.

 
xguru 2023-07-19

Je nach Bereich gibt es Unterschiede, aber die Bewertungen fallen so aus, dass es fast an GPT-3.5 heranreicht oder sogar besser ist.

Es wirkt wie vollständig Open Source, aber es gibt eine wichtige Einschränkung. Bei einem „Service mit mehr als 700 Millionen MAU“ muss eine Lizenz bei Meta beantragt werden, und Meta kann diese ablehnen.

Scheint also so etwas wie: „Google, TikTok, ihr benutzt das besser nicht!“ zu sein.

Microsoft hat schnell reagiert und Llama 2 zur Nutzung auf Azure verfügbar gemacht.
https://blogs.microsoft.com/blog/2023/…

Microsoft scheint also sowohl mit OpenAI als auch mit Meta gute Beziehungen zu pflegen.