- Open-Source-Großsprachmodell, das sowohl für Forschung als auch kommerziell genutzt werden kann
- Mit 2 Billionen Token trainiert, 40 % mehr Daten als bei Llama 1
- Doppelte Kontextlänge: 4096
- Drei Modellgrößen: 7B, 13B, 70B
- Hervorragende Leistung gegenüber anderen Open-Source-Sprachmodellen in vielen Benchmarks für Schlussfolgern, Coding, Kompetenz und Wissenstests (MPT, Falcon, Llama-1)
- Mit öffentlich verfügbaren Datenquellen trainiert; das feinabgestimmte Llama-2-chat nutzt ebenfalls öffentliche Instruction-Sets und mehr als eine Million menschliche Annotationen
- Einsatz von Reinforcement Learning from Human Feedback (RLHF). Einschließlich Rejection Sampling und Proximal Policy Optimization (PPO)
- Im Download enthalten
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card
1 Kommentare
Hacker-News-Meinungen