Meta AI veröffentlicht das Modell Code Llama 70B
(twitter.com/AIatMeta)- Ein leistungsstarkes LLM zur Codegenerierung, das auf Llama 2 basiert und mit einem auf Code spezialisierten Datensatz länger und mit mehr gesampelten Daten trainiert wurde
- Erreicht bei HumanEval 67,8 und zeigt damit unter den Open Models die beste Leistung
- Wie bei der vorherigen Lizenz ist die Nutzung sowohl für Forschungs- als auch kommerzielle Zwecke möglich
- Drei Modelle
- CodeLlama-70B
- CodeLlama-70B-Python
- CodeLlama-70B-Instruct
- Jetzt in vier Größen verfügbar: 7B/13B/34B/70B
4 Kommentare
Wenn es sich lokal auf einem M2 Max oder höher ausführen lässt, wäre es wohl das beste Spielzeug.
Quantisiert läuft es vermutlich ganz gut. Wenn man noch ein bisschen wartet, kommt es vielleicht heraus, oder?
Der obige Link ist zwar ein Link, um bei Meta Zugang anzufragen, aber auf Hugging Face ist bereits alles vollständig veröffentlicht. https://huggingface.co/codellama
Hacker-News-Kommentare
vscodegibt, die eine ähnliche Erfahrung bietet. Mit einer 4090 sollte es möglich sein, eine beachtliche Zahl an Modellen auszuführen.