Der aktuelle Stand von Open-Source-Sprachmodellen

xguru · 2023-08-09T11:03:01+09:00

Nach der Veröffentlichung von LLaMA 2 ist es noch heißer geworden Fast alle Open-Source-Modellgruppen aktualisieren ihre Modelle auf die neue Basis WizardLM, Airoboros, Hermes usw. Das aktuell stärkste Modell ist StabilityAIs Stable Beluga 2 Das Modell Llama2 70B wurde mit einem Orca-ähnlichen Datensatz feinabgestimmt Mit ChatGPT vergleichbar Long-Modelle LLaMA 7B 16K, LLaMA 13B 16K, LLaMA 7B 32K Kleine, aber leistungsstarke Modelle 3B-Parameter-Modelle, die so leistungsstark sind wie 7B Das Limit ist noch nicht erreicht, und es gibt noch viel Luft nach oben SlimPajama, SwiGLU, ALiBI, Variable Sequence Length, Maximal update parameterization (muP) Open-Source-Modell schlägt ChatGPT bei MMLU: llama-2-70b-guanaco-qlora Multi-Turn-Chat: llama2-13b-orca-8k-3319 Chinesische Modelle liefern sich einen Wettkampf: CodeGeex2 Haben Open-Source-Modelle das Niveau von ChatGPT erreicht? Noch nicht, aber möglicherweise bald

(twitter.com/Yampeleg)

22 Punkte von xguru 2023-08-09 | 3 Kommentare | Auf WhatsApp teilen

Nach der Veröffentlichung von LLaMA 2 ist es noch heißer geworden
- Fast alle Open-Source-Modellgruppen aktualisieren ihre Modelle auf die neue Basis
  - WizardLM, Airoboros, Hermes usw.
- Das aktuell stärkste Modell ist StabilityAIs Stable Beluga 2
  - Das Modell Llama2 70B wurde mit einem Orca-ähnlichen Datensatz feinabgestimmt
  - Mit ChatGPT vergleichbar
Long-Modelle
- LLaMA 7B 16K, LLaMA 13B 16K, LLaMA 7B 32K
Kleine, aber leistungsstarke Modelle
- 3B-Parameter-Modelle, die so leistungsstark sind wie 7B
- Das Limit ist noch nicht erreicht, und es gibt noch viel Luft nach oben
- SlimPajama, SwiGLU, ALiBI, Variable Sequence Length, Maximal update parameterization (muP)
Open-Source-Modell schlägt ChatGPT bei MMLU: llama-2-70b-guanaco-qlora
Multi-Turn-Chat: llama2-13b-orca-8k-3319
Chinesische Modelle liefern sich einen Wettkampf: CodeGeex2
Haben Open-Source-Modelle das Niveau von ChatGPT erreicht?
- Noch nicht, aber möglicherweise bald

3 Kommentare

botplaysdice 2023-08-10

Es wird wohl immer mehr Überlegungen dazu geben, wie man in der jeweiligen Rolle Geld verdienen soll, also zur Monetarisierung.

geekbini 2023-08-09

Es gibt inzwischen so viele verschiedene AI-Services, dass man echt die Qual der Wahl hat – von allgemeinen AI-Services bis hin zu speziell auf Entwickler zugeschnittenen AI-Services~

kuroneko 2023-08-09

Ich hoffe, dass sich auch koreanische Modelle weiterentwickeln.

Der aktuelle Stand von Open-Source-Sprachmodellen

Verwandte Beiträge

3 Kommentare