- Nach der Veröffentlichung von LLaMA 2 ist es noch heißer geworden
- Fast alle Open-Source-Modellgruppen aktualisieren ihre Modelle auf die neue Basis
- WizardLM, Airoboros, Hermes usw.
- Das aktuell stärkste Modell ist StabilityAIs Stable Beluga 2
- Das Modell Llama2 70B wurde mit einem Orca-ähnlichen Datensatz feinabgestimmt
- Mit ChatGPT vergleichbar
- Long-Modelle
- LLaMA 7B 16K, LLaMA 13B 16K, LLaMA 7B 32K
- Kleine, aber leistungsstarke Modelle
- 3B-Parameter-Modelle, die so leistungsstark sind wie 7B
- Das Limit ist noch nicht erreicht, und es gibt noch viel Luft nach oben
- SlimPajama, SwiGLU, ALiBI, Variable Sequence Length, Maximal update parameterization (muP)
- Open-Source-Modell schlägt ChatGPT bei MMLU: llama-2-70b-guanaco-qlora
- Multi-Turn-Chat: llama2-13b-orca-8k-3319
- Chinesische Modelle liefern sich einen Wettkampf: CodeGeex2
- Haben Open-Source-Modelle das Niveau von ChatGPT erreicht?
- Noch nicht, aber möglicherweise bald
3 Kommentare
Es wird wohl immer mehr Überlegungen dazu geben, wie man in der jeweiligen Rolle Geld verdienen soll, also zur Monetarisierung.
Es gibt inzwischen so viele verschiedene AI-Services, dass man echt die Qual der Wahl hat – von allgemeinen AI-Services bis hin zu speziell auf Entwickler zugeschnittenen AI-Services~
Ich hoffe, dass sich auch koreanische Modelle weiterentwickeln.