22 Punkte von xguru 2023-08-09 | 3 Kommentare | Auf WhatsApp teilen
  • Nach der Veröffentlichung von LLaMA 2 ist es noch heißer geworden
    • Fast alle Open-Source-Modellgruppen aktualisieren ihre Modelle auf die neue Basis
      • WizardLM, Airoboros, Hermes usw.
    • Das aktuell stärkste Modell ist StabilityAIs Stable Beluga 2
      • Das Modell Llama2 70B wurde mit einem Orca-ähnlichen Datensatz feinabgestimmt
      • Mit ChatGPT vergleichbar
  • Long-Modelle
    • LLaMA 7B 16K, LLaMA 13B 16K, LLaMA 7B 32K
  • Kleine, aber leistungsstarke Modelle
    • 3B-Parameter-Modelle, die so leistungsstark sind wie 7B
    • Das Limit ist noch nicht erreicht, und es gibt noch viel Luft nach oben
    • SlimPajama, SwiGLU, ALiBI, Variable Sequence Length, Maximal update parameterization (muP)
  • Open-Source-Modell schlägt ChatGPT bei MMLU: llama-2-70b-guanaco-qlora
  • Multi-Turn-Chat: llama2-13b-orca-8k-3319
  • Chinesische Modelle liefern sich einen Wettkampf: CodeGeex2
  • Haben Open-Source-Modelle das Niveau von ChatGPT erreicht?
    • Noch nicht, aber möglicherweise bald

3 Kommentare

 
botplaysdice 2023-08-10

Es wird wohl immer mehr Überlegungen dazu geben, wie man in der jeweiligen Rolle Geld verdienen soll, also zur Monetarisierung.

 
geekbini 2023-08-09

Es gibt inzwischen so viele verschiedene AI-Services, dass man echt die Qual der Wahl hat – von allgemeinen AI-Services bis hin zu speziell auf Entwickler zugeschnittenen AI-Services~

 
kuroneko 2023-08-09

Ich hoffe, dass sich auch koreanische Modelle weiterentwickeln.