MosaicML veröffentlicht das Modell MPT-7B-8K

xguru · 2023-07-21T10:02:02+09:00

Open-Source-LLM mit 7B Parametern und Unterstützung für eine Kontextlänge von 8k Zusätzlich zu MPT-7B mit 500B Token an Daten 3 Tage lang auf 256 NVidia H100 trainiert Drei Modelle veröffentlicht: MPT-7B-8k, MPT-7B-8k-Instruct, MPT-7B-8k-Chat Für kommerzielle Nutzung einsetzbar Unterstützt 8k Eingabe mit ALiBi (Attention with Linear Biases Enables Input Length Extrapolation) Schnelles Training und Inferenz mit FlashAttention und FasterTrasformer

(mosaicml.com)

9 Punkte von xguru 2023-07-21 | Noch keine Kommentare. | Auf WhatsApp teilen

Open-Source-LLM mit 7B Parametern und Unterstützung für eine Kontextlänge von 8k
Zusätzlich zu MPT-7B mit 500B Token an Daten 3 Tage lang auf 256 NVidia H100 trainiert
Drei Modelle veröffentlicht: MPT-7B-8k, MPT-7B-8k-Instruct, MPT-7B-8k-Chat
Für kommerzielle Nutzung einsetzbar
Unterstützt 8k Eingabe mit ALiBi (Attention with Linear Biases Enables Input Length Extrapolation)
Schnelles Training und Inferenz mit FlashAttention und FasterTrasformer

MosaicML veröffentlicht das Modell MPT-7B-8K

Verwandte Beiträge

Noch keine Kommentare.