MPT-7B, ein kommerziell nutzbares Open-Source-LLM

xguru · 2023-05-09T09:41:02+09:00

Ein Transformer, der mit 1 Billion Tokens trainiert wurde Ähnliche Qualität wie LLaMA-7B, aber Open Source und kommerziell nutzbar Zusätzlich wurden drei Fine-Tuning-Modelle veröffentlicht MPT-7B-Instruct, MPT-7B-Chat, MPT-7B-StoryWriter-65K+ (unterstützt 65K Tokens) Wurde auf der MosaicML-Plattform in 9,5 Tagen zu Kosten von etwa ~$200K trainiert; es ist möglich, eigene MPT-Modelle zu trainieren, feinzujustieren und zu deployen MPT: Mosaic Pretrained Transformers

(mosaicml.com)

14 Punkte von xguru 2023-05-09 | 2 Kommentare | Auf WhatsApp teilen

Ein Transformer, der mit 1 Billion Tokens trainiert wurde
Ähnliche Qualität wie LLaMA-7B, aber Open Source und kommerziell nutzbar
Zusätzlich wurden drei Fine-Tuning-Modelle veröffentlicht
- MPT-7B-Instruct, MPT-7B-Chat, MPT-7B-StoryWriter-65K+ (unterstützt 65K Tokens)
Wurde auf der MosaicML-Plattform in 9,5 Tagen zu Kosten von etwa ~$200K trainiert; es ist möglich, eigene MPT-Modelle zu trainieren, feinzujustieren und zu deployen
MPT: Mosaic Pretrained Transformers

2 Kommentare

kuroneko 2023-05-09

Wenn man sieht, wie derzeit unglaublich viele Open-Source-LLM-Modelle erscheinen, die kommerziell genutzt werden können,
wirkt es so, als würden sie darum konkurrieren, das Stable Diffusion der LLM-Welt zu werden.

Ich bin gespannt, wer am Ende als Sieger hervorgeht. +_+

xguru 2023-05-09

Ich denke, es ist eine gute Alternative, zunächst die Entwicklung mit ChatGPT durchzuführen und später auf das am weitesten fortgeschrittene Open-Source-Modell umzusteigen.

MPT-7B, ein kommerziell nutzbares Open-Source-LLM

Verwandte Beiträge

2 Kommentare