OpenLLaMA - Das offene Replikat von LLaMA

xguru · 2023-05-05T10:16:01+09:00

Ein Replikat von LLaMA, das unter der Apache-Lizenz erstellt wurde, damit es für verschiedene Zwecke genutzt werden kann Nutzt den von Together veröffentlichten RedPajama-Datensatz Trainiert über EasyLM, eine auf JAX basierende Pipeline OpenLLAMA 7B auf Basis von 200B/300B Tokens veröffentlicht

(github.com/openlm-research)

20 Punkte von xguru 2023-05-05 | 1 Kommentare | Auf WhatsApp teilen

Ein Replikat von LLaMA, das unter der Apache-Lizenz erstellt wurde, damit es für verschiedene Zwecke genutzt werden kann
Nutzt den von Together veröffentlichten RedPajama-Datensatz
Trainiert über EasyLM, eine auf JAX basierende Pipeline
OpenLLAMA 7B auf Basis von 200B/300B Tokens veröffentlicht

1 Kommentare

xguru 2023-05-05

In den HN-Kommentaren hat jemand den Befehl zum „Verwenden von OpenLLaMA mit llama.cpp + 8 GB RAM“ gepostet.
https://news.ycombinator.com/item?id=35798888

  git clone https://github.com/ggerganov/llama.cpp && cd llama.cpp && cmake -B build && cmake --build build  
  python3 -m pip install -r requirements.txt  
  
  cd models && git clone https://huggingface.co/openlm-research/open_llama_7b_preview_200bt/ && cd -  
  python3 convert-pth-to-ggml.py models/open_llama_7b_preview_200bt/open_llama_7b_preview_200bt_transformers_weights 1  
  ./build/bin/quantize models/open_llama_7b_preview_200bt/open_llama_7b_preview_200bt_transformers_weights/ggml-model-f16.bin models/open_llama_7b_preview_200bt_q5_0.ggml q5_0  
  ./build/bin/main -m models/open_llama_7b_preview_200bt_q5_0.ggml --ignore-eos -n 1280 -p "Building a website can be done in 10 simple steps:" --mlock

OpenLLaMA - Das offene Replikat von LLaMA

Verwandte Beiträge

1 Kommentare