4 Punkte von frida 2024-07-01 | 2 Kommentare | Auf WhatsApp teilen

2 Kommentare

 
frida 2024-07-02

Um ein koreanisches LLM mit langer Kontextlänge zu verwenden, wurden verschiedene Methoden untersucht und ausprobiert, um die Kontextlänge eines LLM effizient zu erweitern.

  1. LongLoRA
    Erweiterung um das Achtfache durch die Nutzung von shifted sparse attention und LoRA-Finetuning

  2. Rope-based Position Interpolation
    Kann auf Modelle angewendet werden, die RoPE-basierte Embeddings wie Llama verwenden, indem die RoPE-Embeddings angepasst werden; durch Finetuning lässt sich die Kontextlänge auf das 16-Fache erweitern

  3. Dynamic NTK
    Erweiterung um mehr als das Doppelte durch Anwendung der NTK-Theorie ohne Finetuning

  4. LongLM
    Erweiterung auf das Vierfache ohne Finetuning durch den Einsatz modifizierter Attention

  5. ChunkLlama
    Erweitert die Kontextlänge des Llama-Modells ohne Finetuning auf das Vierfache, indem der Text in Chunks zerlegt wird

  6. Infini-attention
    Mit geringem zusätzlichem Speicherbedarf auf bis zu 2M erweiterbar und schnelle Inferenz möglich; die in Gemini-Pro verwendete Methode

 
superwoou 2024-07-02

Einen Artikel ganz ohne jede Zusammenfassung sehe ich auch zum ersten Mal.