3 Punkte von mscheong01 2024-04-22 | Noch keine Kommentare. | Auf WhatsApp teilen

Ein einfacher in C implementierter Inferenz-Code für Speculative Decoding.
Wie llama2.c, auf dem er basiert, wurde er als einfacher Code zu Lernzwecken geschrieben.
Als Nächstes ist geplant, einige aktuellere Papers zu implementieren.

Noch keine Kommentare.

Noch keine Kommentare.