Für die Ausführung eines LLM mit 1 Milliarde Parametern genügen 13 Watt – also die Leistung einer Glühbirne
(arxiv.org)https://news.ucsc.edu/2024/06/matmul-free-llm.html
Matmul-freier Algorithmus + dediziertes FPGA für maximale Effizienz
https://news.ucsc.edu/2024/06/matmul-free-llm.html
Matmul-freier Algorithmus + dediziertes FPGA für maximale Effizienz
Noch keine Kommentare.