13 Punkte von xguru 2023-04-03 | 1 Kommentare | Auf WhatsApp teilen
  • Durch eine Änderung des Dateiformats ist mmap() nun ohne read() möglich, wodurch das Laden der Gewichte 10- bis 100-mal schneller wird
  • Unterstützt werden jetzt sowohl die Single-File-Variante 7B als auch die Multi-File-Variante 13B, und der Ladecode ist deutlich einfacher geworden
  • Außerdem sind durch diese Änderung die Tensoren an 32-Byte-Grenzen ausgerichtet, was auf bestimmten Prozessoren zusätzliche Leistungsverbesserungen ermöglichen kann