3 Punkte von GN⁺ 2023-08-21 | Noch keine Kommentare. | Auf WhatsApp teilen
  • In reinem C/C++ implementiertes Stable Diffusion, mit einem Artikel über das Machine-Learning-Modell
  • Auf ggml basierende Implementierung mit einer ähnlichen Funktionsweise wie llama.cpp
  • Unterstützt 16-Bit- und 32-Bit-Floats sowie 4-Bit-, 5-Bit- und 8-Bit-Integer-Quantisierung
  • Speicher effiziente und für CPU-Inferenz optimierte Implementierung; für die Erzeugung von 512x512-Bildern mit txt2img werden etwa 2,3 GB benötigt
  • Unterstützung für AVX, AVX2 und AVX512 auf der x86-Architektur
  • Implementierung der ursprünglichen Modi txt2img und img2img einschließlich eines Tokenizers im Stil von stable-diffusion-webui
  • Verwendete Sampling-Methode ist Euler A
  • Kompatible Implementierung für Linux-, Mac-OS- und Windows-Plattformen
  • Zukünftige Verbesserungen umfassen mehr Sampling-Methoden, GPU-Unterstützung, schnellere Inferenz, geringeren Speicherverbrauch, LoRA-Support, k-quants-Unterstützung und plattformübergreifende Reproduzierbarkeit
  • Artikel bietet detaillierte Anleitungen zum Beschaffen des Codes, zur Konvertierung der Gewichte, zum Build und zur Ausführung der Implementierung
  • Implementierung unterstützt verschiedene Ausgabe-Modellformate, darunter 16-Bit-Gleitkommazahlen, 32-Bit-Gleitkommazahlen und verschiedene Integer-Quantisierungen
  • Artikel enthält Nutzungsbeispiele für die Implementierung in den Modi txt2img und img2img
  • Speicher- und Festplattenanforderungen variieren je nach verwendeter Präzision, liegen für 512x512-Bilder jedoch beim Speicherbedarf ungefähr zwischen 2,0 GB und 2,8 GB
  • Implementierung basiert auf mehreren Referenzen, darunter ggml, stable-diffusion, stable-diffusion-webui und k-diffusion

Noch keine Kommentare.

Noch keine Kommentare.