- In reinem C/C++ implementiertes Stable Diffusion, mit einem Artikel über das Machine-Learning-Modell
- Auf ggml basierende Implementierung mit einer ähnlichen Funktionsweise wie llama.cpp
- Unterstützt 16-Bit- und 32-Bit-Floats sowie 4-Bit-, 5-Bit- und 8-Bit-Integer-Quantisierung
- Speicher effiziente und für CPU-Inferenz optimierte Implementierung; für die Erzeugung von 512x512-Bildern mit
txt2img werden etwa 2,3 GB benötigt
- Unterstützung für AVX, AVX2 und AVX512 auf der x86-Architektur
- Implementierung der ursprünglichen Modi
txt2img und img2img einschließlich eines Tokenizers im Stil von stable-diffusion-webui
- Verwendete Sampling-Methode ist Euler A
- Kompatible Implementierung für Linux-, Mac-OS- und Windows-Plattformen
- Zukünftige Verbesserungen umfassen mehr Sampling-Methoden, GPU-Unterstützung, schnellere Inferenz, geringeren Speicherverbrauch, LoRA-Support, k-quants-Unterstützung und plattformübergreifende Reproduzierbarkeit
- Artikel bietet detaillierte Anleitungen zum Beschaffen des Codes, zur Konvertierung der Gewichte, zum Build und zur Ausführung der Implementierung
- Implementierung unterstützt verschiedene Ausgabe-Modellformate, darunter 16-Bit-Gleitkommazahlen, 32-Bit-Gleitkommazahlen und verschiedene Integer-Quantisierungen
- Artikel enthält Nutzungsbeispiele für die Implementierung in den Modi
txt2img und img2img
- Speicher- und Festplattenanforderungen variieren je nach verwendeter Präzision, liegen für 512x512-Bilder jedoch beim Speicherbedarf ungefähr zwischen 2,0 GB und 2,8 GB
- Implementierung basiert auf mehreren Referenzen, darunter ggml, stable-diffusion, stable-diffusion-webui und k-diffusion
Noch keine Kommentare.