Easy Stable Diffusion XL, offline auf dem Gerät nutzbar
(noiselith.com)Einführung in die Noiselith-App
- Tool zur Offline-Bilderzeugung: Noiselith ermöglicht es, frei Bilder direkt auf dem Gerät zu erzeugen – ganz ohne Cloud.
- Datenschutz: Sämtliche Generierungsvorgänge finden lokal statt, und es werden keine Informationen an die Cloud übertragen.
- Unbegrenzte Generierung: Bietet eine unbegrenzte Generierungsfunktion, mit der sich pro Tag 100, 200 oder sogar 1000 Bilder erzeugen lassen.
- Geschwindigkeit: Bilder können sofort auf dem Gerät erzeugt werden, ohne auf Serverressourcen warten zu müssen.
Systemanforderungen
- Windows: Windows 10 oder 11, NVIDIA-RTX-20-Serie oder neuere GPU (mindestens 8 GB VRAM), mindestens 16 GB RAM und mindestens 20 GB Speicherplatz erforderlich.
- macOS: macOS 12.3 oder neuer, Apple Silicon, mindestens 32 GB RAM und mindestens 20 GB Speicherplatz erforderlich.
Nutzererfahrung
- Einfache Installation: Mit nur wenigen Klicks ist Noiselith einsatzbereit.
- Intuitive Nutzung: Bietet eine intuitive Oberfläche, mit der sich Ideen visuell umsetzen lassen, ohne sich um technische Details kümmern zu müssen.
- Modellverwaltung: Modelle lassen sich einfach herunterladen, löschen und aktualisieren; außerdem gibt es eine Galerie, die erzeugte Bilder elegant organisiert.
Entwicklungs-Roadmap
- Unterstützung für verschiedene Funktionen: Geplant sind Unterstützung für SDXL-Modelle, SDXL LoRA, Verlaufsverwaltung, Projektverwaltung und Modellverwaltung.
- Community und Erweiterbarkeit: Enthält Funktionen wie eine Nutzer-Community, Unterstützung für SD-1.5- und 2.1-Modelle, eine Modelldatenbank, Upscaler und Smart Prompts.
- Noiselith App Store: Geplant ist die Entwicklung eines App Stores mit Cloud-GPU- und Remote-Collaboration-Funktionen.
Meinung von GN⁺
- Das Wichtigste an diesem Artikel ist, dass die Noiselith-App ein neues Tool ist, mit dem Nutzer unbegrenzt Bilder direkt auf ihrem Gerät erzeugen können – ohne Hilfe der Cloud und unter Wahrung der Privatsphäre.
- Die App ist interessant, weil sie die Komplexität bei Installation und Nutzung von Software reduziert und mit ihrer intuitiven Oberfläche dafür sorgt, dass jeder leicht mit der Bilderzeugung beginnen und sich stärker auf kreative Arbeit konzentrieren kann.
1 Kommentare
Hacker-News-Meinungen
Habe es gerade installiert und es ist ziemlich cool. Lokale KI ist die Zukunft, die ich mir wünsche, und daran arbeite ich auch
Die Vorteile: Es funktioniert ziemlich eigenständig, der eingebaute Modell-Installer ist gut gemacht, sodass man leicht beliebige Modelle von CivitAI herunterladen kann (habe https://civitai.com/models/183354/sdxl-ms-paint-portraits installiert), die Qualität der Bildgenerierung ist hoch und stabil, und es zeigt Zwischenschritte der Generierung an
Der Nachteil ist, dass es eine 6,94-GB-SDXL-Modelldatei irgendwohin herunterlädt, ohne zu fragen und ohne Speicherort oder Größe anzuzeigen; später habe ich aber herausgefunden, dass man den Ort in den Einstellungen finden und ändern kann. Die erste Generierung ist wegen des Ladens des Modells sehr langsam, und die Generierungszeit wird zwar nicht protokolliert, scheint auf einem M1 Max MacBook mit 64 GB aber ein paar Minuten zu dauern
Es gibt mehrere Feedback-Module, daher ist der Chat unten links sehr störend und ich werde ihn wohl nie nutzen; oben rechts gibt es außerdem eine Beta-Feedback-Anfrage. Im Gegensatz zu Konkurrenzprodukten ist es nicht Open Source, es laufen 7 Prozesse, und im Idle-Zustand nutzt es etwa 1 GB RAM. Es hat keine native macOS-UX und wirkt wie eine Electron-App, weil erwartete Shortcuts oder ein Hilfemenü fehlen. Insgesamt 4/5 Punkten, und ich würde es wieder öffnen
Also ja. Es ist eine Electron-App und nutzt Svelte, headless-ui, tailwindcss usw.
Es gibt bereits ziemlich viele lokale Inferenzoptionen, und wichtig ist, dass sie Open Source sind und auch robustere Funktionen haben
Selbst wenn man hier mit „Aber Auto1111 oder Comfy haben doch keine benutzerfreundliche UI“ verteidigt: Auch das ist bereits gelöst: https://github.com/invoke-ai/InvokeAI
Man kann es auch in Boards organisieren, und Boards, Bilder und Metadaten werden alle in einer gut designten SQLite-Datenbank gespeichert, auf die man mit DataGrip zugreifen kann
Allen, die es noch nicht ausprobiert haben, empfehle ich Fooocus nachdrücklich: https://github.com/lllyasviel/Fooocus
Es gibt unglaublich viele lokale Stable-Diffusion-Pipelines, aber hier ist die Standard-Ausgabequalität schon mit kurzen Prompts überwältigend gut. Wirklich beeindruckend
Der Grund ist, dass es viele SDXL-Erweiterungsfunktionen integriert, die andere UIs nicht implementieren oder nicht standardmäßig aktivieren. Ich nutze Stable Diffusion seit 1.5 und verfolge diesen Bereich ziemlich aufmerksam, aber eine gleichwertige Pipeline in ComfyUI oder gar in diffusers einzurichten, wäre wohl eine Qual. Es fühlt sich an wie eine „Sammlung der Hits und optimalen Defaults“ für SDXL
Allerdings sieht es, wie im Nebenkommentar erwähnt, nicht gut aus, dass GTM eingebunden ist
Beispiele:
https://imgz.org/i9oicVqo/
https://imgz.org/i8Ur3WjW/
https://imgz.org/i5j6r6TZ/
Ich wünschte, unsere ganze Branche würde erkennen, dass es eine schlechte Entscheidung ist, solche Überwachung laufen zu lassen, und einfach damit aufhören
Interessant. Ich werde es mit https://diffusionbee.com vergleichen, das ich in den letzten Monaten zum Spaß genutzt habe
Fürs Marketing mag das gut sein, aber es ist seltsam, On-Device-Ausführung und Offline-Nutzung als Hauptunterscheidungsmerkmal herauszustellen. Denn die meisten nutzen Stable Diffusion vermutlich ohnehin schon so.
Besser wäre es wohl, sich stärker darauf zu konzentrieren, dass Installation und Nutzung einfach sind. Genau das klappt bisher noch nicht gut. Nach meinen Maßstäben nutze ich es nicht ohne ControlNet, Upscaling, Face-Detailer-ähnliche Funktionen und möglichst regionales Prompting.
Außerdem denke ich, dass Leute, die einen eigenen SD-Generator bauen wollen, besser zu einem der bereits existierenden Open-Source-Projekte beitragen sollten.
Ein App Store könnte eine gute Idee sein, aber in einer Welt mit Auto1111 und seinen unzähligen Erweiterungen wird das in der Stable-Diffusion-Community wohl nicht besonders gut ankommen.
Auch wenn es für bestehende Nutzer nicht attraktiv ist, kann ein einfacheres Produkt für neue Nutzer durchaus ansprechend sein.
Als ich SD zum ersten Mal ausprobiert habe, fand ich es seltsam, wie viele Pakete statt einfach ein paar Dateien herunterzuladen und auszuführen stark nach Hause telefonierten oder VMs verwendeten.
Der Verkaufs-Prompt lautet: „eine junge Frau mit blondem Lockenhaar, die vor einer Fantasy-Welt-Kulisse mit verführerischem Blick sitzt, die Beine gespreizt, in weißem Hemd und Jeans-Hotpants“
Da fragt man sich wirklich, ob das so sein muss.
Nach der Installation musste ich der App auf einem Windows-Rechner Zugriff auf öffentliche und private Netzwerke geben, damit sie lief. Bei der Behauptung „offline“ fand ich das schon etwas fragwürdig.
Beim ersten Start wurden etwa 30 GB Daten heruntergeladen. Ob es bei späteren Starts offline funktioniert, weiß ich nicht. In meinem Fall ist es danach ständig abgestürzt und ließ sich nicht mehr starten.
Beim Deinstallieren ließ es außerdem alle Daten zurück. Nicht nur Nutzerdaten, sondern die ausführbaren Dateien selbst, die Python-virtuelle Umgebung, den Updater und alle Modelle. Die Deinstallation hat im Grunde nur die Verknüpfung im Startmenü entfernt.
Wenn zum Ausführen eine aktive Internetverbindung nötig ist, ist es völlig falsch, mit „offline“ zu werben.
Es ist auf jeden Fall erfreulich, dass mehr lokale Clients erscheinen. Wie in anderen Kommentaren erwähnt, gibt es schon einige sehr gute. Ich habe automatic1111 ausprobiert; es ist schnell und braucht nicht viel Tuning, hat aber immer noch viele Regler und Optionen und wirkt anfangs schwierig. Fooocus ist sehr schnell, bietet aber natürlich weniger Anpassungsmöglichkeiten.
Und dann gibt es ComfyUI. So etwas wie der heilige Gral der Komplexität, aber gerade dank dieser Komplexität kann man unglaublich viel damit machen. Es ist eine nodebasierte App, mit der man eigene Workflows erstellen kann; nachdem ein Bild erzeugt wurde, kann man diesen „Node“ an andere Stellen weiterreichen, etwa für Upscaling als Nachbearbeitung.
Ich bin gespannt, ob Noiselith oder andere Tools SDXLTurbo unterstützen werden. Es ist erst seit ein paar Tagen draußen, aber meiner Meinung nach ist es ein echter Gamechanger. Auf einer Consumer-GPU kann es in etwa 0,5 Sekunden ein 512x512-Bild erzeugen. Die Qualität ist nicht überwältigend, aber die Möglichkeit, „Fuchs im Wald“ einzugeben, es sofort zu sehen, dann „mit Hut“ hinzuzufügen und wieder sofort ein neues Ergebnis zu bekommen, ist sehr wertvoll. Früher wartete man 12 Sekunden pro Bild. Das klingt vielleicht nach keiner großen Sache, aber so schnell iterieren zu können macht lokale Bilderzeugung deutlich unterhaltsamer.
Ich konnte es noch nicht testen, aber da Comfy CoreML nutzt, frage ich mich, ob mit nützlicheren Frontends auch mehr Backend-Optimierung und Performance-Arbeit für solche Plattformen entstehen wird.
1–4 it/s bei 512er-Bildern ist viel zu enttäuschend, und 2–3 s/it bei 1024 ist nach heutigen Maßstäben ebenfalls viel zu langsam. Schade ist auch, dass selbst die ANE auf einem MacBook Pro M3 keine SD-Bilder mit 1024x1024 schafft.