- Modelle für Künstliche Intelligenz (KI) werden normalerweise online genutzt, doch mehrere offene Tools verändern das derzeit.
- Der Bioinformatiker Chris Thorpe nutzt große Sprachmodelle (LLMs) als KI-Werkzeug, um
histo.fyi, eine Datenbank für Moleküle des Haupthistokompatibilitätskomplexes (MHC) des Immunsystems, in leicht lesbare Zusammenfassungen zu verwandeln. - Statt webbasierter LLMs wie ChatGPT betreibt Thorpe KI auf seinem Laptop.
Jüngste Trends bei LLMs
- Organisationen erstellen „Open-Weight“-Versionen von LLMs, die Nutzer lokal herunterladen und ausführen können, sofern genügend Rechenleistung vorhanden ist.
- Technologieunternehmen entwickeln abgespeckte Versionen, die auf Consumer-Hardware laufen und mit der Leistung früherer großer Modelle mithalten können.
Warum Forschende lokale Modelle nutzen
- Kostensenkung
- Schutz vertraulicher Patienten- oder Unternehmensdaten
- Sicherstellung der Reproduzierbarkeit
- Da Computer schneller werden und Modelle effizienter, werden Menschen KI zunehmend auf Laptops oder mobilen Geräten ausführen.
Beispiele für kürzlich veröffentlichte kleine Open-Weight-Modelle
- Google DeepMind, Meta, das Allen Institute for Artificial Intelligence und andere haben Modelle mit mehreren Milliarden Parametern veröffentlicht.
- Microsoft hat kleine Sprachmodelle wie Phi-1, Phi-1.5, Phi-2, Phi-3 und Phi-3.5 veröffentlicht; einige davon können auch Bilder verarbeiten.
- Sébastien Bubeck, Vice President für generative KI bei Microsoft, erklärt die Leistung von Phi-3 mit seinem Trainingsdatensatz.
Entwicklung maßgeschneiderter Anwendungen
- Forschende können auf Basis dieser Tools maßgeschneiderte Anwendungen entwickeln.
- Das chinesische Unternehmen Alibaba hat ein Modell namens Qwen entwickelt; ein biomedizinischer Wissenschaftler aus New Hampshire hat es mit wissenschaftlichen Daten feinabgestimmt und daraus Turbcat-72b gemacht.
Schutz der Privatsphäre
- Ein weiterer Vorteil lokaler Modelle ist der Schutz der Privatsphäre.
- Die Übertragung personenbezogener Informationen an kommerzielle Dienste kann gegen Datenschutzvorschriften verstoßen.
- Der Arzt Cyril Zakka, Leiter des Medical-Teams bei Hugging Face, nutzt lokale Modelle, um Trainingsdaten für andere Modelle zu erzeugen.
- Johnson Thomas, Endokrinologe beim Mercy-Gesundheitssystem in Springfield, entwickelt zum Schutz der Privatsphäre von Patienten ein System auf Basis von OpenAIs Whisper und Google DeepMinds Gemma 2, das Arzt-Patienten-Gespräche transkribiert und zusammenfasst.
- CELLama, entwickelt vom Pharmaunternehmen Portrai in Seoul, nutzt lokale LLMs, um Informationen über Genexpression und andere Eigenschaften von Zellen auf zusammenfassende Sätze zu verdichten, und hebt Privatsphäre als zentralen Vorteil hervor.
Einsatz der Modelle
- Forschende sehen sich einer sich schnell wandelnden Auswahl an LLM-Optionen gegenüber.
- Thorpe nutzt derzeit Llama auf seinem Laptop und sagt, dass lokale Modelle aus Sicht der Reproduzierbarkeit Vorteile haben, weil sie unverändert bleiben.
- Thorpe schreibt Code, um MHC-Moleküle anhand ihrer 3D-Struktur zu sortieren, und nutzt dafür sowie für das Design neuer Proteine ein Open-Weight-Modell namens ProtGPT2.
- Manchmal reichen lokale Apps jedoch nicht aus, und Thorpe nutzt für das Programmieren den cloudbasierten GitHub Copilot.
Vorgehensweise
- Mit Software wie Ollama, GPT4All und Llamafile lassen sich LLMs lokal ausführen.
- Je nach Präferenz können Nutzer eine App oder die Kommandozeile wählen.
- Stephen Hood von Mozilla sagt, dass lokale LLMs bald für die meisten Anwendungen gut genug sein werden.
Meinung von GN+
- Lokale LLMs können für Forschende ein sehr nützliches Werkzeug sein. Sie bieten Vorteile wie geringere Kosten, besseren Schutz der Privatsphäre und gesicherte Reproduzierbarkeit.
- Manchmal können cloudbasierte Dienste jedoch die bessere Leistung liefern, daher sollten Forschende je nach Anforderungen ihrer Anwendung das passende Werkzeug wählen.
- Da sich lokale LLMs sehr schnell weiterentwickeln, sollten Forschende neue Modelle und Tools kontinuierlich erkunden und ausprobieren.
- Je nach Forschungsgebiet kann es sich außerdem lohnen, maßgeschneiderte Modelle zu entwickeln. Biomedizinische Forschende könnten etwa Modelle mit medizinischen Daten feinabstimmen, um bessere Leistung zu erzielen.
- Da sich lokale LLMs noch in einem frühen Stadium befinden, sollten Forschende mögliche Probleme und Grenzen bei ihrem Einsatz im Blick behalten, etwa Modell-Bias, Datenqualität und ethische Aspekte.
7 Kommentare
Bisher ist sie heiß, langsam und ungenau. Für Nature ist die Qualität des Artikels ziemlich schwach.
Wird es am Edge nicht langsam und ungenau ausgeführt?
Sofern es sich nicht um einen Bereich handelt, in dem Latenz und Datenschutz tatsächlich problematisch sind, gibt es im Grunde keinen Grund, Edge Computing (lokal) zu verwenden.. Nahezu alle Daten der Welt werden ohnehin bereits von AWS und Google verarbeitet, und jetzt plötzlich mit Datenschutz zu argumentieren, ist letztlich nur ein Verkaufsargument von Unternehmen, denen die Technik fehlt, um LLMs zu entwickeln..
Im Titel des Nature-Artikels taucht zwar
smallauf, aber im Großteil des Inhalts steht eigentlichlocalim Mittelpunkt.Jedes Mal heißt es, man solle ChatGPT vergessen ...
Haha
Hacker-News-Kommentare
Empfehlung zur Nutzung lokaler Modelle
Erfahrungen mit der Nutzung lokaler LLMs
AMD Strix Halo APU
Lizenzprobleme bei Llama 3.1
Nutzung von Docker und Ollama
Leistung lokaler LLMs
Experimente mit lokalen LLMs
LLM-basierte Produkte großer Unternehmen
Trainingsdaten für LLMs
Empfohlene Spezifikationen zum Ausführen kleiner Modelle