Fly.io hat jetzt GPUs
(fly.io)KI ist wirklich cool
- Fly.io ist ein neuer Public-Cloud-Dienst, der Rechenleistung in die Nähe der Nutzer bringen kann.
- Jetzt lassen sich mit GPUs KI-Workloads in Edge-Computing-Umgebungen verarbeiten.
- Fly.io ermöglicht es, Full-Stack-Apps oder auf der Fly Machines API basierende Entwicklungsplattformen in der Nähe der Nutzer auszuführen.
Praxisbeispiele für den Einsatz von Fly.io-GPUs
- Auf dem Cloud-Backbone von Fly.io kann man eigenen Code und bevorzugte Modelle deployen.
- Mit Fly.io-GPUs lässt sich eine GPU-App, die Ollama (die Freunde aus der Textgenerierung) ausführt, in zwei Schritten einfach starten.
- Man kann die App deployen, indem man Einstellungen zu
fly.tomlhinzufügt und den Befehlfly apps create sandwich_ai && fly deployausführt.
Die Lichtgeschwindigkeit hat ihre Grenzen
- GPUs schnell hochzufahren ist gut, aber Fly.io zeigt seine Stärken vor allem bei Inferenz am Edge.
- Ein Beispiel ist eine App, bei der Nutzer Zutaten aus ihrer Küche eingeben und sofort ein Sandwich-Rezept erhalten.
- Fly.io verfügt über GPUs in Rechenzentren weltweit und ermöglicht es, dasselbe Programm in jeder Region mit GPU-Unterstützung auszuführen.
Nur dann, wenn man sie wirklich braucht
- GPUs sind leistungsstarke Parallelverarbeitungsgeräte, aber nicht billig.
- Durch Hinzufügen eines
services-Abschnitts in der Dateifly.tomlkann festgelegt werden, wie die App hoch- und herunterskaliert. - So lässt sich einstellen, dass keine GPU-Kosten anfallen, wenn Nutzer keine Sandwich-Rezepte anfordern.
Details
- Es werden GPUs angeboten, die in mehreren Regionen in den USA, in Europa und in Sydney verfügbar sind.
- Es gibt verschiedene GPU-Optionen und Preise; standardmäßig kommen bei jedem Deployment acht AMD-EPYC-CPU-Kerne zum Einsatz.
- Volumes von bis zu 500 GB können angebunden werden, außerdem gibt es Rabatte für reservierte Instanzen und dedizierte Hosts.
GN⁺-Meinung:
- Fly.io bietet einen innovativen Cloud-Dienst, der KI-Workloads in Edge-Computing-Umgebungen verarbeiten kann und auf die Verbesserung der Nutzererfahrung ausgerichtet ist.
- Der GPU-basierte Dienst bietet eine Lösung, die sowohl schnelle Inferenz als auch Kosteneffizienz berücksichtigt, und eignet sich besonders für Anwendungen, die in Echtzeit hohe Rechenleistung benötigen.
- Dieser Dienst erhöht die Zugänglichkeit von KI-Technologie und ist eine sehr interessante und nützliche Entwicklung, da er Entwicklern helfen kann, neue innovative Anwendungen zu schaffen.
1 Kommentare
Hacker-News-Kommentare
replicateverwendetencog-Dateien ausführen kann und ob sich vorverpackte Modelle mit derselben Prediction-API ausführen lassen. Wegenreplicatekönnte er zögern, aber wenn Fly das übernehmen würde, wäre die Erfahrung aus seiner Sicht deutlich nahtloser.