Gemma – Googles hochmoderne Open-Modelle
(blog.google)- Google ist davon überzeugt, nützliche KI für alle zu schaffen, und hat der Open-Community bereits Innovationen wie Transformers, TensorFlow, BERT, T5, JAX, AlphaFold und AlphaCode beigesteuert
- Gemma ist eine leichtgewichtige Familie hochmoderner Open-Modelle, die auf derselben Forschung und Technologie basiert, die auch für die Entwicklung der Gemini-Modelle verwendet wurde
- Entwickelt von Google DeepMind und anderen Teams; der Name ist von „gemma“ inspiriert, dem lateinischen Wort für „Edelstein“
- Ab heute weltweit verfügbar; zusammen mit den Modellgewichten werden Tools bereitgestellt, die Innovationen von Entwicklern unterstützen, die Zusammenarbeit fördern und eine verantwortungsvolle Nutzung der Gemma-Modelle anleiten
- Durch gemeinsam mit Gemini genutzte Technologie- und Infrastrukturkomponenten erreichen Gemma 2B und 7B im Verhältnis zu ihrer Größe eine Spitzenleistung im Vergleich zu anderen Open-Modellen
- Sie können direkt auf dem Laptop oder Desktop von Entwicklern ausgeführt werden, übertreffen in wichtigen Benchmarks deutlich größere Modelle und erfüllen zugleich strenge Standards für sichere und verantwortungsvolle Ergebnisse
- Über Native Keras 3.0 wird eine Toolchain für Inferenz und SFT (überwachtes Fine-Tuning) über alle wichtigen Frameworks hinweg bereitgestellt, darunter JAX, PyTorch und TensorFlow
- Dank Integration mit Colab- und Kaggle-Notebooks sowie beliebten Tools wie Hugging Face, MaxText, NVIDIA NeMo und TensorRT-LLM lässt sich leicht mit Gemma starten
- Vortrainierte und instruktionstuned Gemma-Modelle lassen sich einfach auf Vertex AI und Google Kubernetes Engine (GKE) bereitstellen und auf Notebooks, Workstations oder in Google Cloud ausführen
- Optimierungen für mehrere KI-Hardwareplattformen, darunter NVIDIA GPUs und Google Cloud TPUs, sorgen für branchenführende Leistung
- Gemäß den Nutzungsbedingungen sind kommerzielle Nutzung und Verteilung für Organisationen jeder Größe erlaubt
Von Grund auf verantwortungsvoll entwickelt
- Gemma wurde mit KI-Prinzipien als oberster Priorität entwickelt und nutzt automatisierte Techniken, um personenbezogene und andere sensible Daten aus den Trainingssätzen herauszufiltern
- Darüber hinaus wurde Reinforcement Learning from Human Feedback (RLHF) in großem Umfang für instruktionstuned Modelle eingesetzt, damit sie mit verantwortungsvollem Verhalten im Einklang stehen
- Um das Risikoprofil der Gemma-Modelle zu verstehen und zu verringern, wurden robuste Evaluierungen durchgeführt, darunter manuelles Red Teaming, automatisierte adversarielle Tests und Bewertungen der Modellfähigkeiten in Bezug auf gefährliche Aktivitäten
Optimiert über Frameworks, Tools und Hardware hinweg
- Gemma-Modelle können mit eigenen Daten für spezifische Anwendungsanforderungen feinabgestimmt werden und unterstützen eine Vielzahl von Tools und Systemen
- Multi-Framework-Tools: Bevorzugte Frameworks wie Keras 3.0, natives PyTorch, JAX und Hugging Face Transformers stehen zur Verfügung. Referenzimplementierungen werden bereitgestellt
- Geräteübergreifende Kompatibilität: Ausführung auf gängigen Geräten möglich, darunter Laptops, Desktops, IoT, Mobile und Cloud
- Hochmoderne Hardwareplattformen: Durch die Partnerschaft mit NVIDIA werden von Rechenzentren über die Cloud bis hin zu lokalen RTX AI PCs NVIDIA-GPUs optimiert, um branchenführende Leistung und Integration mit modernster Technologie sicherzustellen
- Optimiert für Google Cloud: Mit Vertex AI steht ein umfassendes Set an MLOps-Tools und verschiedenen Tuning-Optionen zur Verfügung; One-Click-Deployment mit integrierter Inferenzoptimierung ist möglich
Kostenlose Credits für Forschung und Entwicklung
- Gemma wurde für die Community aus Entwicklern und Forschern entwickelt, die KI-Innovationen vorantreibt; mit kostenlosem Zugang über Kaggle, der kostenlosen Stufe von Colab-Notebooks und $300 Credits für neue Google-Cloud-Nutzer kann ab heute direkt losgelegt werden
- Forschende können bis zu $500,000 an Google-Cloud-Credits beantragen, um ihre Projekte zu beschleunigen
2 Kommentare
Jetzt sind wohl nur noch offene AIs geschlossen.
Hacker-News-Kommentare
d_model, während sie bei den meisten Modellen beim 4-Fachen liegt.