6 Punkte von GN⁺ 2024-04-09 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Die größte Version von Llama 3 soll im Laufe dieses Sommers erscheinen, zwei kleinere Modelle sollen bereits nächste Woche veröffentlicht werden
  • Die Veröffentlichung der kleinen Modelle dürfte die Erwartungen an Llama 3 anheizen
  • Von Llama 3 wird erwartet, dass es wie OpenAIs GPT-4 über bildbasierte Frage-Antwort-Funktionen verfügen wird
  • Die größte Version soll ein multimodales Modell werden, das sowohl Text als auch Bilder verstehen und erzeugen kann
  • Die beiden kleineren Modelle, die nächste Woche erscheinen sollen, werden hingegen nicht multimodal sein

Vor- und Nachteile je nach Modellgröße

  • Kleinere Modelle sind im Allgemeinen günstiger im Betrieb und schneller als große Modelle
  • Das wird angesichts der Kosten für den Betrieb großer Modelle zunehmend wertvoll
  • Kleine Modelle sind auch für Entwickler nützlich, die AI-Software für mobile Geräte entwickeln wollen

Stand der Entwicklung von Metas Llama-Modellen

  • Meta hat zuvor drei Modelle von Llama 2 veröffentlicht
    • Das größte Modell verfügt über 70 Milliarden Parameter
    • Die beiden anderen Modelle haben jeweils 13 Milliarden bzw. 7 Milliarden Parameter
  • Die größte Version von Llama 3 soll voraussichtlich mehr als 140 Milliarden Parameter haben
  • Meta nutzt Llama 2, um AI-Assistentenfunktionen in den eigenen Apps bereitzustellen
  • In den vergangenen Monaten haben Mitarbeiter von Metas Generative-AI-Abteilung daran gearbeitet, Llama 3 offener zu machen, weil sie zu dem Schluss gekommen waren, dass Llama 2 auf kontroverse Fragen zu zurückhaltend reagiert

Meinung von GN⁺

  • Die Veröffentlichung einer kleineren Version von Meta Platforms’ Llama 3 zeigt, wie intensiv der Wettbewerb im Bereich der AI-Sprachmodelle geworden ist. Da große Player wie Google und Elon Musks xAI bereits Open-Source-Modelle veröffentlichen, lässt sich Metas Schritt als Strategie deuten, Marktanteile zu sichern und die technologische Führungsrolle zu behaupten.
  • Die Veröffentlichung kleinerer Modelle könnte eine Marketingstrategie sein, um Entwicklern und Forschern neue Werkzeuge an die Hand zu geben und gleichzeitig das Interesse und die Erwartungen an die größere Version zu steigern. Dadurch erhalten Nutzer die Möglichkeit, mit kleineren Modellen zu experimentieren und sich an sie zu gewöhnen, bevor sie das große Modell tatsächlich einsetzen.
  • Die Veröffentlichung großer Sprachmodelle ist technisch äußerst komplex, und um solche Modelle effektiv zu trainieren und zu betreiben, sind erhebliche Rechenressourcen und Fachkenntnisse erforderlich. Meta verfügt zwar über diese Ressourcen, doch Fragen zum ethischen Einsatz und zu Verzerrungen bleiben weiterhin wichtige Aspekte.
  • Wie sich Metas Llama-3-Modell von anderen Open-Source-Modellen unterscheiden wird und welche neuen Funktionen oder Innovationen es bieten könnte, ist noch unklar. Das könnte in der Tech-Community ein spannendes Diskussionsthema werden.
  • Die Veröffentlichung von Open-Source-Modellen fördert die Demokratisierung von Technologie und ermöglicht mehr Innovation. Mit wachsendem Einfluss solcher Modelle nehmen jedoch auch die Sorgen über die Verbreitung von Fehlinformationen, Urheberrechtsverletzungen und Datenschutzprobleme zu.

Noch keine Kommentare.

Noch keine Kommentare.