2 Punkte von GN⁺ 2023-07-12 | 1 Kommentare | Auf WhatsApp teilen
  • Möglichkeit eines Leaks zu Details von GPT-4
  • Die geleakten Informationen deuten darauf hin, dass GPT-4 über fortschrittliche Funktionen verfügen könnte
  • Es wird erwartet, dass GPT-4 über verbesserte Fähigkeiten zur Verarbeitung und zum Verständnis natürlicher Sprache verfügt
  • In den geleakten Details werden auch ein verbessertes Kontextverständnis und stärkere Schlussfolgerungsfähigkeiten erwähnt
  • Gerüchten zufolge soll GPT-4 eine größere Modellgröße haben, was zu einer besseren Leistung beitragen könnte
  • Die geleakten Informationen haben unter technikaffinen Menschen Interesse geweckt
  • Dieser Artikel diskutiert die potenziellen Auswirkungen von GPT-4 auf verschiedene Branchen und Anwendungsbereiche
  • Wann GPT-4 offiziell veröffentlicht wird, ist nicht bekannt
  • Die geleakten Details haben unter Softwareentwicklern und Technikbegeisterten Spekulationen und Erwartungen ausgelöst

1 Kommentare

 
GN⁺ 2023-07-12
Hacker-News-Kommentare
  • Die ursprüngliche Quelle der geleakten Details zu GPT-4 ist ein Blogbeitrag auf semianalysis.com.
  • Der Twitter-Nutzer, der die Details geteilt hat, scheint den Blogbeitrag lediglich umformuliert zu haben, weshalb der Tweet gelöscht wurde.
  • Das in GPT-4 verwendete MoE (Mixture of Experts) ist interessant und könnte die Schwankungen in der Ausgabequalität erklären.
  • Das Vision-Modell von GPT-4 wurde nicht veröffentlicht, weckt aber Erwartungen.
  • Für das Training von GPT-4 waren 21 YottaFLOPS erforderlich, was eine beachtliche Rechenleistung darstellt.
  • Die Trainingskosten von GPT-4 sind im Vergleich zum letzten Jahr auf ein Drittel gesunken, was gute Nachrichten für Open Source sind.
  • Es gibt Spekulationen, dass die Qualität von GPT-4 dadurch gesunken ist, dass niedrig wahrscheinliche Sequenzen aus einem speculative-decoding-Modell übernommen wurden.
  • Google erforscht Mixture of Experts zur Skalierung von Sprachmodellen, und das GLaM-Modell hat 1,7 Billionen Parameter und 64 Experten.
  • George Hotz erwähnte in einem Interview, dass GPT-4 220 Milliarden Parameter habe und aus 16 Mixture-Modellen mit 8 Gewichtungssätzen bestehe.
  • Es gibt Neugier darüber, ob Premium-Dienste wie Thread Reader bei den hohen API-Preisen von Twitter weiterhin betrieben werden können.
  • Einige Nutzer suchen nach alternativen Links, um ohne Anmeldung bei Twitter auf die geleakten Trainingsdetails von GPT-4 zugreifen zu können.
  • Die einzigen Menschen, die wirklich wissen, wie GPT-4 funktioniert, sind OpenAI-Mitarbeiter; alle anderen sind auf Spekulationen angewiesen.