-
Laut OpenAI kann der Unterschied zwischen GPT-4 und GPT-3.5 in alltäglichen Gesprächen subtil sein. Je komplexer die Aufgabe jedoch wird, desto stabiler und kreativer ist GPT-4 und desto besser kann es nuancierte Anweisungen verarbeiten.
-
Außerdem unterstützt GPT-4 auch Textausgabe auf Basis von Bildeingaben. Das von OpenAI gezeigte Beispiel bestand darin, ein Bild zu übergeben und zu fragen, „welcher Teil daran lustig ist“. OpenAI analysierte daraufhin den Humor des Memes und erklärte ihn. (Diese Funktion ist derzeit noch eine Forschungs-Vorschau und noch nicht öffentlich nutzbar.)
-
Beim neuen GPT-4-Modell können Formulierungen, mit denen man der AI wie schon bei GPT-3.5 eine bestimmte Rolle zuweist, in einen separaten Bereich namens
systemeingefügt werden. Dadurch lassen sich Stil und Aufgaben der AI direkter festlegen. (OpenAI ist sich auch bewusst, dass dieser Teil potenziell für sogenanntes „Jailbreaking“ missbraucht werden kann, also zur Umgehung von Inhaltsbeschränkungen.) -
GPT-4 hat weiterhin mit Halluzinationsproblemen zu kämpfen. (Es glaubt an nicht existierende Dinge und macht dabei Fehlschlüsse.) Laut internen Bewertungen erreichte es jedoch 40 Prozent höhere Werte als das vorherige Modell.
-
GPT-4 birgt weiterhin das Risiko, nicht erlaubte Inhalte zu erzeugen. Im Vergleich zu GPT-3.5 ist die Rate der Erzeugung von Richtlinien-verletzenden Inhalten jedoch um 82 Prozent gesunken, und bei sensiblen Anfragen (medizinische Ratschläge, Selbstverletzung) antwortet es 29 Prozent häufiger richtlinienkonform.
-
Das GPT-4-Modell steht derzeit nur ChatGPT-Plus-Abonnenten zur Verfügung, mit einem Limit von 100 Nachrichten pro 4 Stunden. OpenAI erklärte außerdem, dass in diesem Zusammenhang zusätzliche kostenpflichtige Angebote geplant sind und dass das Modell langfristig auch kostenlosen Nutzern zur Verfügung gestellt werden soll.
In dieser Zusammenfassung fehlen Angaben dazu, wie GPT-4 trainiert wurde, Erklärungen zu OpenAI Evals sowie detaillierte Beispiele und direkte Benchmarks. Es könnten auch weitere wichtige Fakten fehlen, daher bitte den Originaltext lesen.
10 Kommentare
Wie bei 3.5 sind Antworten aus dem Bauch heraus(?) deutlich seltener geworden, und wenn es etwas nicht weiß, sagt es tendenziell ehrlich, dass es das nicht weiß.
Ich glaube, es wird schwer sein, bis zur Rente mit meiner jetzigen Arbeit meinen Lebensunterhalt zu verdienen.
Skynet ist wohl nicht mehr fern..
Die Leistungsfähigkeit von GPT-4
https://www.clien.net/service/board/park/17962934
Es gibt dort verschiedene Memes.
In den Kommentaren gibt es einen Vergleich der Antworten von 3.5 und 4 darauf, wie man die verärgerte Freundin beruhigt, und der Unterschied ist ziemlich groß. Haha
Eine Rezension des GPT-4 Technical Report von Sanghun Lee, gepostet in der TensorFlow Korea-Gruppe
https://www.facebook.com/groups/TensorFlowKR/posts/1992265094447872
Ich habe GPT-4 und GPT-3.5 direkt nach der Veröffentlichung diese Frage gestellt.
Die Antworten von GPT-3.5 und GPT-4 unterschieden sich dabei sehr deutlich. GPT-4 klassifiziert gemäß dem Ablauf die Rolle jeder einzelnen Datei und gibt korrekte Anweisungen, mit denen man im Godot-Editor tatsächlich Schritt für Schritt zum Ziel kommt, während GPT-3.5 einfach kaputten Code ausspuckte, der nur so aussieht, als würde er funktionieren.
Jetzt könnten womöglich jede Menge Spiele von Solo-Entwicklern auf den Markt kommen ... Es scheint der beste Zeitpunkt seit jeher zu sein, um Spiele zu entwickeln.
Natürlich gibt es auch Sorgen über massenproduzierte Spiele, ähnlich wie bei massenproduzierten Romanen ... Letztlich hoffe ich aber, dass auch AAA-Spielestudios ihre Arbeitsumgebungen stark verändern, um effizienter zu werden und Spiele in höherer Qualität möglichst ohne Bugs ... gut herauszubringen.
Man bekommt direkt Lust auf Luddismus ... schluchz schluchz
Wird man in Zukunft überhaupt noch von einem Gehalt leben können..
Man muss wohl dafür beten, Bürger von Rom zu werden, haha.
Der Grund, warum ich die Godot Engine gewählt habe, war, dass ich dachte, sie sei gerade wegen der geringeren Menge an Material im Vergleich zu Unity besser für Tests geeignet. Mich hat interessiert, wie gut sie antwortet, wenn es allgemein nicht so viele Informationen gibt. Aber ich war überrascht, wie gut sie das gemacht hat....