- Eine auf Koreanisch spezialisierte Version des von Kakao Brain entwickelten GPT-3-Modells
→ aufgebaut auf Basis von 6 Milliarden Parametern und koreanischen Daten mit 200 Milliarden Tokens
-
Führt alle Arten von Sprachaufgaben aus, darunter die Einstufung gegebener Sätze als positiv oder negativ, die einzeilige Zusammenfassung langer Texte, das Ziehen von Schlussfolgerungen aus Sätzen und das Beantworten von Fragen durch Verständnis des Kontexts
-
Nach Koreanisch ist die Open-Source-Veröffentlichung von Modellen für Englisch, Japanisch, Vietnamesisch und Malaiisch geplant
-
Ziel ist es, durch die Öffnung als Open Source den Zugang zu sichern und zur Weiterentwicklung der heimischen IT-Technologie sowie zur Belebung der Forschung beizutragen
3 Kommentare
Demo-Seite: https://huggingface.co/spaces/akhaliq/kogpt
Als ich den folgenden Satz, der dort als Beispiel eingetragen war, unverändert eingegeben habe, dauerte es bis zur Warteschlange etwa 2 Minuten, und dann kam dieses Ergebnis heraus. Die tatsächlich für die Verarbeitung verwendete Zeit scheint bei etwa 16,9 Sekunden gelegen zu haben.
input:
„Durch eine ‚Intelligenz‘, die wie ein Mensch denkt und handelt, konnte die Menschheit bislang nicht lösen“
output:
„Durch eine ‚Intelligenz‘, die wie ein Mensch denkt und handelt, ist eine Zeit gekommen, in der unzählige Fragen beantwortet werden müssen, die die Menschheit bislang nicht lösen konnte. c Pixabay Während unsere Menschheit die vergangenen Zehntausende von Jahren durchlaufen hat, war das Wichtigste, das gelöst werden musste, um ein menschenwürdiges Leben zu führen“
Großartig.
GPT-J-6B, Cedille und KoGPT haben offenbar alle 6 Milliarden (6B) Parameter.
GPT-3 ist inzwischen nicht mehr das einzige seiner Art auf dem Markt: https://de.news.hada.io/topic?id=5349
GPT-Neo: ein Projekt, das Modelle im Maßstab von GPT-3 als Open Source/kostenlos verfügbar macht https://de.news.hada.io/topic?id=3599
Cedille - ein französischsprachiges Modell im 6B-Maßstab wurde als Open Source veröffentlicht https://de.news.hada.io/topic?id=5372