- Es wurde eine AI-basierte App zur Karriereerkundung entwickelt, die explosionsartig wuchs, sodass die GPT-4-Kosten auf über 100 $ pro Tag anstiegen
- Die eingesetzte Methode, um die AI-Kosten um bis zu 99 % zu senken, dabei die Latenz zu verringern und die Qualität beizubehalten
- Zuerst mit dem leistungsstärksten Modell (GPT-4) Ergebnisse erzeugen und anschließend mit diesen Ergebnissen ein kleineres Modell feinjustieren
- AI-Anfragen/-Antworten so speichern, dass sie sich leicht exportieren lassen. Dafür wurde Helicone AI verwendet. Wenn lediglich die OpenAI API ersetzt wird, speichert es AI-Anfragen in einer Tabelle
- Sobald etwa 100–500 Anfrage-/Antwort-Paare gespeichert sind, diese exportieren und die Daten in guter Qualität bereinigen
- Mit diesem Datensatz über Hosting-Dienste wie Together/Anyscale Mixtral 8x7B feinjustieren
- GPT-4 durch das neu feinjustierte Modell ersetzen
4 Kommentare
Heißt das dann, dass damit sowohl gegen die GPT-4-Nutzungsbedingungen als auch gegen die Mixtral-Lizenz verstoßen wurde...? @_@
Ich denke, so ist es wohl. Da das nicht so offensichtlich sichtbar wird, scheint es vielen so zu gehen.
Es gab zwar immer wieder Fälle, in denen so etwas stillschweigend genutzt oder für Forschungszwecke veröffentlicht wurde,
aber dass jemand so offen damit wirbt und sagt: „Wir haben das benutzt!“, ist schon ein bisschen … erstaunlich.
Ob es dafür wohl keinen Ärger gibt …?
Hacker-News-Kommentare