Ich denke, viele von euch hier werden ähnlich empfinden,
auch ich wollte Jarvis aus Iron Man einmal wirklich bauen.
Ich stelle nun die Alpha-Testversion von 'BooCae', einem Service für eine Plattform mit personalisierten AI-Chatbot-Persönlichkeiten, kostenlos zur Verfügung und möchte verschiedenes Feedback zu Bugs, Verbesserungen und weiteren Punkten einholen.
Wie der Name Alpha-Test schon sagt, würde ich mich freuen, wenn ihr das Ganze als experimentellen Test betrachtet; zusätzliche Funktionen werden fortlaufend ergänzt.
‘BooCae’ wurde mit dem Ziel entwickelt, eine Plattform für „Custom AI Chatbot Personality“ zu schaffen, die auf ChatGPT basiert und verschiedene Large-Scale-AI-Modelle wie LLAMA und ALPACA sowie unterschiedliche APIs und Plugins kombiniert.
Die AI-Chatbots von BooCae basieren gemeinsam auf der ChatGPT-3.5-Turbo API, wobei das jeweilige „maßgeschneiderte Training“ für jedes Fachgebiet unabhängig aufgebaut wurde. Dieser Alpha-Testservice enthält außerdem einen multimodalen AI-Avatar, der ebenfalls betrieben werden kann.
Das Modell zur Erstellung von Avataren mit AI wurde separat als „Native App“ entwickelt und wird derzeit noch nicht in einem Store veröffentlicht, sondern offline getestet. (Das stelle ich später gesondert vor.)
Zufällig gibt es mit dem US-Dienst 'Character.AI' ein ähnliches Modell; unter Bezug auf diese Seite habe ich mich auf verschiedene Weise bemüht, Verbesserungen und Differenzierungsmerkmale einzubauen.
Die Struktur des grundlegenden Serviceaufbaus und die Unterschiede sind wie folgt.
-AI-Modell: Standardmäßig wird ChatGPT eingesetzt; andere GPTs wie Alpaca und LLaMA sollen bald zusätzlich integriert werden. Bei ChatGPT dient GPT3.5-TURBO über die Open API als Grundlage. (Reaktionsgeschwindigkeit und Kosten muss man natürlich ebenfalls berücksichtigen.)
-AI-Persona: Standardmäßig wird ein standardisierter Prompt-Satz verwendet, der als AI Assistant definiert ist und leicht an die koreanischen Gegebenheiten angepasst wurde. Auch das soll künftig fortlaufend aktualisiert werden.
-Maßgeschneiderter zusätzlicher Trainingsdatensatz: Auf Basis öffentlich verfügbarer Informationen (öffentliche Informationsportale, frei verfügbare Informationen ohne Urheberrechtsprobleme usw.) wurden Inhalte wie Nachrichten und Wörterbücher experimentell trainiert; Menge und Qualität werden laufend verbessert. Künftig halte ich auch den Zukauf spezialisierter kostenpflichtiger Daten für notwendig.
-API für Echtzeit-Informationsabfrage: Für die Nutzung von Echtzeitdaten (zum Beispiel Wechselkursinformationen) wurden verschiedene APIs eingesetzt, und weitere kommen fortlaufend hinzu. Auch Echtzeit-API-Abfragen sind unter Kostengesichtspunkten zu berücksichtigen.
-Chatbot-Plattform: Es gibt verschiedene Chatbot-Plattformen von öffentlichen Versionen bis hin zu kommerziellen Versionen, daher wurden Module und APIs mehrerer Chatbot-Plattformen genutzt; künftig sollen noch mehr Plattformen unterstützt werden können.
Chatbot-Plattformen basieren im Wesentlichen auf Strukturen, in denen Bedingungen wie Szenarien festgelegt werden können. Dabei ist ChatGPT entweder standardmäßig integriert (wobei es in solchen Fällen oft etwas schwierig ist, dies im eigentlichen Sinn als Chatbot-Plattform zu bezeichnen), oder es ist nicht integriert, aber die API ist offen, sodass sich ChatGPT manuell über API-Einstellungen anbinden lässt.
Ich denke, beide Varianten haben jeweils ihre eigenen Vorteile.
Wichtig ist meiner Ansicht nach die Ausweitung der Vielfalt, um mehr Plattformen flexibel unterstützen zu können.
-Einsatz und Bereitstellung: Dies lässt sich als Web-Widget, URL-Link oder API-Ansatz definieren; dadurch ist Multi-Plattform-Unterstützung für Web / Web-App / Native App / oder Sprachdienste wie Google Assistant möglich.
-Suchfunktion: Für die Registrierung und Nutzung von Keywords wurde die von Notion bereitgestellte Suchfunktion unverändert übernommen; auch die DB-Struktur erscheint mir sehr gut nutzbar.
-Werbung: Unter Berücksichtigung eines Erlösmodells wurde testweise experimentell geprüft, gesponserte Werbung jedes Mal anzuzeigen, wenn die AI antwortet.
Als Werbeformen kommen meiner Ansicht nach 1) Video 2) Bild 3) Text und URL 4) in die Antwort eingebaute PPL-artige Inhalte infrage.
-AI-Avatar: Der größte vorbereitete Differenzierungspunkt liegt im multimodalen Bereich. Ich halte einen echten multimodalen AI-Avatar, wie er in Boocae definiert wird, für eine Kombination aus Textgenerierung, Sprachgenerierung/-klonen/-synthese, Bildgenerierung, Komposition zu Video sowie Videobearbeitung einschließlich Hintergründen, alles mithilfe von AI.
Die meisten der im BooCae-Alpha-Test veröffentlichten Video-Bilder wurden mit Wav2LIP und Ähnlichem erstellt; bei Vortests wurde klar erkennbar, dass die Reaktion der Nutzer darauf hoch war, weshalb ich diesen Punkt als Differenzierungsmerkmal in den Fokus gestellt habe.
Als Service-Plattform wurde 'Notion' verwendet, für die Website kam oopy zum Einsatz.
Die Service-Kategorien wurden in mehrere Dutzend Bereiche unterteilt, und ich gehe davon aus, dass weitere hinzukommen werden.
Je nach Klassenstruktur des Services erfolgt die Einteilung in Special (Besonderes), Brand (Unternehmen und andere Markendienste), Expert (Expertenservice), Ready (Training läuft), Comming soon (Wartet auf Training).
Um die Resonanz auf den Service zu erfassen und Meinungen einzuholen, ist in den Ankündigungen auch ein Umfrageformular enthalten; ich würde mich daher über viel offenes Feedback freuen.
Da sich alles noch in der Alpha-Testphase befindet, gibt es in vielerlei Hinsicht noch einiges, das unzureichend ist.
Außerdem wird ein Team benötigt, das das Projekt gemeinsam weiter aufbaut. Wenn ihr Interesse habt, würde ich mich über eine Chat-Nachricht freuen.
Alpha-Test-URL: https://boocae.oopy.io/
Noch keine Kommentare.