- KI-Sprachassistenten verändern die Interaktion mit Technologie grundlegend, doch Gespräche mit bisherigen Sprachassistenten wirken oft mechanisch und unnatürlich
- Sie haben Schwierigkeiten, die feinen Nuancen und emotionalen Aspekte menschlicher Gespräche zu verstehen und sich daran anzupassen
- Wie würde ein vollständig offener Sprachassistent aussehen, wenn er so umgesetzt würde?
- Er reagiert in Echtzeit auf Nutzeranfragen und verfügt über eine natürliche Stimme, Empathie und emotionale Intelligenz
- Er versteht den langfristigen Kontext früherer Gespräche und kann Unterhaltungen mit mehreren Personen, Unterbrechungen, Bestätigungen und Denkpausen verarbeiten
- Er läuft vollständig lokal auf Consumer-Hardware
Entwicklung von BUD-E (Buddy for Understanding and Digital Empathy)
- LAION hat BUD-E in Zusammenarbeit mit dem ELLIS Institute Tübingen, Collabora und dem Tübingen AI Center entwickelt
- Die Arbeit begann mit der Entwicklung eines grundlegenden Sprachassistenten mit niedriger Latenz; Stand Januar 2024 wurde eine Latenz von 300–500 ms erreicht
- Mit größeren Modellen wird eine Antwortzeit von unter 300 ms erwartet
Roadmap für die Entwicklung von BUD-E
- Selbst Gespräche mit dem Basismodell wirken deutlich natürlicher als alles, was bisher zu sehen war
- Dennoch gibt es noch viele Probleme zu lösen und Funktionen zu entwickeln
- Latenz weiter senken und Systemanforderungen minimieren
- Natürlichkeit von Gesprächen und Antworten weiter erhöhen
- Gespräche über Tage, Monate und Jahre hinweg nachverfolgen
- Funktionalität und Fähigkeiten des Sprachassistenten verbessern
- Multimodales und emotionales Kontextverständnis ausbauen
- Infrastruktur für Benutzeroberfläche, Continuous Integration und einfaches Packaging aufbauen
- Auf mehrere Sprachen und mehrere Sprecher erweitern
Zusammenarbeit für die Zukunft der konversationellen KI
- Die Entwicklung von BUD-E ist ein fortlaufender Prozess, der die gemeinsame Anstrengung verschiedener Communities erfordert
- Open-Source-Entwickler, Forschende und engagierte Interessierte sind eingeladen, einzelne Module von BUD-E zu verbessern und zum Wachstum beizutragen
- Ziel ist es, gemeinsam einen KI-Sprachassistenten zu schaffen, der natürliche, intuitive und empathische Gespräche führen kann
Noch keine Kommentare.