4 Punkte von xguru 2024-02-13 | Noch keine Kommentare. | Auf WhatsApp teilen
  • KI-Sprachassistenten verändern die Interaktion mit Technologie grundlegend, doch Gespräche mit bisherigen Sprachassistenten wirken oft mechanisch und unnatürlich
  • Sie haben Schwierigkeiten, die feinen Nuancen und emotionalen Aspekte menschlicher Gespräche zu verstehen und sich daran anzupassen
  • Wie würde ein vollständig offener Sprachassistent aussehen, wenn er so umgesetzt würde?
    • Er reagiert in Echtzeit auf Nutzeranfragen und verfügt über eine natürliche Stimme, Empathie und emotionale Intelligenz
    • Er versteht den langfristigen Kontext früherer Gespräche und kann Unterhaltungen mit mehreren Personen, Unterbrechungen, Bestätigungen und Denkpausen verarbeiten
    • Er läuft vollständig lokal auf Consumer-Hardware

Entwicklung von BUD-E (Buddy for Understanding and Digital Empathy)

  • LAION hat BUD-E in Zusammenarbeit mit dem ELLIS Institute Tübingen, Collabora und dem Tübingen AI Center entwickelt
  • Die Arbeit begann mit der Entwicklung eines grundlegenden Sprachassistenten mit niedriger Latenz; Stand Januar 2024 wurde eine Latenz von 300–500 ms erreicht
  • Mit größeren Modellen wird eine Antwortzeit von unter 300 ms erwartet

Roadmap für die Entwicklung von BUD-E

  • Selbst Gespräche mit dem Basismodell wirken deutlich natürlicher als alles, was bisher zu sehen war
  • Dennoch gibt es noch viele Probleme zu lösen und Funktionen zu entwickeln
    • Latenz weiter senken und Systemanforderungen minimieren
    • Natürlichkeit von Gesprächen und Antworten weiter erhöhen
    • Gespräche über Tage, Monate und Jahre hinweg nachverfolgen
    • Funktionalität und Fähigkeiten des Sprachassistenten verbessern
    • Multimodales und emotionales Kontextverständnis ausbauen
    • Infrastruktur für Benutzeroberfläche, Continuous Integration und einfaches Packaging aufbauen
    • Auf mehrere Sprachen und mehrere Sprecher erweitern

Zusammenarbeit für die Zukunft der konversationellen KI

  • Die Entwicklung von BUD-E ist ein fortlaufender Prozess, der die gemeinsame Anstrengung verschiedener Communities erfordert
  • Open-Source-Entwickler, Forschende und engagierte Interessierte sind eingeladen, einzelne Module von BUD-E zu verbessern und zum Wachstum beizutragen
  • Ziel ist es, gemeinsam einen KI-Sprachassistenten zu schaffen, der natürliche, intuitive und empathische Gespräche führen kann

Noch keine Kommentare.

Noch keine Kommentare.