2 Punkte von GN⁺ 2023-11-03 | 1 Kommentare | Auf WhatsApp teilen
  • Artikel zur Vorstellung des AI-Tools „Talk-Llama“, das es Nutzern ermöglicht, im Terminal mit einer AI zu sprechen
  • Ein Tool, das die Modelle Whisper Medium und LLaMA v2 13B Q8_0 verwendet, mit dem neuesten Performance-Update vom 2. November 2023
  • Talk-Llama ist auf die SDL2-Bibliothek angewiesen, um Audio vom Mikrofon zu erfassen
  • Enthält Anweisungen zur Installation von SDL2 sowie zum Bauen und Ausführen der Binärdatei talk-llama unter Linux und Mac OS
  • Nutzer können über die Argumente -mw und -ml die Whisper- und LLaMA-Modelle angeben, die sie verwenden möchten
  • Tool mit Unterstützung für Sitzungsverwaltung, das den Kontext früherer Interaktionen beibehält und so konsistentere, fortlaufende Gespräche ermöglicht
  • Nutzer können die Sitzungsunterstützung mit der Kommandozeilenoption --session FILE aktivieren, den Modellzustand nach jeder Interaktion speichern und frühere Sitzungen fortsetzen
  • Für das beste Erlebnis wird ein Text-to-Speech-(TTS)-Tool empfohlen, das die generierten Textantworten in Sprache umwandelt
  • Nutzer können ihre bevorzugte TTS-Engine verwenden und das Skript speak bei Bedarf anpassen
  • Das Tool ist offen für Feedback und ermutigt Nutzer, sich an der laufenden Diskussion zu beteiligen

1 Kommentare

 
GN⁺ 2023-11-03
Hacker-News-Kommentare
  • Die Leistung von Apple Silicon hat sich stark verbessert, da whisper.cpp vollständig ausgeführt werden kann und sich die Generierungsgeschwindigkeit von llama.cpp deutlich erhöht hat.
  • Es wurde gezeigt, dass Llama erfolgreich mit einem Open-Source-TTS-Modell für das Projekt integriert wurde, was seine Vielseitigkeit unterstreicht.
  • Als am nützlichsten gelten Coding-Begleiter-Tools, die nicht versuchen, komplexe Probleme zu lösen, sondern den manuellen Overhead verringern.
  • Die Idee eines Tools, das Sprache in Kontextvektoren einbettet, wurde als futuristisches und potenziell nützliches Konzept vorgeschlagen.
  • Es gibt Berichte über ein Problem mit einer „Floating-Point-Exception“ beim Ausführen von talk-llama unter Arch und Debian, was auf mögliche Kompatibilitätsprobleme hindeutet.
  • Es wurde vorgeschlagen, zur Verringerung der Latenz stattdessen Gruppen von jeweils etwa 6 Tokens an TTS zu streamen, noch bevor die LLM-Antwort vollständig begonnen hat.
  • Es wurden Bedenken geäußert, dass diese Technologie verboten werden könnte, falls Vorschläge für Open Weights umgesetzt werden.
  • Die Möglichkeit einer Text-to-Talk-Lösung, die Textstreams empfangen kann, wurde diskutiert; dadurch würde entfallen, darauf zu warten, dass Llama die Ausgabe vollständig erzeugt, bevor die Antwort gesprochen wird.
  • Es wurde nach der optimalen Chat-Oberfläche für Llama gefragt, verbunden mit dem Wunsch, eines der Modelle für schnelle Coding-Aufgaben im Terminal auszuführen.
  • Es wurde angemerkt, dass die Stimmen von ElevenLabs teuer sind und eine einzelne Unterhaltung 20 $ kosten kann.
  • Es wurde gefragt, was das Ollama-Äquivalent für whisper bzw. ein SOTA-OS-TTS-Modell ist, mit dem Wunsch nach einer einfachen Einrichtung, um whisper lokal auszuführen.
  • Es wurde um eine verständliche englische Erklärung der Fähigkeiten dieser Technologie gebeten, insbesondere dazu, ob sie den Kontext eines Chats lernen und beibehalten sowie ein langfristiges Gedächtnis aufbauen kann.