Beispiel: Sincere
Voice Affect: Calm, composed, and reassuring. Competent and in control, instilling trust.
Tone: Sincere, empathetic, with genuine concern for the customer and understanding of the situation.
Pacing: Slower during the apology to allow for clarity and processing. Faster when offering solutions to signal action and resolution.
Emotions: Calm reassurance, empathy, and gratitude.
Pronunciation: Clear, precise: Ensures clarity, especially with key details. Focus on key words like "refund" and "patience."
Pauses: Before and after the apology to give space for processing the apology.
Beispiel: Medieval Knight
Stimmeffekt: Tief, befehlend und leicht dramatisch; spiegelt die Erhabenheit altenglischer Erzählungen wider
Ton: Edel, heroisch und formell; fängt die Essenz mittelalterlicher Ritter und epischer Abenteuer ein
Emotionen: Eine Mischung aus Aufregung, Erwartung, Geheimnis sowie dem Ernst von Schicksal und Pflicht
Aussprache: Klar und bedächtig, mit leicht formellem Rhythmus; Wörter wie "hast", "thou" und "doth" werden langsam betont, um altenglische Aussprachemuster widerzuspiegeln
Pausen: Nach altenglischen Wendungen wie "Lo!" und "Hark!" sowie zwischen Satzteilen wie "Choose thy path", um die Bedeutung der Entscheidung zu betonen und dem Zuhörer Raum zu geben, über den Ernst der Quest nachzudenken
2 Kommentare
Hacker-News-Kommentar
Diese Modelle sind deutlich günstiger als ElevenLabs
gpt-4o-mini-ttskostet beispielsweise 0,015 $ pro Audiominute und ist damit 85 % günstiger als ElevenLabsJeff von OpenAI weist darauf hin, dass neue Audiomodelle veröffentlicht wurden
Es werden Zuverlässigkeitsprobleme bei Text-zu-Sprache- und Sprache-zu-Text-Modellen erwähnt
Es wird gefragt, wie man zusammen mit dem generierten Audio "speech marks" erhalten kann
Die jüngsten Fortschritte bei großen Text-zu-Sprache- und Sprache-zu-Text-Modellen
Im Feld "vibe" lassen sich je nach eingegebenem Text verschiedene Betonungen und Persönlichkeiten umsetzen
Reaktion bei Eingabe der Navy-Seal-Copypasta
Die Stimme des neuen Modells habe ein feines Zittern und wirke deshalb schlechter als Siri
Das offizielle Tool von OpenAI ist mit der Ankündigung des neuen Modells verknüpft
Wichtige Zitate aus der offiziellen Ankündigung
gpt-4o-mini-ttskostet mit 0,015 $ pro Minute wenig genug für den praktischen EinsatzAuch auf Koreanisch funktioniert es perfekt.