Haru Ongi – KI-Sprach-Tagebuch der Dankbarkeit
(play.google.com)Hallo.
Ich bin ein Entwickler, der sich wünscht, dass KI-Technologie zu einem warmherzigen Werkzeug wird, das den Alltag der Menschen positiv verändert.
In dem Glauben, dass kleine tägliche Aufzeichnungen und Reflexionen zusammen das Leben verändern,
habe ich die Dankbarkeitstagebuch-App „Haru Ongi“ entwickelt, die jeder einfach und kontinuierlich nutzen kann.
Es gibt bereits viele hervorragende KI-Tagebuch-Apps auf dem Markt, aber ich hatte das Gefühl, dass es Grenzen hat, sich nur durch Text trösten zu lassen.
Ich brauchte eine „Stimme“, die klingt, als würde ein echter Freund neben mir sprechen.
Dafür habe ich mit dem neuesten Gemini-Modell natürliches Audio-Feedback umgesetzt.
[Servicevorstellung]
Haru Ongi ist eine App, bei der der von mir ausgewählte KI-Charakter sofort mit einer „Sprach“-Antwort voller Empathie und Ermutigung reagiert, sobald ich ein Dankbarkeitstagebuch schreibe.
[Hauptfunktionen]
-
Sprachantwort eines KI-Freundes:
Sobald ein Tagebucheintrag geschrieben ist, wird der Inhalt analysiert und ein Feedback als Sprache erzeugt. -
Drei charakterstarke KI-Freunde:
-
der fröhliche und warmherzige Freund „Seona“: wenn man positive Energie braucht
-
der ruhige und freundliche Mentor „Hyeonjun“: wenn man Rat für persönliches Wachstum braucht
-
die stets auf meiner Seite stehende, geborgene „Großmutter Sunja“: wenn man warmen Trost und Empathie braucht
-
-
Datenschutz:
- Die von Nutzern geschriebenen Tagebucheinträge werden mit AES256-Verschlüsselung sicher gespeichert.
[Tech-Stack & Entwicklungserfahrung]
-
AI Model: Google Gemini 2.5 Flash Native Audio Preview
- Im Vergleich zu einem Ansatz, bei dem nach der Texterzeugung TTS angehängt wird, wirkte das Native-Audio-Modell bei Intonation und Atmung (Pause) deutlich natürlicher.
- Besonders bei der Umsetzung der warmen und gemächlichen Sprechweise des Charakters „Sunja (Großmutter)“ war es effektiv.
- Durch Anpassung der Prompts konnte ich Persona, Sprechgeschwindigkeit, Atmung, Tonfall und emotionale Ausdrucksweise der einzelnen Charaktere fein abstimmen und so die gewünschte Stimme erzeugen.
- Auch die GPT Realtime API von OpenAI wurde geprüft, aber unter Berücksichtigung der Kosteneffizienz ($20.00 per 1M tokens) wurde am Ende alles in Gemini integriert.
-
Cost Optimization:
- Da die Kosten für Audio-Output-Token deutlich höher sind als für Text ($12.00 per 1M tokens), war ein Optimierungsprozess nötig, bei dem die Antwortlänge über den System-Prompt gesteuert wurde.
-
UI Workflow: Die Entwicklungseffizienz wurde mit Figma Dev Mode erhöht.
- Wenn man der KI die Designentwürfe und Asset-Informationen aus Figma gemeinsam als Kontext bereitstellt, wurde die UI-Implementierung deutlich einfacher.
-
Backend: Supabase (DB, Auth), Railway (Fastify), Cloudflare R2 (File Storage)
-
Frontend: React Native (Expo), TypeScript
-
Dev Tools: Claude Code (Main), Cursor (Sub)
[Abschluss]
Wenn sich dein Herz heute müde anfühlt, schau gern einmal vorbei.
Derzeit ist die App nur für Android verfügbar.
Vielen Dank.
3 Kommentare
Jetzt auch im App Store erhältlich!
https://smplu.link/F8JwF
Ich feuere das Projekt an, weil ich einen ähnlichen Service gebaut habe und ihn allein nutze! Ich hoffe, es wird ein großartiges Produkt. Ich sollte es auf Native Audio umstellen und noch einmal entwickeln.
Vielen Dank für die Unterstützung, haha. Die Stimme des Native-Audio-Modells klingt ziemlich natürlich, daher denke ich, dass Sie eine gute Erfahrung machen werden, wenn Sie es ausprobieren.