5 Punkte von rkawkancla 6 일 전 | Noch keine Kommentare. | Auf WhatsApp teilen

Ich habe ein Open-Source-Tool gebaut, mit dem man koreanische Meetings lokal aufzeichnen, transkribieren, zusammenfassen, in einem Decision Wiki organisieren und durchsuchen (AI-Chat) kann.

Ich hoffe, dass es Menschen hilft, die wie ich aus beruflichen Gründen keine externen AI- oder Meeting-Aufzeichnungs-/Transkriptionsdienste nutzen können.
An Tagen mit mehr als 10 Meetings wartet oft Überstundenarbeit, selbst wenn man nur die Protokolle und Action Items aus den Meetings prüft.
Das Problem war weniger, überhaupt Protokolle zu hinterlassen, sondern sie in einer Form zu speichern, die sich später wiederfinden lässt.

Deshalb entwickle ich es mit dem Ziel, statt einer einfachen Meeting-Transkription ein lokales Decision Wiki aufzubauen, das Entscheidungen und Action Items aus Meetings zusammen mit den Belegstellen im Original sammelt.

  • Damit es auch auf einem M4 mit 16 GB laufen kann....

Aktuell ist der angestrebte Ablauf folgender:

  • Lokale Ausführung auf einem Apple Silicon Mac
  • Aufzeichnung/Transkription koreanischer Meetings
  • Sprechertrennung
  • Korrektur/Zusammenfassung auf Basis eines lokalen LLM (Gemma E4B)
  • Meeting-Suche auf Basis von ChromaDB + SQLite FTS5
  • Aufbereitung von Entscheidungen und Action Items als Markdown-Wiki
  • Prüfung der originalen Timestamp-Belege aus dem Wiki-Eintrag
  • Suche/Chat auf Basis des Meeting-Originaltexts und des Wikis

Alle Verarbeitungsschritte sind so ausgelegt, dass sie lokal stattfinden. Vorrangig berücksichtigt wurden Umgebungen, in denen Meeting-Daten nur schwer an externe APIs gesendet werden können oder interne Diskussionen einer Organisation nicht in externe Dienste hochgeladen werden dürfen.

Es ist noch eine frühe Beta und ausschließlich für Apple Silicon Macs gedacht. (Andere Umgebungen lassen sich nur schwer testen...)

Da viele Modelle benötigt werden, ist auch die Installation nicht völlig leichtgewichtig.
Um das pyannote-Modell zur Sprechertrennung zu nutzen, sind die Zustimmung zum HuggingFace gated model und die Einrichtung eines Tokens erforderlich, und weil lokale Modelle verwendet werden, gibt es auch Hardware-Anforderungen.

Trotzdem habe ich es veröffentlicht, weil ich denke, dass es für Menschen wie mich nützlich sein könnte: Menschen mit vielen Meetings, die jedes Mal viel Zeit für die Dokumentation von Entscheidungen aufwenden müssen und in einer Umgebung arbeiten, in der die Anbindung an externe AI schwierig ist.

Ich würde mich über Feedback oder Berichte von ähnlichen Erfahrungen freuen.

Noch keine Kommentare.

Noch keine Kommentare.