2 Punkte von GN⁺ 2024-08-10 | 3 Kommentare | Auf WhatsApp teilen
  • Kostenlose „Web-App“, mit der sich aufgezeichnete Interviews einfach transkribieren lassen
  • Hauptfunktionen
    • Kein Wechsel zwischen Videoplayer und Dokumenteneditor nötig. Alles direkt im Browser
    • Pausieren, Zurückspulen und Vorspulen möglich, ohne die Hände von der Tastatur zu nehmen
    • Mit interaktiven Zeitstempeln lässt sich das Transkript leicht durchsuchen
    • Automatisches Speichern jede Sekunde im Browser-Speicher
    • Datenschutz – Audiodateien und Transkripte verlassen den Computer nicht
    • Export nach Markdown, Klartext und Google Docs möglich
    • Unterstützung für Videodateien über einen integrierten Player
    • Open Source unter der MIT-Lizenz

Zusammenfassung von GN⁺

  • oTranscribe ist eine kostenlose Web-App, die den Prozess der Transkription von Interviewaufnahmen vereinfacht
  • Nutzer können Audio steuern, ohne die Hände von der Tastatur zu nehmen, und das Transkript wird jede Sekunde automatisch gespeichert
  • Die App legt großen Wert auf Datenschutz: Audiodateien und Transkripte verlassen den Computer nicht
  • Sie bietet Exportfunktionen für Markdown, Klartext und Google Docs, sodass sich Transkripte in verschiedenen Formaten nutzen lassen
  • Andere Projekte mit ähnlichen Funktionen sind Express Scribe und TranscribeMe

3 Kommentare

 
xguru 2024-08-11

Hm? Ich habe mich gefragt, wie das im Browser möglich sein soll … aber offenbar ist es einfach nur ein Tool zum Anhören und manuellen Transkribieren, ganz ohne AI.
Heutzutage erkennt sogar Whisper Koreanisch ziemlich gut, daher frage ich mich, warum man so etwas unbedingt nutzen sollte …

 
znjadong 2024-08-14

Wenn es viele Sprecher gibt, die Aussprache unklar ist oder die Aufnahmequalität schlecht ist, lässt sich KI oft nur schwer nutzen. Und nicht selten braucht man auch eine Qualität, die über bloßes „gut genug“ funktionierend hinausgeht.

 
GN⁺ 2024-08-10
Hacker-News-Kommentare
  • Hat das Interview mit Whisper-diarization von MahmoudAshraf97 transkribiert

    • Erstellt Dateien, in denen die Beiträge mehrerer Sprecher nach Sprechernummer getrennt sind
    • Erstellt auch Dateien mit Zeitstempeln, die sich als Untertitel verwenden lassen
  • OTranscribe ist kein Tool zur automatischen Spracherkennung, sondern eine UI, die manuelle Transkription unterstützt

  • Sucht eine App, die Wort-für-Wort-Transkription in Echtzeit bietet, lokal läuft und aktuelle Open-Source-Modelle nutzen kann

    • Nutzt derzeit otter.ai, benötigt aber eine Internetverbindung und hat Probleme mit Verzögerungen bei der Transkription
    • Whisper-basierte Apps müssen die gesamte Aufnahme auf einmal verarbeiten
    • Apples Spracherkennungs-Framework hat derzeit noch gewisse funktionale Einschränkungen
  • Überraschend, dass es keine AI-Integration gibt

    • Auch AI-Ergebnisse benötigen für Veröffentlichungsqualität Prüfung und QA
    • Aufgaben wie Sprechererkennung und die Korrektur ungewöhnlicher Nachnamen sind notwendig
  • oTranscribe wandelt Audio nicht automatisch in Text um

    • Es ist ein Tool, das manuelle Transkription weniger schmerzhaft macht
  • Empfehlung für den Dienst TurboScribe

    • Bis zu 3 Dateien pro Tag kostenlos transkribierbar (30 Minuten pro Datei)
    • Im kostenpflichtigen Plan sind bis zu 10 Stunden Transkription pro Datei möglich
    • Unterstützt Sprechererkennung, verschiedene Exportformate und enthält AI-Tools
  • Experiment zur Interview-Transkription mit Gemini-1.5-Pro-Experiment-0801

    • Das Ergebnis ist nahezu perfekt
    • Beeindruckend war, dass bestimmte Wörter in Anführungszeichen gesetzt wurden
  • Nutzt die kostenlose iOS-App von Aiko

    • Verwendet das Whisper-Modell von OpenAI
    • Export in Formate wie SRT, TXT, CSV und JSON möglich
  • Entwickelt eine Open-Source-macOS-App mit Whisper und pyannote

    • Funktioniert, ist aber langsam
    • Hat Schwierigkeiten, Pyannote nach CoreML zu konvertieren
    • Beiträge willkommen
  • Entwickelt ein Tool mit AI

    • Download von YouTube, Transkription mit Vosk, Sprechertrennung mit pyannote
    • Speichert die Transkripte in einer Suchmaschine, Web-App muss noch umgesetzt werden
    • Hofft auf Zusammenarbeit