16 Punkte von xguru 2023-05-24 | 3 Kommentare | Auf WhatsApp teilen
  • Massively Multilingual Speech
  • Ein Projekt zur Entwicklung eines einzelnen Sprachmodells, das Tausende von Sprachen unterstützt – als nächster Schritt über Spracherkennungsmodelle hinaus, die bislang nur rund 100 Sprachen unterstützen, mit dem Ziel, die über 7000 auf der Erde verwendeten Sprachen abzudecken
  • Bietet mehr als 1100 mehrsprachige Spracherkennungs- (ASR) und Sprachsynthese-Modelle (TTS), mehr als 4000 Sprachidentifikationsmodelle (LID) sowie mehr als 1400 vortrainierte Sprachmodelle
  • Ziel ist es, Menschen den Zugriff auf und die Nutzung von Informationen in ihrer gewünschten Sprache direkt auf dem Gerät zu ermöglichen
  • Als Teil des Projekts wurde ein Datenset mit durchschnittlich 32 Stunden gelesener Aufnahmen des Neuen Testaments pro Sprache für 1100 Sprachen aufgebaut; mithilfe verschiedener unannotierter Aufnahmen christlicher Dokumente wurde die Zahl der unterstützten Sprachen auf 4000 erweitert

Herunterladbare Modelldateien

  • Vortrainierte Modelle: MMS-300M (3.5GB) und MMS-1B (10GB)
  • Veröffentlichung von ASR-Spracherkennungsmodellen und Wörterbüchern: MMS-1B:FL102 (102 Sprachen, 4.5GB), MMS-1B:L1107 (1107 Sprachen, 13GB), MMS-1B-all (1162 Sprachen, 13.7GB)
  • TTS-Sprachsynthesemodelle: Generator- und Vokabular-Dateien für jeweils 1107 Sprachen
  • LID-Sprachidentifikationsmodelle: 126, 256, 512, 1024, 2048 und 4017 Modelle samt Wörterbüchern

3 Kommentare

 
kuroneko 2023-05-24

In letzter Zeit erscheinen viele Modelle für Spracherkennung oder TTS.
Es scheint, als würde die Leistung in diesem Bereich schon bald deutlich zulegen.

Aber wenn man Christ ist, steigt dann auch die Spracherkennungsrate? 🤔

 
koyokr 2023-05-24

Haha

 
cosine20 2023-05-24

......