- Amazon „Alexa"
- Das Alexa-AI-Team entwickelte 2019 Tools zur Erzeugung synthetischer Daten.
- Diese Tools wurden genutzt, um Amazons KI-Assistenten „Alexa“ in Versionen für Hindi, in den USA verwendetes Spanisch und in Brasilien verwendetes Portugiesisch bereitzustellen.
- Bei Amazon gab es Fälle, in denen die Datenmenge nicht ausreichte, um verlässliche Natural-Language-Understanding-Modelle zu trainieren.
- Um dies auszugleichen, entschied man sich, synthetische Daten zu erzeugen.
- Eines von Amazons Tools zur Erzeugung synthetischer Daten verwendet eine Technik namens „Grammatikinduktion“.
- Dabei werden einige Referenzbefehle analysiert, um allgemeine Satzstrukturen und semantische Formen (Muster) zu erlernen.
- Aus diesen Formen werden Tausende neuer, ähnlicher Sätze erzeugt.
- Ein weiteres Tool erstellt neue Sätze, indem es Wörter und Phrasen aus Beispielen der verfügbaren Daten neu kombiniert.
- Amazons „Just Walk Out“-Technologie
- Amazon nutzt synthetische Daten auch, um die „Just Walk Out (JWO)“-Technologie weiterzuentwickeln.
- Dabei handelt es sich um eine Technologie, bei der Kunden am Eingang eine Kreditkarte oder App scannen, dann den Laden betreten, die gewünschten Produkte mitnehmen und beim Verlassen automatisch bezahlen. Sie ist auch als Betriebstechnologie der kassenlosen Läden „Amazon Go“ bekannt.
- In der JWO-Technologie kommen Deep Learning, Computer Vision und Sensorfusion zusammen.
- Sie stellt fest, „wer was mitgenommen hat“.
- Amazon kam zu dem Schluss, dass AI-Modelle vielfältige Trainingsdaten benötigen, um eine höhere Genauigkeit zu gewährleisten, und beschloss, dies mit synthetischen Daten zu ergänzen.
- Im Zusammenhang mit der JWO-Technologie wurden synthetische Datensätze aufgebaut, die verschiedene Varianten realistischer Einkaufsszenarien nachbilden.
- So erzeugte Amazon mithilfe synthetischer Daten zahlreiche synthetische Figuren, um sicherzustellen, dass in den Filialen viele Kunden gleichzeitig verarbeitet werden können.
- Außerdem wurde vor der Vergrößerung der Ladenfläche mithilfe synthetischer Daten testweise auch ein virtuelles Modell eines größeren Lebensmittelgeschäfts erstellt.
- J.P. Morgan
- Bei J.P. Morgan erzeugt das AI-Research-Team synthetische Daten für den Finanzbereich.
- Es entwickelt synthetische Datensätze für Verhaltensweisen zur Geldwäschebekämpfung, Bewegungsverläufe von Kunden, Marktausführungsdaten und Zahlungsdaten zur Betrugserkennung.
- J.P. Morgan erklärte: „In der Finanzdienstleistungsbranche fallen viele nützliche Daten an, doch sie waren oft schwer nutzbar.“
- Das Unternehmen richtet seine Aufmerksamkeit auf synthetische Daten als Mittel, um neue datenabhängige Produkte und Services zu innovieren und aufzubauen.
- Es erstellt synthetische Datensätze, um Forschung und Modellentwicklung im Finanzdienstleistungsbereich zu beschleunigen.
- Anthem
- Der US-Krankenversicherer Anthem arbeitet mit Google Cloud zusammen, um eine Plattform für synthetische Daten zu entwickeln.
- Das Unternehmen plant, mithilfe von Algorithmen und statistischen Modellen synthetische Daten im Umfang von etwa 1,5 bis 2 Petabyte zu erzeugen.
- Diese Daten umfassen künstlich erstellte Datensätze zu Krankengeschichten, Erstattungsansprüchen aus Krankenversicherungen und anderen zentralen Gesundheitsdaten.
- Die synthetischen Daten sollen verwendet werden, um AI-Algorithmen zu validieren und zu trainieren, die betrügerische Versicherungsansprüche oder Auffälligkeiten in den Gesundheitsakten von Menschen erkennen.
- Anthem plant den Aufbau einer Plattform für synthetische Daten, um Betrug besser zu erkennen und Mitgliedern personalisierte Betreuung zu bieten.
1 Kommentare
Offenbar wurde
Synthetic datamit „synthetische Daten“ übersetzt. Ich denke, „künstliche Daten“ ist passender.