- OpenAI-Frontier-Modelle und Codex sind jetzt offiziell auf AWS verfügbar, sodass Millionen von AWS-Kunden mit OpenAI auf der Plattform entwickeln können, auf der sie bereits ihr Geschäft betreiben
- Unternehmen können Frontier AI über bestehende Workflows für Sicherheit, Compliance, Beschaffung, Abrechnung und Governance in die Produktion bringen, wodurch die Reibung vom Evaluieren bis zur tatsächlichen Bereitstellung sinkt
- OpenAI models on Amazon Bedrock ermöglicht den Aufbau von KI-Anwendungen mit nativen AWS-Sicherheits- und Governance-Kontrollen
- Codex on Amazon Bedrock bringt den Software-Engineering-Agenten von OpenAI, den wöchentlich mehr als 5 Millionen Menschen nutzen, in AWS-Umgebungen und unterstützt beim Schreiben, Reviewen, Debuggen und Modernisieren von Code
- Künftig soll Daybreak AWS-Kunden zur Verfügung gestellt und um Sicherheits-Code-Reviews, Threat Modeling, Patch-Verifizierung, Analyse von Abhängigkeitsrisiken, Erkennung und Verbesserungshinweise in den täglichen Entwicklungszyklus erweitert werden
OpenAI auf AWS in die Produktion bringen
- OpenAI-Frontier-Modelle und Codex sind auf AWS allgemein verfügbar
- AWS-Kunden können OpenAI-Funktionen über die AWS-Plattform nutzen, auf der sie bereits ihr Geschäft betreiben
- Zentrale Hürden für Unternehmen wie Sicherheit, Compliance, Beschaffung, Abrechnung und Governance lassen sich innerhalb bestehender Workflows bewältigen
- Organisationen können operative Hürden reduzieren und sich schneller von der Evaluierungsphase zur realen Bereitstellung bewegen
Bereitstellung und Ausbaupläne
- OpenAI models on Amazon Bedrock ermöglicht es, KI-Anwendungen mit nativen AWS-Sicherheits- und Governance-Kontrollen zu erstellen
- Codex on Amazon Bedrock wird als Software-Engineering-Agent bereitgestellt, der Teams in der AWS-Umgebung unterstützt, in der sie bereits entwickeln und deployen, und beim Schreiben, Reviewen, Debuggen und Modernisieren von Code hilft
- Beide Angebote sind in AWS Commercial- und GovCloud-Regionen verfügbar
- OpenAI und AWS planen, die über AWS bereitgestellten OpenAI-Funktionen weiter auszubauen, damit Teams mit weniger Reibung und höherer Sicherheit von der Evaluierung in die Produktion wechseln können
- Das künftig verfügbare Daybreak umfasst Cyber-Modelle und Codex Security und ist darauf ausgelegt, dass Cyber-Verteidiger Risiken früher erkennen, schneller reagieren und Software widerstandsfähiger machen können
1 Kommentare
Hacker-News-Kommentare
Jedes Mal, wenn ich sehe, wie jemand fragt, warum man AWS, Azure oder GCP vertraut und warum man dafür einen Aufpreis zahlt, denke ich: Du hast wohl noch nie in einem Enterprise-Umfeld gearbeitet.
Der Großkonzern, für den ich arbeite, hat strikte Data-Governance-Vorgaben in Kundenverträgen und zusätzlich eigene Governance-Anforderungen. Einen Anbieter zu nutzen, der nicht nur von der Informationssicherheit freigegeben ist, sondern in Kundenverträgen ausdrücklich als Datenverarbeiter genannt wird, ist der Weg, Kündigung und Klagen zu vermeiden.
Zu Hause kannst du mit deinem Code und deinen Daten machen, was du willst, aber mit Unternehmens- und Kundendaten auf keinen Fall. Aus demselben Grund verwendet man auch nicht einfach irgendein angesagtes Frontier-Modell. Nebenprojekte und Startups haben komplett andere Einschränkungen und Abwägungen.
Das Kleingedruckte ist ziemlich interessant. Die Verantwortung für Datenverlust liegt meist beim Kunden, für SLA-Forderungen muss man konkrete Belege vorlegen, und die akzeptierte Abhilfe besteht oft nur aus Gutschriften für die zukünftige Nutzung genau des Produkts, das gerade die Daten verloren hat.
Die Bedingungen von AWS sind im Vergleich zu GCP sogar ziemlich vernünftig. Die SLA von GCP scheint Enterprise-Einkaufsteams vor allem dabei zu helfen zu sagen: „Es gibt ja eine SLA, also haben wir unsere Due Diligence gemacht und werden nicht gefeuert, wenn wir das auswählen.“ Gleichzeitig kann GCP sagen: „Als ihr den Vertrag unterschrieben habt, habt ihr die vorgeschlagene Abhilfe bereits akzeptiert, also zeigen wir euch diese Klausel, falls ihr klagt. Danke für euer Vertrauen.“ [0]
[0] https://docs.cloud.google.com/storage/docs/storage-classes
Standard-Multi-Region- oder Dual-Region-Storage hat eine Verfügbarkeits-SLA von 99,95 %, regionaler Standard 99,9 %, und regionales Nearline, Coldline oder Archive kann bis auf 99,0 % sinken. Die Gutschriften betragen 10 %, 25 % oder 50 % der monatlichen Rechnung für die betroffene Serviceklasse, mit einer monatlichen Obergrenze von insgesamt 50 %, und sie gelten für zukünftige Nutzung. Google sagt außerdem, dass Kunden auf Gutschriften verzichten, wenn sie diese nicht innerhalb von 30 Tagen anfordern.
AWS kann natürlich auch kompromittiert werden, aber dort hat man viel dafür getan, die Wahrscheinlichkeit etwas zu senken und die Nachverfolgung zu erleichtern, welche Kunden betroffen waren. Wenn man sich zum Beispiel in AWS-Logging eingräbt, wird, sobald es aktiviert ist, wirklich sehr viel protokolliert, sodass man nachvollziehen kann, wer was an Berechtigungen oder Umgebungen geändert hat. Ich vermute, auch der Zugriff von AWS-Mitarbeitern wird ziemlich gut erfasst. Früher musste ich mehrere Schritte durchlaufen, um überhaupt einen AWS-Mitarbeiter an mein Konto zu lassen.
Ich war schockiert, wie schwierig es war, auch nur eine GitHub-Copilot-Lizenz auf Azure zu verwenden. Obwohl beides Microsoft-Produkte sind, musste die IT erst herausfinden, wie man GitHub Enterprise einrichtet, es mit dem Azure-Abonnement verbindet und allerlei andere Dinge erledigt.
Wenn du schon einmal AI-Coding-Modelle in einem Großunternehmen verwendet hast, weißt du, dass viele Enterprise-Deployments faktisch die Nutzung von AWS Bedrock verlangen. Die Gründe sind einfach:
Wir arbeiten nicht in den USA, und es gibt starke Anforderungen, dass die Daten in unserem Land bleiben müssen, und Bedrock bietet genau diese Kontrolle.
Wenn das die Richtung ist, frage ich mich, wie AI in Zukunft weiter wachsen soll. Wenn man davon ausgeht, dass die meisten wertvollen Daten hinter solchen Firewalls liegen, dann sind die öffentlich verfügbaren Daten bereits abgeerntet, und es könnte sein, dass auf illegal beschafften Daten trainiert wurde. Das ist eine Grauzone.
Enden wir dann letztlich bei einem geschlossenen Ökosystem ohne externe Inputs?
Falls du dich fragst, warum man für diese APIs über AWS extra zahlt, statt sie direkt zu nutzen: In manchen Unternehmen ist es fast unmöglich, einen neuen Anbieter genehmigt zu bekommen. Wenn das Unternehmen einen AWS-Vertrag hat, muss man eben das nutzen, was AWS anbietet.
Je nach Kundenvertrag muss man den neuen Anbieter vielleicht auch den Kunden mitteilen, was wiederum eine neue Sicherheitsprüfung auslösen kann. Wenn es aber nur darum geht, in Bedrock noch ein Modell hinzuzufügen? Viel einfacher.
Für OpenAI sind das riesige Neuigkeiten. Es haben deutlich mehr Enterprises Claude übernommen, nur weil es auf AWS verfügbar war, als man sich vorstellen würde, und jetzt gibt es ernsthafte Konkurrenz.
Das ist ein guter Schritt für OpenAI und etwas, worüber Anthropic sich Sorgen machen sollte. Wegen AWS-Abhängigkeiten und Sicherheitsanforderungen war Bedrock für mich lange Zeit die einzige Möglichkeit, überhaupt Foundation-Modelle zu verwenden.
Über den Verlust des First-Mover-Vorteils werden sie sich wohl nicht freuen, aber sie dürften das schon seit Langem erwartet haben.
Gute Nachricht für den Wettbewerb.
Claude Code lässt weiter neue Funktionen für Nutzer weg, die es über Amazon Bedrock verwenden. Dazu gehören zum Beispiel Auto-Modus, der Ultra-Plan und Claude for Chrome. Mit mehr Konkurrenz überdenken sie vielleicht ihre Strategie.
Ich habe eine Zeit lang einen Emulator für api.anthropic.com gebaut, der die Requests „heimlich“ an Amazon Bedrock weiterleitet. Das funktioniert gut, und jetzt kann man sogar Features nutzen, die eigentlich nur für First-Party-Bereitstellung gedacht sind.
Anthropic sollte wohl schnell an die Börse gehen. Das enorme Umsatzwachstum war faktisch das Ergebnis des missglückten Gemini-Launches und davon, dass OpenAI durch Azure gebunden und ausgebremst war.
Anthropic-Modelle waren buchstäblich die einzige praktisch nutzbare serverlose API auf AWS, also die einzigen wirklich brauchbaren Bedrock-Modelle. Die jüngeren Qwen-3.5/3.6-Modelle wurden gar nicht erst veröffentlicht. Dazu kommt noch der Trend hin zu Token-Effizienz und ROI-Fokus; ich würde wirklich gern sehen, wie Anthropic das dritte Quartal abschließt.
Die Frontier-Labs stellen den Hyperscalern eingefrorene Modell-Builds zur Verfügung, die nur Serving machen und keine Daten absaugen. Für die meisten Unternehmen, die Frontier-LLMs mit sensiblen Daten nutzen wollen, ist das eine Grundvoraussetzung.
Schlechte Nachrichten für Azure. Sie waren die Auserwählten, konnten aber die Nachfrage nicht bedienen.
Als OpenAI sich aus dem Exklusivvertrag löste mit der Begründung, Azure sei nicht zuverlässig genug, war klar, dass das nächste Ziel AWS sein würde.