2 Punkte von GN⁺ 10 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • OpenAI-Frontier-Modelle und Codex sind jetzt offiziell auf AWS verfügbar, sodass Millionen von AWS-Kunden mit OpenAI auf der Plattform entwickeln können, auf der sie bereits ihr Geschäft betreiben
  • Unternehmen können Frontier AI über bestehende Workflows für Sicherheit, Compliance, Beschaffung, Abrechnung und Governance in die Produktion bringen, wodurch die Reibung vom Evaluieren bis zur tatsächlichen Bereitstellung sinkt
  • OpenAI models on Amazon Bedrock ermöglicht den Aufbau von KI-Anwendungen mit nativen AWS-Sicherheits- und Governance-Kontrollen
  • Codex on Amazon Bedrock bringt den Software-Engineering-Agenten von OpenAI, den wöchentlich mehr als 5 Millionen Menschen nutzen, in AWS-Umgebungen und unterstützt beim Schreiben, Reviewen, Debuggen und Modernisieren von Code
  • Künftig soll Daybreak AWS-Kunden zur Verfügung gestellt und um Sicherheits-Code-Reviews, Threat Modeling, Patch-Verifizierung, Analyse von Abhängigkeitsrisiken, Erkennung und Verbesserungshinweise in den täglichen Entwicklungszyklus erweitert werden

OpenAI auf AWS in die Produktion bringen

  • OpenAI-Frontier-Modelle und Codex sind auf AWS allgemein verfügbar
  • AWS-Kunden können OpenAI-Funktionen über die AWS-Plattform nutzen, auf der sie bereits ihr Geschäft betreiben
  • Zentrale Hürden für Unternehmen wie Sicherheit, Compliance, Beschaffung, Abrechnung und Governance lassen sich innerhalb bestehender Workflows bewältigen
  • Organisationen können operative Hürden reduzieren und sich schneller von der Evaluierungsphase zur realen Bereitstellung bewegen

Bereitstellung und Ausbaupläne

  • OpenAI models on Amazon Bedrock ermöglicht es, KI-Anwendungen mit nativen AWS-Sicherheits- und Governance-Kontrollen zu erstellen
  • Codex on Amazon Bedrock wird als Software-Engineering-Agent bereitgestellt, der Teams in der AWS-Umgebung unterstützt, in der sie bereits entwickeln und deployen, und beim Schreiben, Reviewen, Debuggen und Modernisieren von Code hilft
  • Beide Angebote sind in AWS Commercial- und GovCloud-Regionen verfügbar
  • OpenAI und AWS planen, die über AWS bereitgestellten OpenAI-Funktionen weiter auszubauen, damit Teams mit weniger Reibung und höherer Sicherheit von der Evaluierung in die Produktion wechseln können
  • Das künftig verfügbare Daybreak umfasst Cyber-Modelle und Codex Security und ist darauf ausgelegt, dass Cyber-Verteidiger Risiken früher erkennen, schneller reagieren und Software widerstandsfähiger machen können

1 Kommentare

 
Hacker-News-Kommentare
  • Jedes Mal, wenn ich sehe, wie jemand fragt, warum man AWS, Azure oder GCP vertraut und warum man dafür einen Aufpreis zahlt, denke ich: Du hast wohl noch nie in einem Enterprise-Umfeld gearbeitet.
    Der Großkonzern, für den ich arbeite, hat strikte Data-Governance-Vorgaben in Kundenverträgen und zusätzlich eigene Governance-Anforderungen. Einen Anbieter zu nutzen, der nicht nur von der Informationssicherheit freigegeben ist, sondern in Kundenverträgen ausdrücklich als Datenverarbeiter genannt wird, ist der Weg, Kündigung und Klagen zu vermeiden.
    Zu Hause kannst du mit deinem Code und deinen Daten machen, was du willst, aber mit Unternehmens- und Kundendaten auf keinen Fall. Aus demselben Grund verwendet man auch nicht einfach irgendein angesagtes Frontier-Modell. Nebenprojekte und Startups haben komplett andere Einschränkungen und Abwägungen.

    • Ich frage mich, ob du dir mal den eigentlichen AWS-Vertrag und die Haftungsbeschränkungen angesehen hast, die in den verlinkten Vertrags- und Marketingunterlagen genannt werden.
      Das Kleingedruckte ist ziemlich interessant. Die Verantwortung für Datenverlust liegt meist beim Kunden, für SLA-Forderungen muss man konkrete Belege vorlegen, und die akzeptierte Abhilfe besteht oft nur aus Gutschriften für die zukünftige Nutzung genau des Produkts, das gerade die Daten verloren hat.
      Die Bedingungen von AWS sind im Vergleich zu GCP sogar ziemlich vernünftig. Die SLA von GCP scheint Enterprise-Einkaufsteams vor allem dabei zu helfen zu sagen: „Es gibt ja eine SLA, also haben wir unsere Due Diligence gemacht und werden nicht gefeuert, wenn wir das auswählen.“ Gleichzeitig kann GCP sagen: „Als ihr den Vertrag unterschrieben habt, habt ihr die vorgeschlagene Abhilfe bereits akzeptiert, also zeigen wir euch diese Klausel, falls ihr klagt. Danke für euer Vertrauen.“ [0]
      [0] https://docs.cloud.google.com/storage/docs/storage-classes
      Standard-Multi-Region- oder Dual-Region-Storage hat eine Verfügbarkeits-SLA von 99,95 %, regionaler Standard 99,9 %, und regionales Nearline, Coldline oder Archive kann bis auf 99,0 % sinken. Die Gutschriften betragen 10 %, 25 % oder 50 % der monatlichen Rechnung für die betroffene Serviceklasse, mit einer monatlichen Obergrenze von insgesamt 50 %, und sie gelten für zukünftige Nutzung. Google sagt außerdem, dass Kunden auf Gutschriften verzichten, wenn sie diese nicht innerhalb von 30 Tagen anfordern.
    • Dazu kommt, dass zwischen „Dieses Team hat 1.000 Dollar für AI auf den Kostenbericht gesetzt, was haben sie dafür bekommen?“ und „Die gesamte AWS-Rechnung des Unternehmens ist um ein paar Prozent gestiegen, schauen wir uns das an, wenn wir Zeit haben“ ein gewaltiger Unterschied besteht. Letzteres macht ein Projekt viel realistischer.
    • Die Sicherheitslage von AWS ist anders. AI-Startups, Startup-Webapp-Baukasten-Tools und VSCode-Plugin-Anbieter werden mit hoher Wahrscheinlichkeit gehackt und verlieren Daten.
      AWS kann natürlich auch kompromittiert werden, aber dort hat man viel dafür getan, die Wahrscheinlichkeit etwas zu senken und die Nachverfolgung zu erleichtern, welche Kunden betroffen waren. Wenn man sich zum Beispiel in AWS-Logging eingräbt, wird, sobald es aktiviert ist, wirklich sehr viel protokolliert, sodass man nachvollziehen kann, wer was an Berechtigungen oder Umgebungen geändert hat. Ich vermute, auch der Zugriff von AWS-Mitarbeitern wird ziemlich gut erfasst. Früher musste ich mehrere Schritte durchlaufen, um überhaupt einen AWS-Mitarbeiter an mein Konto zu lassen.
    • Kurz gesagt: Niemand wurde je gefeuert, weil er IBM gekauft hat.
    • Ich bin gerade erst aus einem lockeren Umfeld, in dem man beliebige AI-Harnesses oder Modelle nutzen konnte, in ein streng reguliertes Enterprise-Umfeld gewechselt.
      Ich war schockiert, wie schwierig es war, auch nur eine GitHub-Copilot-Lizenz auf Azure zu verwenden. Obwohl beides Microsoft-Produkte sind, musste die IT erst herausfinden, wie man GitHub Enterprise einrichtet, es mit dem Azure-Abonnement verbindet und allerlei andere Dinge erledigt.
  • Wenn du schon einmal AI-Coding-Modelle in einem Großunternehmen verwendet hast, weißt du, dass viele Enterprise-Deployments faktisch die Nutzung von AWS Bedrock verlangen. Die Gründe sind einfach:

    1. Großunternehmen haben oft bereits eine Beziehung zu AWS, daher ist es prozessual viel einfacher als eine neue Anbieterbeziehung aufzubauen.
    2. Großunternehmen haben häufig starke interne Anforderungen, dass interne Daten unter Kontrolle des Unternehmens bleiben müssen. Mit AWS Bedrock kann man viel eher sicher sein, dass das, was man in ein Modell eingibt, nicht irgendwo in einem Trainingsdatensatz landet. Bei uns ist es wegen dieser Anforderung Pflicht, nicht direkt die OpenAI-API zu verwenden, sondern über AWS Bedrock zu gehen.
    • Wenn man noch einen Schritt weitergeht, ist es oft deshalb praktisch unmöglich, einen neuen Anbieter hinzuzufügen, weil man in diversen Kundenverträgen in unterschiedlicher Form versprochen hat, Kundendaten nicht an andere Anbieter weiterzugeben.
    • Bei vielen LLMs erlaubt Bedrock zu steuern, in welchem Land die Daten verbleiben. Bei der Claude API gibt es diese Kontrolle zum Beispiel nicht.
      Wir arbeiten nicht in den USA, und es gibt starke Anforderungen, dass die Daten in unserem Land bleiben müssen, und Bedrock bietet genau diese Kontrolle.
    • Interessanter Punkt.
      Wenn das die Richtung ist, frage ich mich, wie AI in Zukunft weiter wachsen soll. Wenn man davon ausgeht, dass die meisten wertvollen Daten hinter solchen Firewalls liegen, dann sind die öffentlich verfügbaren Daten bereits abgeerntet, und es könnte sein, dass auf illegal beschafften Daten trainiert wurde. Das ist eine Grauzone.
      Enden wir dann letztlich bei einem geschlossenen Ökosystem ohne externe Inputs?
    • Ich frage mich, woher man die Sicherheit nimmt, dass Bedrock-Daten nicht an externe Anbieter weitergereicht werden.
  • Falls du dich fragst, warum man für diese APIs über AWS extra zahlt, statt sie direkt zu nutzen: In manchen Unternehmen ist es fast unmöglich, einen neuen Anbieter genehmigt zu bekommen. Wenn das Unternehmen einen AWS-Vertrag hat, muss man eben das nutzen, was AWS anbietet.

    • Moment mal, verkauft AWS hier den Zugang zu den Servern irgendeines AI-Unternehmens weiter, oder laufen die Modelle auf eigener AWS-Hardware?
    • Selbst wenn man eine Freigabe bekommen könnte, erweitert sich der Umfang des jährlichen Sicherheitsaudits, es gibt einen weiteren Anbieter, den man in Sicherheitsbewertungen offenlegen muss, die Daten verteilen sich auf einen weiteren Verarbeiter, und es kommt eine zusätzliche Rechnung sowie mehr Budgetdiskussionen dazu.
      Je nach Kundenvertrag muss man den neuen Anbieter vielleicht auch den Kunden mitteilen, was wiederum eine neue Sicherheitsprüfung auslösen kann. Wenn es aber nur darum geht, in Bedrock noch ein Modell hinzuzufügen? Viel einfacher.
    • CEOs, Vorstände und mittlere Manager auf der ganzen Welt sind inzwischen vom AI-Hype erfasst. Selbst wenn man einen direkten Vertrag mit einem Frontier-Lab beantragen würde, sollte das doch eigentlich nicht mehr völlig blockiert werden, oder?
  • Für OpenAI sind das riesige Neuigkeiten. Es haben deutlich mehr Enterprises Claude übernommen, nur weil es auf AWS verfügbar war, als man sich vorstellen würde, und jetzt gibt es ernsthafte Konkurrenz.

  • Das ist ein guter Schritt für OpenAI und etwas, worüber Anthropic sich Sorgen machen sollte. Wegen AWS-Abhängigkeiten und Sicherheitsanforderungen war Bedrock für mich lange Zeit die einzige Möglichkeit, überhaupt Foundation-Modelle zu verwenden.

    • Claude wird bereits sowohl als Durchleitung von AWS zu den Anthropic-Servern als auch über Bedrock angeboten. https://aws.amazon.com/claude-platform/
      Über den Verlust des First-Mover-Vorteils werden sie sich wohl nicht freuen, aber sie dürften das schon seit Langem erwartet haben.
  • Gute Nachricht für den Wettbewerb.
    Claude Code lässt weiter neue Funktionen für Nutzer weg, die es über Amazon Bedrock verwenden. Dazu gehören zum Beispiel Auto-Modus, der Ultra-Plan und Claude for Chrome. Mit mehr Konkurrenz überdenken sie vielleicht ihre Strategie.

    • Das Merkwürdige ist, dass die Claude-Modelle auf Amazon Bedrock all diese Funktionen unterstützen.
      Ich habe eine Zeit lang einen Emulator für api.anthropic.com gebaut, der die Requests „heimlich“ an Amazon Bedrock weiterleitet. Das funktioniert gut, und jetzt kann man sogar Features nutzen, die eigentlich nur für First-Party-Bereitstellung gedacht sind.
    • Inzwischen funktioniert der Auto-Modus auch auf Bedrock.
  • Anthropic sollte wohl schnell an die Börse gehen. Das enorme Umsatzwachstum war faktisch das Ergebnis des missglückten Gemini-Launches und davon, dass OpenAI durch Azure gebunden und ausgebremst war.
    Anthropic-Modelle waren buchstäblich die einzige praktisch nutzbare serverlose API auf AWS, also die einzigen wirklich brauchbaren Bedrock-Modelle. Die jüngeren Qwen-3.5/3.6-Modelle wurden gar nicht erst veröffentlicht. Dazu kommt noch der Trend hin zu Token-Effizienz und ROI-Fokus; ich würde wirklich gern sehen, wie Anthropic das dritte Quartal abschließt.

  • Die Frontier-Labs stellen den Hyperscalern eingefrorene Modell-Builds zur Verfügung, die nur Serving machen und keine Daten absaugen. Für die meisten Unternehmen, die Frontier-LLMs mit sensiblen Daten nutzen wollen, ist das eine Grundvoraussetzung.

  • Schlechte Nachrichten für Azure. Sie waren die Auserwählten, konnten aber die Nachfrage nicht bedienen.
    Als OpenAI sich aus dem Exklusivvertrag löste mit der Begründung, Azure sei nicht zuverlässig genug, war klar, dass das nächste Ziel AWS sein würde.