Die erstmals in Singapur veranstaltete Keynote der Qwen Conference markierte den offiziellen Übergang von Alibaba Cloud in das „Zeitalter der agentischen KI“. Vertreter der Regierung Singapurs, des Alibaba-Cloud-Managements sowie Partnerunternehmen wie Nous Research, Fireworks AI, NVIDIA und PicsArt traten auf die Bühne und kündigten Veränderungen bei Modellen, Infrastruktur, Tools und dem gesamten Ökosystem an. Die Kernbotschaft lautete, eine Full-Stack-Infrastruktur aufzubauen, die „Tokens in Intelligenz, Intelligenz in Handlungen und Handlungen in geschäftlichen Wert“ verwandelt.
Wichtigste Ankündigungen
-
Zusammenarbeit mit der Regierung Singapurs: Staatsminister Desmond Tan kündigte gemeinsam mit Alibaba Cloud, NTUC und ST Telemedia Global Data Centres eine Initiative an, die mehr als 1.000 lokalen Unternehmen, Entwicklern und Studierenden praxisnahe Schulungen zu generativer und agentischer KI bieten soll. Betont wurde das Prinzip: „KI ersetzt keine Arbeitskräfte, sondern arbeitet für sie.“
-
Vorstellung von Qwen 3.7 Max: Präsentiert wurde ein neues Foundation Model mit deutlich verbesserten Fähigkeiten in den Bereichen Coding, Tool-Nutzung (mit nativer Unterstützung des MCP-Protokolls), Multimodalität und Long-Horizon-Aufgaben. Laut Alibaba erreichte es Spitzenwerte in wichtigen Benchmarks wie SWE-Bench, IFBench und HLE.
-
Ankündigung von Qwen Cloud: Mit qwencloud.com wurde ein dediziertes Gateway für Agenten eingeführt. Es bietet mehr als 200 Modelle, tokenbasierte Preispläne (von 30 US-Dollar pro Monat für Standard bis Max) sowie workflowbasierte Automatisierung mit Skills und CLI.
-
Coder und Muron: Vorgestellt wurden das auf Notebooks installierbare Vibe-Coding-Tool Coder und der in der Cloud rund um die Uhr laufende Multi-Domain-Agent Muron. Muron wird bereits in 43 Ländern eingesetzt; zudem gab Alibaba bekannt, intern mit nur fünf Personen in sieben Tagen Coder Works selbst aufgebaut zu haben.
-
Agentische Cloud-Infrastruktur: Präsentiert wurde ein Full-Stack-Angebot mit MicroVM-basierten Sandboxes (Start in Millisekunden, Unterstützung für 10.000 gleichzeitige Sessions pro Tenant) sowie Agent ID, Governance, Sicherheit, Memory und Data Plane. MiniMax habe darauf Container-Starts in 20 bis 40 ms und eine Senkung der TCO um 40 % erreicht.
Technische Differenzierungsmerkmale
- Full-Stack-Integration: Alibaba betonte, einer von nur zwei Hyperscalern zu sein, die jede Ebene vom Silizium (eigene PPU, CIPU der 5. Generation) bis zum Foundation Model selbst besitzen.
- Agent-Native Cloud: Weg von einer auf menschliche Nutzer zugeschnittenen SaaS-zentrierten Struktur hin zu APIs und Infrastruktur, die Agenten direkt aufrufen und nutzen; dafür wird die gesamte Control Plane neu konzipiert.
- Offenes Ökosystem: Alibaba ist Platinum Member der PyTorch Foundation geworden und positioniert Model Studio als Multi-Model-Hub, indem auch konkurrierende Modelle wie Kimi, Zhipu, MiniMax, StepFun und Vidu aufgenommen werden.
Hervorgehobene Vorteile
- Kosteneffizienz: Mit tokenbasierten Plänen sollen Kostentransparenz und Budgetkontrolle verbessert werden; durch die automatische Modellauswahl von Coder ließen sich die Token-Kosten laut Alibaba um bis zu 70 % senken.
- Long-Horizon-Fähigkeit: Qwen 3.7 Max habe in Beispielen über 35 Stunden durchgehend gearbeitet, mehr als 1.000 Tool-Aufrufe ausgeführt und dabei durchschnittlich eine zehnfache Beschleunigung gezeigt.
- Vertrauen und Sicherheit: Alibaba verwies auf die Aufnahme in Gartners Magic Quadrant 2025 für Access Management als einziger Anbieter aus dem asiatisch-pazifischen Raum und hob Runtime-Sicherheitsfunktionen wie Agent Firewall und ID Guard hervor.
Genannte Grenzen und Herausforderungen
- Schwieriger Vertrauensaufbau: Tommy Eastman von Nous Research wies darauf hin, dass die reproduzierbare Ausführung identischer Aufgaben weiterhin eine große Herausforderung sei und ein dreistufiger Ansatz aus Modellqualität, Human-in-the-Loop und Governance zwischen Agenten erforderlich sei.
- Memory-Engpässe: Fireworks AI erklärte, der größte Engpass bei Inferenz sei nicht die Rechenleistung, sondern der Speicher für den KV-Cache; nötig seien mehrschichtige Storage-Systeme und ein systemisches Redesign.
- Neue Rolle der CPU: NVIDIA betonte, dass die serielle Tool-Nutzung von Agenten die Nachfrage nach neuen CPUs mit hoher Single-Thread-Performance stark erhöhen werde und damit bisherige Annahmen im Cloud-CPU-Design ins Wanken gerieten.
Beispiele aus dem Ökosystem
- PicsArt: Das Unternehmen demonstrierte agentische Workflows wie Persona-Casting und die Produktion von Videoanzeigen, indem es Qwen Image, Wan und Happy Horse in seine Plattform mit 130 Millionen Nutzern integrierte. Nach der Einführung von Happy Horse sei die Zahl der Videoerstellungen um 72 % gestiegen.
- Globaler Hackathon: Gleichzeitig wurden der Qwen Cloud Global Hackathon mit einem Preisgeld von 70.000 US-Dollar und die Happy Horse Awards 2026 angekündigt, um Entwickler und Kreative anzuziehen.
Vergleich mit Googles Konferenzen
Googles einen Monat zuvor abgehaltene Veranstaltungen Cloud Next 2025 (April) und I/O 2025 (Mai) deuteten faktisch in dieselbe Richtung, setzten aber auf andere Stärken.
- Googles Ankündigungsreihe: Von Gemini 2.5 Pro Deep Think über das Agent Development Kit (ADK), das Agent2Agent-(A2A)-Protokoll und die TPU Ironwood der 7. Generation bis hin zu Android-XR-Brillen und Veo 3 reichte das Spektrum über Suche, Geräte und Infrastruktur hinweg.
- Googles Nutzungskennzahlen: Das Unternehmen veröffentlichte Zahlen, wonach AI Mode in 200 Ländern 150 Millionen Nutzer erreicht habe, die Gemini-App monatlich 400 Millionen Nutzer zähle und das Token-Volumen innerhalb eines Jahres um das 50-Fache von 9,7 Billionen auf 480 Billionen gestiegen sei.
- Unterschied in der Strategie: Während Alibaba auf Full-Stack-Vertikalintegration sowie auf eine Hub-Strategie mit Open Source (mehr als 450 Modelle, kumuliert 2 Milliarden Downloads) und der Aufnahme konkurrierender Modelle setzt, hält Google mit überwältigenden Nutzerkontaktpunkten sowie der eigenen TPU- und A2A-Standardführerschaft dagegen.
- Die jeweiligen Schwächen: Google hält sein Kernmodell Gemini weiterhin geschlossen und viele Ankündigungen befinden sich noch im Status „coming soon“, während Alibaba mit eingeschränktem Zugang zu den US- und europäischen Märkten sowie den auf dem Panel angesprochenen Herausforderungen bei Zuverlässigkeit und Memory-Engpässen kämpft.
- Kurzfristige Vorteilzonen: Kurzfristig liegt Google bei Nutzermaßstab und Formfaktoren vorn, Alibaba bei Infrastrukturkosten und außerhalb der USA.
Alibaba Cloud geht offenbar davon aus, dass die Wettbewerbsfähigkeit der eigenen Modelle allein nicht ausreicht, um im Zeitalter der Agenten die Führungsrolle zu übernehmen. Deshalb treibt das Unternehmen gleichzeitig eine vertikale Integration von Silizium über Modelle, Infrastruktur und Tools bis zum Ökosystem sowie eine horizontale Expansion mit PyTorch und sogar konkurrierenden Modellanbietern voran. Da grundlegende Herausforderungen wie Zuverlässigkeit, Memory-Engpässe und ein Neudesign der CPU-Architektur in den Panel-Diskussionen jedoch wiederholt zur Sprache kamen, bleibt es eine offene Aufgabe, zu belegen, dass die agentische Cloud die versprochene Leistung und Wirtschaftlichkeit auch bei realen Enterprise-Workloads liefert. Die Veranstaltung machte deutlich, dass Singapur als internationales Geschäftszentrum dienen soll, um den Wettbewerb mit US-Hyperscalern zu verschärfen.
4 Kommentare
Ein lehrreicher Artikel, der zeigt, dass selbst bei automatisch von KI erstellten Inhalten noch eine menschliche Prüfung nötig ist.
Heißt es nicht
qwenstattquen? Anscheinend hat die AI das Diktat nicht richtig verstanden.Scharfer Blick, ich habe es auch als qwen gelesen, hahaha
Genau, ich war beim Lesen auch so: Was ist denn Quen??