Thoughtworks Technology Radar, Band 33 veröffentlicht

(thoughtworks.com)

15 Punkte von GN⁺ 2025-11-07 | Noch keine Kommentare. | Auf WhatsApp teilen

Neueste Trends in den Bereichen Techniken/Tools/Plattformen/Programmiersprachen und Frameworks werden visualisiert und in vier Stufen erläutert: Adopt (Einführung empfohlen), Trial (testweise Nutzung), Assess (bewerten), Hold (Vorsicht)
Vier Kernthemen: Orchestrierung von AI-Infrastruktur, Aufstieg MCP-basierter Agenten, AI-Coding-Workflows, Entstehung von AI-Antipatterns

Einführung von Infrastruktur-Orchestrierung für AI

AI-Workloads zwingen Organisationen zur Orchestrierung großer GPU-Flotten für Training und Inferenz
- Da die Zahl großer Modelle steigt, die die HBM-Kapazitätsgrenze (80 GB) einer einzelnen GPU überschreiten, werden verteiltes Training und Multi-GPU-Inferenz unverzichtbar
- Plattform-Teams bauen komplexe mehrstufige Pipelines auf und justieren Durchsatz und Latenz kontinuierlich
- Mit dem Nvidia DCGM Exporter wird Fleet-Telemetrie erfasst, und durch topologiebewusstes Scheduling werden Jobs dort platziert, wo die Interconnect-Bandbreite am höchsten ist
Kubernetes ist die zentrale Grundlage für das Management von AI-Workloads im großen Maßstab, doch auch alternative Plattformen wie microVM (Firecracker) und Uncloud erhalten Aufmerksamkeit
- Strategien für die Platzierung unter Berücksichtigung schneller Kommunikation zwischen GPU-Links entwickeln sich weiter, etwa Warteschlangen- und Quotenverwaltung mit Kueue, topology-aware scheduling und gang scheduling
- Platzierung von Multi-GPU-Jobs innerhalb zusammenhängender Rechenzentrums-"Inseln" (Racks oder Pods) mit Hochgeschwindigkeitsverbindungen zwischen GPUs wie NVLink/NVSwitch und RDMA
Jüngste API-Verbesserungen für Multi-GPU- und NUMA-Bewusstsein in Kubernetes stärken diese Fähigkeiten und erhöhen die Bandbreite zwischen Geräten, senken Tail Latency und steigern die effektive Auslastung
- Mit der steigenden Nachfrage nach AI-Coding-Workflows und dem Aufkommen durch MCP verbesserter Agenten wird bei AI-Infrastruktur eine schnelle Innovation erwartet
- GPU-bewusste Orchestrierung wird zur Grundanforderung, und Topologie entwickelt sich zu einem erstklassigen Scheduling-Kriterium

Aufstieg MCP-basierter Agenten

Der gleichzeitige Aufstieg von MCP und Agenten sowie die Ausweitung des darum aufgebauten Protokoll- und Tool-Ökosystems sind ein Hauptthema dieses Radar
- MCP etabliert sich als ultimatives einheitliches Protokoll für den Betrieb von Agenten und deren effiziente sowie halbautonome Arbeitsweise
Nahezu alle großen Anbieter ergänzen MCP-Unterstützung, und agentenzentrierte Workflows wachsen schnell
Laufende Innovationen bei Agenten-Workflows sind zu beobachten, und Context Engineering entwickelt sich zum Schlüssel für die Optimierung von Modellverhalten und Ressourceneffizienz
- Neue Protokolle wie A2A (Agent-to-Agent) und AG-UI senken die Komplexität beim Aufbau kollaborativer Multi-Agenten-Apps
- Technologien wie AGENTS.md, Anchoring coding agents und Context7 MCP server werden in reale Entwicklungs-Workflows übernommen
Aufgrund der Natur des AI-Ökosystems kommt es mit jedem Radar zu einer explosionsartigen Welle neuer Innovationen
— letztes Mal war es RAG, dieses Mal sind es Agenten-Workflows und die wachsende Konstellation von Tools, Techniken und Plattformen, die sie unterstützen
- Und auch einige bemerkenswerte AI-Antipatterns treten auf

AI-Coding-Workflows

AI verändert die Art und Weise, wie Software entwickelt und gewartet wird, und ist in den jüngsten Diskussionen das dominierende Thema
- Vom Einsatz von AI zum Verständnis von Legacy-Codebasen bis zu GenAI für Forward Engineering wird AI strategisch entlang der gesamten Software-Wertschöpfungskette verankert
- Es wird gelernt, wie Wissen wirksamer in Coding-Agenten eingespeist werden kann
Teams experimentieren mit neuen Praktiken wie der Definition maßgeschneiderter Anweisungen über AGENTS.md-Dateien und der Integration mit MCP-Servern wie Context7, um aktuelle Dokumentation zu Abhängigkeiten abzurufen
- Es wächst die Erkenntnis, dass AI nicht nur einzelne Mitwirkende, sondern das gesamte Team verstärken sollte
- Kuratiert geteilte Anweisungen und benutzerdefinierte Befehle entstehen, um eine faire Verbreitung von Wissen sicherzustellen
Das Tool-Umfeld entwickelt sich lebhaft weiter:
- Designer nutzen UX Pilot und AI Design Reviewer, Entwickler erstellen mit v0 und Bolt durch Self-Service-UI-Prototyping schnell Prototypen
- Die Debatte über Umfang, Granularität und die mögliche Rolle von spezifikationsbasierter Entwicklung als Single Source of Truth für inkrementelle Lieferung hält an
- Trotz aller Begeisterung bleibt Sorglosigkeit gegenüber AI-generiertem Code ein verbreitetes Anliegen und erinnert daran, dass AI das Engineering beschleunigen kann, menschliches Urteilsvermögen aber weiterhin unverzichtbar ist

Entstehung neuer AI-Antipatterns

Mit der beschleunigten AI-Einführung in der gesamten Industrie treten neben wirksamen Praktiken auch entstehende Antipatterns zutage
- Während der klare Nutzen von Konzepten wie Self-Service-Einweg-UI-Prototyping mit GenAI anerkannt wird, wird zugleich das Potenzial erkannt, Organisationen in das Antipattern AI-beschleunigtes Shadow IT zu führen
- Da MCP (Model Context Protocol) Aufmerksamkeit erhält, geraten viele Teams in das Antipattern der naiven API-to-MCP-Konvertierung
Die Wirksamkeit von Text-to-SQL-Lösungen bleibt hinter den frühen Erwartungen zurück, und Sorglosigkeit gegenüber AI-generiertem Code bleibt weiterhin ein relevantes Problem
- Selbst innerhalb aufkommender Praktiken wie spezifikationsbasierter Entwicklung besteht das Risiko einer Rückkehr zu traditionellen Software-Engineering-Antipatterns
  — insbesondere zu übermäßiger Vorab-Spezifikation und einer Tendenz zu Big-Bang-Releases
Da sich GenAI mit beispielloser Geschwindigkeit und in beispiellosem Maßstab weiterentwickelt, ist mit einem schnellen Auftreten neuer Antipatterns zu rechnen
- Teams müssen wachsam gegenüber Mustern bleiben, die anfangs effektiv wirken, mit der Zeit aber die Leistung verschlechtern, Feedback verlangsamen, Anpassungsfähigkeit beeinträchtigen oder Verantwortlichkeit verwischen

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

1. Continuous compliance

Eine Praxis, die sicherstellt, dass Softwareentwicklungsprozesse und -technologien regulatorische und Sicherheitsstandards durch Automatisierung fortlaufend erfüllen
Durch die Integration von Policy-as-Code-Tools wie Open Policy Agent und die Erstellung von SBOM innerhalb der CD-Pipeline lassen sich Compliance-Probleme frühzeitig im Einklang mit den SLSA-Richtlinien erkennen und beheben
Durch die Kodifizierung von Regeln und Best Practices lassen sich Standards teamweit konsistent durchsetzen, ohne Engpässe zu verursachen
Da das Risiko von Sorglosigkeit gegenüber AI-generiertem Code steigt, ist es wichtiger denn je, Compliance im Entwicklungsprozess zu verankern

2. Curated shared instructions for software teams

Für Teams, die AI aktiv in der Softwarebereitstellung einsetzen, geht der Trend über individuelles Prompting hinaus hin zu kuratierten Anweisungen
Die intuitivste Umsetzung besteht darin, Anweisungsdateien wie AGENTS.md direkt in das Projekt-Repository zu committen
Die meisten AI-Coding-Tools wie Cursor, Windsurf und Claude Code unterstützen das Teilen von Anweisungen über benutzerdefinierte Slash-Befehle oder Workflows
Sobald Prompts verbessert werden, profitiert das gesamte Team sofort davon, was einen konsistenten Zugang zu den besten AI-Anweisungen sicherstellt

3. Pre-commit hooks

Git hooks gibt es schon lange, sie werden aber noch immer nicht ausreichend genutzt
Mit dem Aufstieg von AI-unterstütztem und agentenbasiertem Coding steigt das Risiko, versehentlich Geheimnisse oder problematischen Code zu committen
Es gibt viele Mechanismen zur Codeprüfung wie continuous integration, aber Pre-commit-Hooks sind eine einfache und wirksame Schutzmaßnahme, die mehr Teams übernehmen sollten
Am besten hält man sie schlank und fokussiert sie auf Risiken wie Secret Scanning, die sich in dieser Phase des Workflows am wirksamsten abfangen lassen

4. Einsatz von GenAI zum Verständnis von Legacy-Codebasen

Der Einsatz von GenAI zum Verständnis von Legacy-Codebasen beschleunigt das Verständnis großer, komplexer Systeme erheblich
Tools wie Cursor, Claude Code, Copilot, Windsurf, Aider, Cody, Swimm, Unblocked, PocketFlow-Tutorial-Codebase-Knowledge helfen dabei, Geschäftsregeln sichtbar zu machen, Logik zusammenzufassen und Abhängigkeiten zu identifizieren
In Kombination mit Open-Source-Frameworks und direktem LLM-Prompting verkürzt sich die Zeit zum Verständnis von Legacy-Codebasen drastisch
Der Einrichtungsaufwand für fortgeschrittene Ansätze wie GraphRAG variiert insbesondere je nach Größe und Komplexität der analysierten Codebasis, die Auswirkungen auf die Produktivität sind jedoch durchweg konsistent und erheblich

Trial

5. AGENTS.md

Ein gemeinsames Format, um AI-Coding-Agenten, die an einem Projekt arbeiten, Anweisungen zu geben
Im Wesentlichen eine README-Datei für Agenten, ohne verpflichtende Felder oder Formate außerhalb von Markdown
Beruht auf der Fähigkeit LLM-basierter Coding-Agenten, von Menschen geschriebene und lesbare Anweisungen zu interpretieren
Häufig werden Tipps zur Tool-Nutzung in der Coding-Umgebung, Testanweisungen und bevorzugte Praktiken für das Commit-Management aufgenommen

6. AI für Code-Migrationen

Code-Migrationen gibt es in vielen Formen, von Sprach-Neuschreibungen bis zu Upgrades von Abhängigkeiten oder Frameworks, und sie erfordern oft monatelange manuelle Arbeit
Teams für Upgrades der .NET framework version experimentieren mit dem Einsatz von AI, um den Prozess zu verkürzen
Früher wurden deterministische, regelbasierte Refactoring-Tools wie OpenRewrite verwendet; AI allein ist kostspielig und Gespräche driften leicht ab
Statt das gesamte Upgrade zu delegieren, wird der Prozess in kleinere, überprüfbare Schritte zerlegt, etwa die Analyse von Compilerfehlern, das Erzeugen von Migrations-Diffs und die iterative Validierung von Tests
Branchenbeispiele wie Googles groß angelegte int32-to-int64 migration spiegeln einen ähnlichen Trend wider

7. Delta Lake liquid clustering

Eine Technik für Delta Lake-Tabellen, die als Alternative zu Partitionierung und Z-ordering dient
Historisch erforderte die Optimierung der Leseleistung von Delta-Tabellen, beim Erstellen der Tabelle Partitions- und Z-order-Schlüssel anhand erwarteter Abfragemuster zu definieren
liquid clustering verwendet einen baumbasierten Algorithmus, um Daten anhand festgelegter Schlüssel zu clustern
Änderungen können schrittweise vorgenommen werden, ohne alle Daten neu zu schreiben, was mehr Flexibilität zur Unterstützung verschiedener Abfragemuster bietet
Databricks Runtime for Delta Lake unterstützt automatisches liquid clustering durch Analyse vergangener Query-Workloads, Identifizierung optimaler Spalten und entsprechendes Clustering der Daten

8. Self-serve-UI-Prototyping mit GenAI

Tools wie Claude Code, Figma Make, Miro AI, v0 ermöglichen es Produktmanagern, direkt aus Text-Prompts interaktive, nutzertestbare Prototypen zu erstellen
Statt Wireframes manuell zu bauen, können Teams in wenigen Minuten funktionsfähige HTML-, CSS- und JS-Artefakte erzeugen
Diese „wegwerfbaren“ Prototypen tauschen Poliertheit gegen schnelles Lernen ein und sind ideal für frühe Validierung während Design Sprints
Eine höhere Detailtreue kann zu einem falschen Fokus auf Details oder zu unrealistischen Erwartungen an den Produktionsaufwand führen, daher sind klares Framing und Erwartungsmanagement essenziell

9. Strukturierte Ausgaben von LLMs

Eine Praxis, LLMs darauf zu beschränken, Antworten in einem vordefinierten Format wie JSON oder einer bestimmten Programmierklasse zu erzeugen
Wandelt den sonst typischerweise unvorhersehbaren Text von LLMs in maschinenlesbare und deterministische Datenverträge um und ist damit essenziell für den Aufbau zuverlässiger produktionsreifer Anwendungen
Die Ansätze reichen von einfachem promptbasiertem Formatting und model-native structured outputs bis zu robusteren Methoden des constrained decoding mit Tools wie Outlines und Instructor
Erfolgreich eingesetzt, um komplexe, unstrukturierte Daten aus verschiedenen Dokumenttypen zu extrahieren und in strukturiertes JSON für nachgelagerte Geschäftslogik umzuwandeln

10. TCR (Test && Commit || Revert)

Ein aus testgetriebener Entwicklung abgeleiteter Programmier-Workflow, der durch einfache Regeln sehr kleine, kontinuierliche Schritte fördert
Nach jeder Änderung werden die Änderungen committet, wenn die Tests erfolgreich sind; schlagen sie fehl, werden die Änderungen zurückgesetzt
Die Umsetzung ist einfach, da nur ein Skript definiert werden muss, das diesen Zyklus innerhalb der Codebasis automatisiert
TCR wurde erstmals im offiziellen article von Kent Beck vorgestellt und stärkt positive Coding-Praktiken wie YAGNI und KISS

Assess

11. AI-gestütztes UI-Testing

Im früheren Radar konzentrierte sich AI-basiertes UI-Testing vor allem auf exploratives Testen, wobei erwähnt wurde, dass die Nichtdeterministik von LLMs zu Instabilität führen kann
Mit dem Aufstieg von MCP führen führende UI-Test-Frameworks wie Playwright und Selenium eigene MCP-Server ein (playwright-mcp, mcp-selenium)
Durch zuverlässige Browser-Automatisierung mit nativen Techniken können Coding-Assistenten verlässlich UI-Tests für Playwright oder Selenium erzeugen
Die Entwicklungen wie Playwright Agents in aktuellen Playwright-Releases werden mit großer Spannung verfolgt, und es werden praxisnähere Leitlinien sowie mehr Erfahrungen aus dem Feldeinsatz erwartet

12. Verankerung von Coding Agents an einer Referenzanwendung

In der Vergangenheit wurde das Muster tailored service templates als Blip aufgenommen; es hilft Organisationen, die Microservices einführen, neue Services zu bootstrapen und nahtlos in die bestehende Infrastruktur zu integrieren
Im Lauf der Zeit nimmt die Code-Drift zwischen diesen Templates und bestehenden Services tendenziell zu, wenn neue Abhängigkeiten, Frameworks und Architekturpattern aufkommen
Im Zeitalter der Coding Agents wird mit anchoring coding agents to a reference application experimentiert, um Best Practices und architektonische Konsistenz zu bewahren
Ein Server für das Model Context Protocol (MCP) stellt sowohl Referenz-Template-Code als auch Commit-Diffs bereit, sodass Agents Drift erkennen und Reparaturvorschläge machen können

13. Context engineering

Systematisches Design und Optimierung der Informationen, die einem LLM während der Inferenz bereitgestellt werden, um zuverlässig die gewünschte Ausgabe zu erzeugen
Umfasst die Strukturierung, Auswahl und Reihenfolge von Kontextelementen wie Prompts, abgerufenen Daten, Speicher, Anweisungen und Umgebungssignalen
Anders als Prompt Engineering, das sich nur auf die Formulierung des Prompts konzentriert, betrachtet Context Engineering die gesamte Kontextzusammenstellung
Heute nutzen Engineers verschiedene Einzeltechniken, die sich in drei Bereiche gruppieren lassen: Context setup, Context management for long-horizon tasks, Dynamic information retrieval

14. GenAI für Forward Engineering

Eine aufkommende Technik zur Modernisierung von Legacy-Systemen mithilfe KI-generierter Beschreibungen des Legacy-Codebestands
Führt einen expliziten Schritt ein, der sich darauf konzentriert, was der Legacy-Code tut (die Spezifikation), während bewusst verborgen wird, wie er aktuell implementiert ist
Verwandt mit spec-driven development, aber speziell auf die Legacy-Modernisierung angewendet
Entlang der Schleife reverse-engineering → design/solutioning → forward-engineering können sowohl Menschen als auch AI Agents auf höherer Ebene schlussfolgern, bevor sie sich auf eine Implementierung festlegen

15. GraphQL als Datenzugriffsmuster für LLMs

Ein aufkommender Ansatz zur Schaffung einer einheitlichen, modellfreundlichen Datenzugriffsschicht zur Verbesserung von context engineering
Ermöglicht es, strukturierte und abfragbare Daten offenzulegen, ohne dem Modell direkten Datenbankzugriff zu gewähren
Anders als bei REST-APIs, die für jeden Anwendungsfall neue Endpunkte oder Filter benötigen, kann GraphQL dem Modell erlauben, nur die benötigten Daten abzurufen
Ein klar definiertes GraphQL-Schema liefert Metadaten, die LLMs nutzen können, um über verfügbare Entitäten und Beziehungen zu schlussfolgern

16. Knowledge Flows statt Knowledge Stocks

Es wird häufig gefragt: „Wie kann der Informationsaustausch zwischen Teams verbessert werden?“
Das aus dem Systemdenken entlehnte Konzept knowledge flows and knowledge stocks bietet eine wertvolle Perspektive
Es ermutigt dazu, das Wissen einer Organisation als System zu betrachten – Stocks stehen für angesammeltes Wissen, Flows dafür, wie Wissen sich durch die Organisation bewegt und weiterentwickelt
Wenn der Flow externen Wissens in die Organisation zunimmt, fördert das tendenziell Innovation; der Aufbau von communities of practice ist eine bewährte Methode, um Flows zu verbessern

17. LLM as a judge

Die Nutzung eines LLM als Richter zur Bewertung der Ausgaben anderer Systeme (typischerweise LLM-basierter Generatoren) erhält Aufmerksamkeit, weil sie das Potenzial für skalierbare und automatisierte Evaluation in der generativen KI bietet
Dieser Blip wurde angesichts neu erkannter Komplexität und Risiken von Trial nach Assess verschoben
Bewertungen sind anfällig für position bias, verbosity bias und geringe Robustheit; ein noch schwerwiegenderes Problem ist scaling contamination
Um diesen Mängeln zu begegnen, werden verbesserte Techniken untersucht, etwa LLMs as a jury (mehrere Modelle zur Konsensbildung) oder chain-of-thought-Reasoning während der Evaluation

18. On-device information retrieval

Eine Technik, die Suche, Kontextbewusstsein und retrieval-augmented generation (RAG) vollständig auf dem Gerät des Nutzers ausführt (mobil, Desktop oder Edge-Gerät)
Priorisiert Datenschutz und Recheneffizienz, indem leichte lokale Datenbanken mit für On-device-Inferenz optimierten Modellen kombiniert werden
Eine vielversprechende Implementierung kombiniert sqlite-vec (eine SQLite-Erweiterung, die Vektorsuche in eingebetteten Datenbanken unterstützt) mit EmbeddingGemma (ein Embedding-Modell mit 300 Millionen Parametern auf Basis der Gemma-3-Architektur)
Wird zur Evaluierung für Local-first-Anwendungen sowie andere Anwendungsfälle empfohlen, bei denen Datensouveränität, geringe Latenz und Datenschutz wichtig sind

19. SAIF

SAIF (Secure AI Framework) ist ein von Google entwickeltes Framework, das praxisnahe Leitlinien für das Management von AI-Sicherheitsrisiken bietet
Behandelt gängige Bedrohungen wie Data Poisoning und Prompt Injection systematisch mit klaren Risikokarten, Komponentenanalysen und praktischen Minderungsstrategien
Der Fokus auf die sich wandelnden Risiken beim Aufbau agentischer Systeme ist besonders zeitgemäß und wertvoll
Bietet ein kompaktes, umsetzbares Playbook zur Stärkung von Sicherheitspraktiken beim Einsatz von LLMs und AI-basierten Anwendungen

20. Service Mesh ohne Sidecar

Da Kosten und operative Komplexität sidecar-basierter Service Meshes fortbestehen, sorgt das Aufkommen sidecar-loser Service-Mesh-Optionen wie Istio ambient mode für Begeisterung
Ambient Mode führt eine geschichtete Architektur ein, die Verantwortlichkeiten auf zwei Hauptkomponenten verteilt: einen L4-Proxy pro Node (ztunnel) und einen L7-Proxy pro Namespace (Waypoint proxy)
ztunnel stellt sicher, dass L3- und L4-Traffic effizient und sicher übertragen wird, beschafft Zertifikate für alle Identitäten eines Nodes und verarbeitet die Traffic-Umleitung zu ambient-fähigen Workloads
Waypoint proxy ist eine optionale Komponente des Ambient Mode, die umfangreichere Istio-Funktionen wie Traffic-Management, Sicherheit und Observability aktiviert

21. Small language models

Über mehrere Ausgaben des Technology Radar hinweg wurde die stetige Weiterentwicklung von small language models (SLMs) beobachtet
Mit dem wachsenden Interesse am Aufbau von Agentenlösungen gibt es zunehmend Belege dafür, dass SLMs Agentic AI effizient antreiben können
Die meisten aktuellen Agenten-Workflows konzentrieren sich auf eng umrissene, wiederholbare Aufgaben, die kein fortgeschrittenes Schlussfolgern erfordern, und eignen sich daher gut für SLMs
Die kontinuierliche Weiterentwicklung von SLMs wie Phi-3, SmolLM2 und DeepSeek bietet für diese Aufgaben ausreichende Fähigkeiten

22. Spec-driven development

Ein aufkommender Ansatz für AI-gestützte Coding-Workflows, dessen Begriffsdefinition sich noch weiterentwickelt
Bezeichnet im Allgemeinen einen Workflow, der mit einer strukturierten Funktionsspezifikation beginnt und diese dann in mehreren Schritten in kleinere Teile, Lösungen und Aufgaben zerlegt
Amazons Kiro führt Nutzer durch drei Workflow-Phasen: Anforderungen, Design und Aufgabenerstellung
GitHubs spec-kit folgt einem ähnlichen dreistufigen Prozess, ergänzt aber reichhaltigere Orchestrierung, konfigurierbare Prompts und eine „constitution“, die unveränderliche Prinzipien definiert, denen immer gefolgt werden soll

23. Team of coding agents

Eine Technik, bei der Entwickler mehrere AI-Coding-Agenten orchestrieren, die jeweils eigene Rollen wie Architect, Back-end Specialist oder Tester haben
Tools wie Claude Code, Roo Code und Kilo Code unterstützen Subagenten und mehrere Betriebsmodi
Aufbauend auf dem belegten Prinzip, dass die Zuweisung spezifischer Rollen und Personas an LLMs die Ausgabequalität verbessert, werden bessere Ergebnisse erzielt, indem mehrere rollenbasierte Agenten koordiniert werden, statt sich auf einen einzigen universellen Agenten zu verlassen
Markiert einen Übergang zu orchestrierten, mehrstufigen AI-gestützten Entwicklungs-Pipelines

24. Topology-aware scheduling

GPUs und LPUs sind keine eigenständigen Geräte mehr, sondern eng gekoppelte Beschleunigernetzwerke, deren Leistung von Platzierung und Topologie abhängt
In Rack-scale-Systemen wie NVL72 von NVIDIA teilen 72 GPUs mehr als 13 TB VRAM und arbeiten als einzelner Beschleuniger, aber wenn Workloads Switch-Islands überschreiten, werden kollektive Operationen zum Flaschenhals
Groqs zur Compile-Zeit festgelegte, softwaregeplante Architektur setzt deterministische Datenbewegung voraus; zufälliges Scheduling zerstört diese Annahmen und die Vorhersagbarkeit
Scheduler, die die Topologie ignorieren, verteilen Multi-GPU-Workloads oft willkürlich und verursachen dadurch längere Schrittzeiten und geringere Effizienz

25. Toxic flow analysis for AI

Der bekannte Witz, dass das S in MCP für „security“ steht, verdeckt ein sehr reales Problem
Wenn Agenten über Tool-Calls oder API-Aufrufe miteinander kommunizieren, können sie schnell auf das treffen, was als lethal trifecta bekannt ist: Zugriff auf persönliche Daten, Kontakt mit nicht vertrauenswürdigen Inhalten und die Fähigkeit zur externen Kommunikation
Agenten, die alle drei Eigenschaften besitzen, sind hochgradig verwundbar, und da LLMs dazu neigen, Anweisungen aus Eingaben zu befolgen, können Inhalte aus nicht vertrauenswürdigen Quellen, die Anweisungen zum Exfiltrieren von Daten enthalten, leicht zu Datenlecks führen
toxic flow analysis untersucht den Flussgraphen eines Agentensystems, um potenziell unsichere Datenpfade für eine weitere Prüfung zu identifizieren

Hold

26. AI-accelerated shadow IT

AI senkt die Hürden dafür, dass Nichtprogrammierer Software selbst erstellen und integrieren, anstatt auf die IT-Abteilung zu warten
Man ist begeistert von dem Potenzial, das dadurch freigesetzt wird, beobachtet aber die ersten Anzeichen von AI-accelerated shadow IT mit Vorsicht
No-Code-Plattformen für Workflow-Automatisierung unterstützen nun die Integration von AI-APIs wie OpenAI oder Anthropic und schaffen damit die Versuchung, AI als Klebeband zu benutzen, um Integrationen zu verbinden, die zuvor nicht möglich waren
Gleichzeitig werden AI-Coding-Assistenten agentischer, sodass Nichtprogrammierer mit grundlegender Schulung interne Utility-Anwendungen erstellen können

27. Capacity-driven development

Ein Schlüssel zum Erfolg moderner Softwareentwicklungspraktiken ist die konsequente Fokussierung auf den Arbeitsfluss
Stream-aligned Teams konzentrieren sich auf einen einzelnen wertvollen Flow wie eine User Journey oder ein Produkt, um End-to-End-Wert effizient zu liefern
Es wird jedoch ein besorgniserregender Trend hin zu capacity-driven development beobachtet, bei dem auf diese Weise ausgerichtete Teams bei freier Kapazität Features für andere Produkte oder Streams übernehmen
Kurzfristig mag das effizient wirken, ist aber eine lokale Optimierung, die sich am besten für die Bewältigung von Nachfragespitzen eignet; wenn sie zum Normalfall wird, steigen kognitive Belastung und technische Schulden

28. Complacency with AI-generated code

Da AI-Coding-Assistenten und -Agenten viel Aufmerksamkeit erhalten, mehren sich Daten und Studien, die Sorgen über complacency with AI-generated code hervorheben
Es gibt zwar genügend Belege dafür, dass diese Tools die Entwicklung beschleunigen können, doch Studien zeigen, dass die Codequalität mit der Zeit sinken kann
In der 2024 research von GitClear nahmen duplizierter Code und Code Churn stärker als erwartet zu, während Refactoring-Aktivitäten in der Commit-Historie zurückgingen
Die research von Microsoft zu Wissensarbeitern zeigt, dass AI-basiertes Selbstvertrauen oft auf Kosten kritischen Denkens entsteht

29. Naive API-to-MCP conversion

Organisationen wollen ihre internen APIs nahtlos und direkt in das Model Context Protocol (MCP) umwandeln, damit AI-Agenten mit bestehenden Systemen interagieren können
Es gibt eine wachsende Zahl von Tools wie MCP link und FastAPI-MCP, die diese Umwandlung unterstützen sollen
Man spricht sich gegen diese naive API-to-MCP conversion aus, da APIs in der Regel für menschliche Entwickler konzipiert sind und aus fein granularen atomaren Operationen bestehen, die bei der Verkettung durch AI zu übermäßigem Token-Verbrauch, Kontextverschmutzung und schlechterer Agentenleistung führen können
Solche APIs legen häufig sensible Daten offen oder erlauben destruktive Operationen, insbesondere im Fall interner APIs

30. Eigenständige Data-Engineering-Teams

Eine separate Organisation aus Data-Engineering-Teams, die Datenpipelines und Produkte unabhängig von der Business-Domäne entwickeln und verantworten, für die sie geordnete Streams bereitstellen, ist ein Antipattern, das zu Ineffizienz und schwachen Geschäftsergebnissen führt
Diese Struktur wiederholt frühere Fehler, bei denen DevOps-, Test- oder Deployment-Funktionen getrennt wurden, und erzeugt Wissenssilos, Engpässe und verschwendeten Aufwand
Ohne enge Zusammenarbeit fehlt Data Engineers oft der Business- und Domänenkontext, der nötig ist, um sinnvolle Datenprodukte zu entwerfen, was sowohl Akzeptanz als auch Nutzen begrenzt
Stattdessen sollten sich Data-Platform-Teams auf die Pflege gemeinsamer Infrastruktur konzentrieren, während funktionsübergreifende Business-Teams ihre eigenen data products gemäß den Prinzipien von data mesh aufbauen und verantworten

31. Text to SQL

Text to SQL verwendet LLMs, um natürliche Sprache in ausführbares SQL zu übersetzen, aber die Zuverlässigkeit bleibt oft hinter den Erwartungen zurück
Dieser Blip wurde auf Hold verschoben, um von einer Nutzung in unbeaufsichtigten Workflows abzuraten – etwa wenn die Ausgabe verborgen ist oder automatisch erzeugte Benutzerabfragen dynamisch umgewandelt werden
In solchen Fällen halluzinieren LLMs aufgrund eines begrenzten Verständnisses von Schema oder Domäne häufig, was das Risiko falscher Datenabfragen oder unbeabsichtigter Datenänderungen erhöht
Für agentische Business Intelligence sollte direkter Datenbankzugriff vermieden und stattdessen eine verwaltete semantische Abstraktionsschicht für Daten wie Cube oder dbt's semantic layer verwendet werden

[Platforms]

Adopt

32. Arm in der Cloud

Arm compute instances in der Cloud sind in den letzten Jahren aufgrund ihrer Kosten- und Energieeffizienz gegenüber traditionellen x86-basierten Instanzen zunehmend beliebt geworden
Große Cloud-Anbieter einschließlich AWS, Azure und GCP bieten inzwischen leistungsfähige Arm-Optionen an
Viele Teams haben Workloads wie Microservices, Open-Source-Datenbanken und sogar High Performance Computing erfolgreich auf Arm migriert – mit minimalen Codeänderungen und nur wenigen Anpassungen an Build-Skripten
Moderne Werkzeuge wie multi-arch Docker images vereinfachen Build und Deployment sowohl für Arm- als auch für x86-Umgebungen

Trial

33. Apache Paimon

Apache Paimon ist ein Open-Source-Datenlake-Format, das dafür entwickelt wurde, eine lakehouse architecture zu ermöglichen
Es integriert sich nahtlos mit Verarbeitungs-Engines wie Flink und Spark und unterstützt sowohl Streaming- als auch Batch-Workloads
Ein wesentlicher Vorteil der Paimon-Architektur ist die Kombination standardisierter Datenlake-Formate mit der Struktur eines LSM (log-structured merge tree)
Diese Kombination löst die klassischen Herausforderungen von Datenlakes: performante Updates und Reads mit geringer Latenz

34. DataDog LLM Observability

Datadog LLM Observability bietet End-to-End-Tracking, Monitoring und Diagnose für Workflows mit großen Sprachmodellen und Agent-Anwendungen
Es ordnet jeden Prompt, Tool-Aufruf und Zwischenschritt Spans und Traces zu, verfolgt Latenz, Token-Verbrauch, Fehler und Qualitätsmetriken und integriert sich in Datadogs umfassende APM- und Observability-Produktfamilie
Organisationen, die Datadog bereits nutzen und mit der Kostenstruktur vertraut sind, werden feststellen, dass dessen LLM-Observability-Funktionen ein naheliegender Weg sind, Transparenz für AI-Workloads zu gewinnen – sofern sie diese Workloads instrumentieren können
Die Konfiguration und Nutzung von LLM-Instrumentierung erfordert Sorgfalt und ein solides Verständnis von Workload und Implementierung; bei der Einführung wird eine enge Zusammenarbeit zwischen Data Engineers und Betriebsteams empfohlen

35. Delta Sharing

Delta Sharing ist ein von Databricks und der Linux Foundation entwickelter offener Standard und ein Protokoll für sicheres plattformübergreifendes Data Sharing
Es ist cloudunabhängig und ermöglicht Organisationen, Live-Daten über Cloud-Anbieter und On-Premises-Standorte hinweg zu teilen, ohne Daten zu kopieren oder zu replizieren
Über eine einfache REST API werden kurzlebige vorab signierte URLs ausgegeben, damit Empfänger große Datensätze mit Tools wie pandas, Spark oder Power BI abrufen können
Es unterstützt das Teilen von Datentabellen, Views, AI-Modellen und Notebooks und bietet starke zentrale Governance- und Audit-Funktionen

36. Dovetail

Die Dovetail platform adressiert die anhaltende Herausforderung, verteilte qualitative Forschungsdaten zu verwalten
Sie bietet ein zentrales Repository für Nutzerinterviews, Transkripte und Erkenntnisse und wandelt Rohdaten in strukturierte, analysierbare Assets um
Besonders nützlich ist sie in Product-Discovery-Workflows, da sie eine Evidenz-Nachverfolgung schafft, die Kundenzitate und synthetisierte Themen direkt mit Produkthypothesen und erwartetem ROI verbindet
Dadurch stärkt Dovetail die Rolle qualitativer Daten bei Produktentscheidungen

37. Langdock

Langdock ist eine Plattform, mit der Organisationen generative AI-Agenten und Workflows für den internen Betrieb entwickeln und ausführen können
Sie bietet eine integrierte Umgebung mit internem Chat-Assistenten, einer API-Schicht zur Anbindung mehrerer LLMs und Tools zum Aufbau von Agent-Workflows, die sich mit Systemen wie Slack, Confluence und Google Drive integrieren
Die Plattform bietet On-Premises- und EU-Hosting-Optionen mit Enterprise-Compliance-Standards und betont damit Datensouveränität
Organisationen, die Langdock einsetzen, müssen dennoch sehr sorgfältig auf Data Governance achten und Techniken wie toxic flow analysis nutzen, um die lethal trifecta zu vermeiden

38. LangSmith

LangSmith ist die gehostete Plattform des LangChain-Teams und bietet Observability, Tracking und Evaluation für LLM-Anwendungen
Sie erfasst detaillierte Traces von Chains, Tools und Prompts, sodass Teams Modellverhalten debuggen und messen, Performance-Regressionen verfolgen und Evaluations-Datensätze verwalten können
LangSmith ist eine proprietäre SaaS-Plattform mit eingeschränkter Unterstützung für non-LangChain-Workflows und daher besonders attraktiv für Teams, die bereits in dieses Ökosystem investiert haben
Die integrierte Unterstützung für Prompt-Evaluation und Experimente wirkt besonders ausgereift, insbesondere im Vergleich zu Open-Source-Alternativen wie Langfuse

39. Model Context Protocol (MCP)

Model Context Protocol (MCP) ist ein offener Standard, der definiert, wie LLM-Anwendungen und Agenten externe Datenquellen und Tools integrieren
MCP unterscheidet sich vom Protokoll Agent2Agent (A2A), das die Kommunikation zwischen Agenten verwaltet, indem es sich auf Kontext und Tool-Zugriff konzentriert
Seit dem letzten Blip ist die Einführung von MCP stark angestiegen, sodass große Unternehmen wie JetBrains (IntelliJ) und Apple gemeinsam mit aufkommenden Frameworks wie FastMCP zum Ökosystem gestoßen sind
Der Preview-Standard MCP Registry unterstützt nun die Erkennung öffentlicher und proprietärer Tools

40. n8n

n8n ist eine Workflow-Automatisierungsplattform mit fair-code-Lizenz ähnlich wie Zapier oder Make (früher Integromat), wurde jedoch für Entwickler entwickelt, die Self-Hosting, Erweiterbarkeit und per Code steuerbare Optionen wünschen
Bietet einen Low-Code-, visuellen Ansatz zur Erstellung von Workflows im Vergleich zu Apache Airflow und unterstützt dennoch benutzerdefinierten Code in JavaScript oder Python
Ein zentraler Anwendungsfall ist die Integration mehrerer Services in automatisierte Workflows, aber es kann auch LLMs mit konfigurierbaren Datenquellen, Speicher und Tools verbinden
Viele Teams nutzen n8n, um Agenten-Workflows, die durch Chat-Anwendungen oder Webhooks ausgelöst werden, schnell zu prototypisieren, und verwenden dabei häufig die Import- und Exportfunktionen zur KI-gestützten Workflow-Erstellung

41. OpenThread

OpenThread ist eine Open-Source-Implementierung des von Google entwickelten Thread-Netzwerkprotokolls
Unterstützt alle wichtigen Funktionen der Thread-Spezifikation, einschließlich Netzwerk-Layern wie IPv6, 6LoWPAN und LR-WPAN, sowie Mesh-Netzwerkfunktionen, bei denen Geräte als Knoten und Border Router fungieren können
OpenThread läuft auf einer breiten Palette von Hardwareplattformen und nutzt eine flexible Abstraktionsschicht sowie Integrations-Hooks, mit denen Anbieter ihre eigenen Funk- und Kryptografie-Funktionen integrieren können
Dieses ausgereifte Protokoll wird in kommerziellen Produkten breit eingesetzt und hat sich unserer Erfahrung nach als zuverlässig für den Aufbau verschiedenster IoT-Lösungen erwiesen, von batteriebetriebenen Low-Power-Geräten bis hin zu großen Mesh-Sensornetzwerken

Assess

42. AG-UI Protocol

AG-UI ist ein offenes Protokoll und eine Bibliothek, die darauf ausgelegt sind, umfangreiche Benutzeroberflächen und die Kommunikation zwischen Agenten zu standardisieren
Konzentriert sich auf direkt nutzergerichtete Agenten und lässt sich mithilfe von Middleware- und Client-Integrationen auf jedes Frontend und Backend verallgemeinern
Das Protokoll definiert eine konsistente Methode, mit der Backend-Agenten mit Frontend-Anwendungen kommunizieren, und ermöglicht so zustandsbehaftete Zusammenarbeit in Echtzeit zwischen KI und menschlichen Nutzern
Unterstützt mehrere Transportprotokolle einschließlich SSE und WebSockets und bietet standardisierte Ereignistypen, die verschiedene Zustände der Agentenausführung darstellen

43. Agent-to-Agent (A2A) Protocol

Agent2Agent (A2A) ist ein Protokoll, das Standards für Kommunikation und Interaktion zwischen Agenten in komplexen Multi-Agenten-Workflows definiert
Beschreibt mithilfe von Agent Cards Kernelemente der Kommunikation zwischen Agenten, einschließlich Spezifikationen für Capability Discovery und Transport sowie Sicherheitsmechanismen
A2A ergänzt Model Context Protocol (MCP), indem es sich auf die Kommunikation zwischen Agenten konzentriert, ohne interne Details wie Zustand, Speicher oder Interna eines Agenten offenzulegen
Das Protokoll fördert Best Practices wie einen asynchron-first-Ansatz für lang laufende Aufgaben, Streaming-Antworten für schrittweise Updates sowie sichere Übertragung mit HTTPS, Authentifizierung und Autorisierung

44. Amazon S3 Vectors

Amazon S3 Vectors erweitert den S3-Objektspeicher um native Vektor-Funktionen und bietet integrierte Vektorspeicherung sowie Ähnlichkeitssuche
Lässt sich nahtlos in das AWS-Ökosystem einschließlich Amazon Bedrock und OpenSearch integrieren und bietet zusätzliche Funktionen wie Metadatenfilterung und Governance über IAM
Befindet sich noch im Preview-Stadium und hat Einschränkungen, aber das Wertversprechen ist attraktiv – dieser kosteneffiziente und zugängliche Ansatz für Vektorspeicher eignet sich für verschiedene Anwendungen mit großen Datenvolumen, bei denen geringe Latenz nicht das Hauptanliegen ist

45. Ardoq

Ardoq ist eine Enterprise-Architecture-(EA)-Plattform, mit der Organisationen ihre Architektur-Wissensbasis aufbauen, verwalten und skalieren können, um die Zukunft effektiver zu planen
Anders als traditionelle statische Dokumentation, die zu Drift und Silobildung neigt, erzeugt Ardoqs datengetriebener Ansatz dynamische Wissensgraphen, indem Informationen aus bestehenden Systemen übernommen und mit der Weiterentwicklung der Landschaft aktuell gehalten werden
Eine besonders nützliche Funktion ist Ardoq Scenarios, mit der sich mithilfe eines Git-ähnlichen Branch-and-Merge-Ansatzes visuell mögliche Zielzustände modellieren und definieren lassen
Organisationen, die eine Architekturtransformation anstreben, sollten dedizierte EA-Plattformen wie Ardoq hinsichtlich ihres Potenzials zur Vereinfachung und Beschleunigung dieses Prozesses evaluieren

46. CloudNativePG

CloudNativePG ist ein Kubernetes Operator, der das Hosting und Management hochverfügbarer PostgreSQL-Cluster auf Kubernetes vereinfacht
Der Betrieb zustandsbehafteter Services wie PostgreSQL auf Kubernetes kann komplex sein, da dafür tiefes Wissen sowohl über Kubernetes als auch über PostgreSQL-Replikation erforderlich ist
CloudNativePG abstrahiert einen Großteil dieser Komplexität, indem es den gesamten PostgreSQL-Cluster als einzelne konfigurierbare deklarative Ressource behandelt
Bietet eine nahtlose Primary/Standby-Architektur mit nativer Streaming-Replikation und liefert Hochverfügbarkeitsfunktionen sofort mit, darunter Self-Healing, automatisches Failover durch Promotion des am weitesten synchronisierten Replikats und automatische Neuerstellung ausgefallener Replikate

47. Coder

Coder ist eine Plattform zur schnellen Bereitstellung standardisierter Coding-Umgebungen gemäß der zuvor beschriebenen Praxis development environments in the cloud
Im Vergleich zu ähnlichen Tools wie Gitpod (jetzt in Ona umbenannt) und GitHub Codespaces bietet Coder mehr Kontrolle über die Anpassung von Workstations über Terraform
Hostet Workstations auf der eigenen Infrastruktur in der Cloud oder im Rechenzentrum statt auf den Servern des Anbieters
Dieser Ansatz bietet mehr Flexibilität, einschließlich der Möglichkeit, KI-Coding-Agenten auszuführen und auf interne Organisationssysteme zuzugreifen

48. Graft

Graft ist eine transaktionale Storage-Engine, die robuste Konsistenz und effiziente Datensynchronisierung in Edge- und verteilten Umgebungen ermöglicht
Nutzt lazy replication, um Daten nur bei Bedarf zu synchronisieren, minimiert durch partial replication den Bandbreitenverbrauch und gewährleistet mit serializable snapshot isolation die Datenintegrität
Für ähnliche Anwendungsfälle wurde im Radar Electric erwähnt, doch Graft ist dadurch einzigartig, dass es Objektspeicher in ein transaktionales System verwandelt, das konsistente Updates auf Seitenebene unterstützt, ohne ein Datenformat vorzugeben
Eignet sich gut als Grundlage für Local-first-Mobilanwendungen, für die Verwaltung komplexer plattformübergreifender Synchronisierung und als Backbone für zustandslose Replikate in serverlosen oder eingebetteten Systemen

49. groundcover

groundcover ist eine Cloud-native Observability-Plattform, die Logs, Traces, Metriken und Kubernetes-Ereignisse in einer einzigen Oberfläche zusammenführt
Nutzt eBPF, um granulare Observability-Daten per Zero-Code-Instrumentierung zu erfassen, ohne Agents oder SDKs in den Anwendungscode einzubetten
Die eBPF-Sensoren von groundcover laufen auf dedizierten Nodes in jedem überwachten Cluster und arbeiten unabhängig von den beobachteten Anwendungen
Zu den wichtigsten Funktionen gehören tiefe Transparenz auf Kernel-Ebene, eine Bring-your-own-cloud-(BYOC)-Architektur für Datenschutz sowie ein von Datenvolumen unabhängiges Preismodell, das die Kosten planbar hält

50. Karmada

Karmada ("Kubernetes Armada") ist eine Plattform zur Orchestrierung von Workloads über mehrere Kubernetes-Cluster, Clouds und Rechenzentren hinweg
Viele Teams kombinieren derzeit GitOps-Tools wie Flux oder ArgoCD mit benutzerdefinierten Skripten für clusterübergreifende Deployments, daher sind zweckgerichtete Lösungen willkommen
Karmada nutzt Kubernetes-native APIs, sodass Anwendungen, die bereits für Cloud-native Umgebungen entwickelt wurden, nicht angepasst werden müssen
Bietet erweiterte Scheduling-Funktionen für Multi-Cloud-Management, Hochverfügbarkeit, Disaster Recovery und Traffic-Scheduling

51. OpenFeature

Mit dem Wachstum von Unternehmen wird das Management von Feature Flags oft zunehmend komplex, und Teams brauchen eine Abstraktionsschicht, die über einfache Feature Toggles hinausgeht
OpenFeature bietet diese Schicht durch eine anbieterunabhängige, Community-getriebene API-Spezifikation, die standardisiert, wie Feature Flags definiert und genutzt werden
Die CLI bietet umfassende Unterstützung für verschiedene Schemadefinitionen, von Basiskonfigurationen mit Umgebungsvariablen oder In-Memory-Konfigurationen bis hin zu ausgereiften Plattformen wie ConfigCat oder LaunchDarkly
Es bleibt jedoch ein wichtiger Hinweis: Teams sollten die verschiedenen Kategorien von Flags getrennt und diszipliniert verwalten, um Flag-Wildwuchs, Anwendungskomplexität und übermäßigen Testaufwand zu vermeiden

52. Oxide

Der Aufbau und Betrieb privater Infrastruktur ist komplex, was einer der Hauptgründe dafür ist, dass Public Cloud für die meisten Organisationen die Standardwahl ist
Für diejenigen, die sie dennoch benötigen, bietet Oxide eine Alternative, bei der Hardware und Software von Grund auf zusammengestellt und integriert werden
Bietet vorkonfigurierte Racks mit Compute, Networking und Storage, auf denen vollständig integrierte Systemsoftware läuft
Teams können Ressourcen über die IaaS-API von Oxide mit Terraform und anderen Automatisierungstools verwalten – das, was Oxide als elastische On-Premises-Infrastruktur bezeichnet

53. Restate

Restate ist eine Plattform für dauerhafte Ausführung, die dafür entwickelt wurde, komplexe Herausforderungen verteilter Systeme beim Aufbau zustandsbehafteter, fehlertoleranter Anwendungen zu lösen
Durch Execution Journaling wird jeder Schritt aufgezeichnet, um Fehlertoleranz, zuverlässige Wiederherstellung und Exactly-once-Kommunikation zwischen Services sicherzustellen
Ein zentraler Architekturvorteil der Plattform ist die Aufteilung der Anwendungslogik in drei Typen dauerhafter Services: Basic Services für zustandslose Funktionen, Virtual Objects zur Modellierung nebenläufiger zustandsbehafteter Entitäten und Workflows zur Orchestrierung komplexer mehrstufiger Prozesse
Wir evaluieren Restate derzeit sorgfältig in einem großen Versicherungssystem und sind bisher mit der Performance sehr zufrieden

54. SkyPilot

SkyPilot ist eine Open-Source-Plattform zum Ausführen und Skalieren von AI-Workloads On-Premises oder in der Cloud
SkyPilot wurde im Sky Computing Lab der UC Berkeley entwickelt und fungiert als intelligenter Broker, der automatisch die günstigsten verfügbaren GPUs in führenden Clouds und Kubernetes-Clustern findet und bereitstellt, was die Rechenkosten häufig senkt
Für Infrastrukturteams vereinfacht es die Ausführung von AI auf Kubernetes durch Funktionen wie eine Benutzerfreundlichkeit ähnlich Slurm, Cloud-native Robustheit, direkten SSH-Zugriff auf Pods, Gang Scheduling und Multi-Cluster-Unterstützung
Unterstützt die nahtlose Skalierung von Trainings- oder Inferenz-Workloads

55. StarRocks

StarRocks ist eine analytische Datenbank, die die Geschwindigkeit traditioneller OLAP-Systeme mit der Flexibilität moderner Data Lakehouses kombiniert und damit Business Intelligence in Echtzeit neu definiert
Erzielt durch eine SIMD-optimierte Execution Engine, spaltenorientierten Speicher und einen ausgefeilten kostenbasierten Optimizer Query-Latenzen von unter einer Sekunde auch in großem Maßstab
Diese Hochleistungsarchitektur ermöglicht es Nutzern, komplexe Analysen direkt auf offenen Datenformaten wie Apache Iceberg auszuführen, ohne Vorabberechnungen oder Datenkopien
In diesem Bereich gibt es viele Plattformen, aber wir sehen StarRocks als starken Kandidaten für eine kosteneffiziente Lösung, die sowohl extreme Parallelität als auch konsistent aktuelle Datenfrische erfordert

56. Uncloud

Uncloud ist ein leichtgewichtiges Tool für Container-Orchestrierung und Clustering, mit dem Entwickler Docker-Compose-Anwendungen in die Produktion bringen können
Bietet eine einfache, Cloud-ähnliche Erfahrung ohne den operativen Overhead von Kubernetes
Ermöglicht maschinenübergreifende Skalierung und Zero-Downtime-Deployments, indem automatisch ein sicheres Mesh-Netzwerk mit WireGuard für die Kommunikation konfiguriert wird und ein Caddy Reverse Proxy automatisches HTTPS und Load Balancing bereitstellt
Der zentrale Architekturvorteil von Uncloud ist das vollständig verteilte Design, das die Notwendigkeit einer zentralen Control Plane eliminiert und sicherstellt, dass der Cluster funktional weiterarbeitet, selbst wenn einzelne Maschinen offline gehen

[Tools]

Adopt

57. ClickHouse

ClickHouse ist eine Open-Source, verteilte spaltenorientierte Online Analytical Processing (OLAP)-Datenbank für Echtzeitanalysen
Hat sich zu einer hochperformanten und skalierbaren Engine entwickelt, die große Datenanalysen bewältigen kann
Mit inkrementellen materialisierten Sichten, einer effizienten Query Engine und starker Datenkompression ist sie ideal für interaktive Abfragen
Durch integrierte Unterstützung für approximative Aggregatfunktionen sind Abwägungen zwischen Genauigkeit und Performance möglich, was besonders für Analysen mit hoher Kardinalität nützlich ist

58. NeMo Guardrails

NeMo Guardrails ist ein Open-Source-Toolkit von NVIDIA, das programmierbare Sicherheits- und Kontrollmechanismen für dialogorientierte Anwendungen auf LLM-Basis einfach hinzufügt
Definiert und erzwingt Verhaltensregeln, damit Ausgaben sicher, thematisch passend und regelkonform bleiben
Entwickler verwenden die zweckgebundene Sprache Colang, um flexible Dialogabläufe zu erstellen, Gespräche zu steuern und vordefinierte Pfade sowie Betriebsverfahren durchzusetzen
NeMo Guardrails bietet eine Async-first-API für Performance und unterstützt Schutzmechanismen für Content-Sicherheit, Security sowie die Steuerung von Eingaben und Ausgaben

59. pnpm

Seit dem letzten Radar erhält das Team weiterhin positives Feedback zu pnpm
pnpm ist ein Paketmanager für Node.js, der im Vergleich zu Alternativen sowohl bei der Geschwindigkeit als auch bei der Effizienz der Speichernutzung deutlich bessere Leistung bietet
Unterstützt inkrementelle Optimierungen auf Dateiebene, die die Leistung weiter verbessern, indem doppelte Pakete aus den node_modules-Ordnern mehrerer Projekte per Hardlink auf einen einzigen Speicherort auf der Festplatte verweisen
pnpm ist zur Standardwahl für das Paketmanagement in Node.js geworden, da es mit minimalen Kompatibilitätsproblemen einen deutlich schnelleren Feedback-Loop bietet

60. Pydantic

Pydantic ist eine Python-Bibliothek, die Datenmodelle mit standardmäßigen Type Hints definiert und Datenschemata zur Laufzeit erzwingt
Typannotationen wurden ursprünglich für statische Analyse zu Python hinzugefügt, doch ihre zunehmende Vielfalt führte zu breiteren Einsatzmöglichkeiten einschließlich Laufzeitvalidierung
Auf einem schnellen Rust-Core aufgebaut und bietet effiziente Datenvalidierung, Parsing und Serialisierung
Ist in LLM-Anwendungen unverzichtbar geworden und wird typischerweise zusammen mit der Technik structured output from LLMs verwendet, um die Unvorhersehbarkeit von LLMs zu handhaben

Trial

61. AI Design Reviewer

AI Design Reviewer ist ein Figma-Plugin, um Design-Audits oder heuristische Evaluierungen durchzuführen und umsetzbares Feedback zu bestehenden oder neuen Designs zu sammeln
Die Audits decken UX-Kritik, UI-Inkonsistenzen, Barrierefreiheitslücken, Content-Qualität und Edge-Case-Szenarien ab
Neben der Identifikation von Problemen liefert es domänenbewusste Empfehlungen, die Teams helfen, ein gemeinsames Designvokabular und die Begründung hinter Designentscheidungen aufzubauen
Das Team nutzte AI Design Reviewer zur Analyse von Legacy-Designs – um positive Erfahrungen zu identifizieren, die beibehalten werden sollten, und negative Erfahrungen, die behoben werden müssen, und so UX-Ziele für ein Redesign zu informieren

62. Barman

Barman (Backup and Recovery Manager) ist ein Open-Source-Tool zur Verwaltung von Backups und Disaster Recovery für PostgreSQL-Server
Vereinfacht die Erstellung physischer Backups über verschiedene Methoden, organisiert sie in einem umfassenden Katalog und unterstützt den gesamten Disaster-Recovery-Prozess durch das Wiederherstellen von Backups auf Live-Server mit Point-in-Time-Recovery-Funktionen
Es wurde festgestellt, dass Barman robust und einfach zu bedienen ist; besonders beeindruckend war die Geschwindigkeit von Point-in-Time-Recovery-Vorgängen während Migrationsaktivitäten
Ist auch bei geplanten Backups leistungsfähig und kann komplexe, gemischte Konfigurationen für Planung und Aufbewahrung bewältigen

63. Claude Code

Claude Code von Anthropic ist ein agentisches AI-Coding-Tool, das eine natürlichsprachliche Schnittstelle und ein agentisches Ausführungsmodell zur Planung und Umsetzung komplexer mehrstufiger Workflows bietet
Wurde vor weniger als einem Jahr veröffentlicht, ist aber bereits unter Entwicklern innerhalb und außerhalb von Thoughtworks weit verbreitet und wurde deshalb in Trial eingeordnet
Konsolenbasierte Coding-Agenten wie OpenAIs Codex CLI, Googles Gemini CLI und das Open-Source-Projekt OpenCode sind erschienen, und IDE-basierte Assistenten wie Cursor, Windsurf und GitHub Copilot enthalten inzwischen einen Agent Mode
Es wurde beobachtet, dass Teams das Tool nicht nur zum Schreiben und Ändern von Code verwenden, sondern als universellen AI-Agenten für die Verwaltung von Spezifikationen, Stories, Konfiguration, Infrastruktur und Dokumentation

64. Cleanlab

Im Paradigma der datenorientierten AI bringt die Verbesserung der Datensatzqualität oft größere Leistungssteigerungen als das Tuning des Modells selbst
Cleanlab ist eine Open-Source-Python-Bibliothek, die zur Lösung dieses Problems entwickelt wurde und häufige Datenprobleme wie falsche Labels, Ausreißer und Duplikate in Text-, Bild-, tabellarischen und Audio-Datensätzen automatisch identifiziert
Cleanlab basiert auf den Prinzipien des confident learning und nutzt Modellvorhersagewahrscheinlichkeiten, um Label-Rauschen zu schätzen und die Datenqualität zu quantifizieren
Dieser modellunabhängige Ansatz ermöglicht es Entwicklern, Fehler in Datensätzen zu diagnostizieren und zu beheben und das Modell anschließend für verbesserte Robustheit und Genauigkeit neu zu trainieren

65. Context7

Context7 ist ein MCP-Server zur Behebung von Ungenauigkeiten in AI-generiertem Code
Während LLMs auf veraltete Trainingsdaten angewiesen sind, stellt Context7 sicher, dass präziser, aktueller und versionsspezifischer Code für die im Projekt verwendeten Bibliotheken und Frameworks erzeugt wird
Holt aktuelle Dokumentation und funktionsfähige Codebeispiele direkt aus den Source-Repositories der Frameworks und injiziert sie im Moment des Promptings in das Kontextfenster des LLM
Nach den Erfahrungen damit reduziert Context7 Code-Halluzinationen und die Abhängigkeit von veralteten Trainingsdaten deutlich

66. Data Contract CLI

Data Contract CLI ist ein Open-Source-Command-Line-Tool, das für die Arbeit mit der Data Contract-Spezifikation entwickelt wurde
Ermöglicht das Erstellen und Bearbeiten von Datenverträgen und vor allem die Validierung von Daten gegen diese Verträge, was wesentlich ist, um Integrität und Qualität von Datenprodukten sicherzustellen
Das CLI bietet umfassende Unterstützung für mehrere Schemadefinitionen (Avro, SQL DDL, Open Data Contract Standard usw.) und kann verschiedene Vertragsversionen vergleichen, um Breaking Changes sofort zu erkennen
Es erwies sich als besonders nützlich, um die Governance von Verträgen zwischen Datenprodukten per CI/CD-Integration zu operationalisieren, insbesondere im Data-Mesh-Umfeld

67. Databricks Assistant

Databricks Assistant ist ein AI-gestütztes dialogorientiertes Tool, das direkt in die Databricks-Plattform integriert ist und als kontextbezogener Pair Programmer für Datenexperten dient
Anders als universelle Coding-Assistenten profitiert es von einem grundlegenden Verständnis der Databricks-Umgebung und des Datenkontexts, einschließlich der Metadaten im Unity Catalog
Der Assistant geht über die Erzeugung von Code-Snippets hinaus und kann komplexe mehrstufige SQL- und Python-Abfragen erstellen, Fehler diagnostizieren und detaillierte, Workspace-spezifische Erklärungen liefern
Für Organisationen, die bereits in das Databricks-Ökosystem investiert haben, kann es die Produktivität beschleunigen und die Einstiegshürde für komplexe Datenarbeit senken

68. Hoppscotch

Hoppscotch ist ein leichtgewichtiges Open-Source-Tool für API-Entwicklung, Debugging, Tests und Zusammenarbeit
Unterstützt mehrere Protokolle einschließlich HTTP, GraphQL und WebSocket und bietet plattformübergreifende Clients für Web-, Desktop- und CLI-Umgebungen
Der Markt für API-Tools ist zwar mit Alternativen wie Postman, Insomnia und Bruno dicht besetzt, doch Hoppscotch hebt sich durch seinen geringen Footprint und sein datenschutzfreundliches Design ab
Verzichten auf Analytics, nutzt Local-First-Speicher und unterstützt Self-Hosting, wodurch es eine starke Wahl für Organisationen ist, die eine intuitive Möglichkeit suchen, API-Skripte zu teilen und dabei einen hohen Datenschutz zu wahren

69. NVIDIA DCGM Exporter

NVIDIA DCGM Exporter ist ein Open-Source-Tool, das Teams hilft, verteiltes GPU-Training im großen Maßstab zu überwachen
Wandelt die proprietäre Telemetrie von NVIDIA Data Center GPU Manager (DCGM) in ein offenes Format um, das mit Standard-Monitoring-Systemen kompatibel ist
Stellt wichtige Echtzeitmetriken sowohl von GPUs als auch von Host-Servern bereit, etwa GPU-Auslastung, Temperatur, Stromverbrauch und die Anzahl von ECC-Fehlern
Diese Transparenz ist essenziell für Organisationen, die benutzerdefinierte LLMs feinabstimmen oder langlaufende, GPU-intensive Trainingsjobs ausführen

70. RelationalAI

Wenn große Mengen unterschiedlichster Daten in Snowflake importiert werden, können die einzigartigen Beziehungen und impliziten Regeln in diesen Daten unklar werden
RelationalAI, aufgebaut als Snowflake Native App, ermöglicht es Teams, anspruchsvolle Modelle zu entwickeln, die sinnvolle Konzepte erfassen, zentrale Business-Entitäten definieren und komplexe Logik direkt in Snowflake-Tabellen einbetten
Mit einem leistungsstarken Graph Reasoner können Nutzer auf Basis dieser Modelle relationale Wissensgraphen erzeugen, analysieren und visualisieren
Für Organisationen, die große, sich schnell verändernde Datensätze verwalten, kann der Aufbau von Wissensgraphen entscheidend für proaktives Monitoring und die Generierung reichhaltigerer, umsetzbarer Erkenntnisse sein

71. UX Pilot

UX Pilot ist ein AI-Tool, das mehrere Schritte des UX-Design-Prozesses unterstützt, vom Wireframing bis hin zu hochauflösendem visuellen Design und Reviews
Es akzeptiert Text- oder Bildeingaben und kann automatisch Screens, Flows und Layouts erzeugen
Die Autoflow-Funktion erstellt Übergänge in User Flows, und Deep Design erzeugt reichhaltigere und detailliertere Ausgaben
UX Pilot enthält außerdem ein Figma-Plugin, das die erzeugten Designs zur weiteren Verfeinerung innerhalb gängiger Design-Tools exportiert

72. v0

v0 hat sich seit seiner letzten Erwähnung im Radar weiterentwickelt
Es enthält nun einen Design-Modus, mit dem Produktmanager Self-Service-UI-Prototypen einfacher erstellen und anpassen können
Das neueste Release führt ein eigenes Modell mit großem Kontextfenster und multimodalen Fähigkeiten ein, sodass v0 UIs sowohl aus Text- als auch aus visuellen Eingaben erzeugen und verbessern kann
Eine weitere bemerkenswerte Ergänzung ist der Agent-Modus, in dem das System komplexere Aufgaben zerlegen und für jede davon das passende Modell auswählen kann

Assess

73. Augment Code

Augment Code ist ein AI-Coding-Assistent, der tiefes kontextsensitives Arbeiten in großen Codebases unterstützt
Er sticht durch fortschrittliches context engineering hervor, das schnelle Updates des Code-Index und zügige Suche ermöglicht, selbst wenn sich der Code häufig ändert
Augment unterstützt Modelle wie Claude Sonnet 4 und 4.5 sowie GPT-5, integriert sich mit GitHub, Jira und Confluence und unterstützt das Model Context Protocol (MCP) für die Interoperabilität mit externen Tools
Es bietet Schritt-für-Schritt-Anleitungen für komplexe Änderungen an Codebases, von Refactoring und Dependency-Upgrades bis zu Schema-Updates

74. Azure AI Document Intelligence

Azure AI Document Intelligence (früher Form Recognizer) extrahiert Text, Tabellen und Schlüssel-Wert-Paare aus unstrukturierten Dokumenten und wandelt sie in strukturierte Daten um
Dabei werden vortrainierte Deep-Learning-Modelle genutzt, um Layout und Bedeutung zu interpretieren; für spezielle Formate können über eine No-Code-Oberfläche auch Custom-Modelle trainiert werden
Eines der Teams berichtete, dass ADI die manuelle Dateneingabe deutlich reduziert, die Datengenauigkeit verbessert und das Reporting beschleunigt hat, was zu schnelleren datenbasierten Entscheidungen führte
Wie Amazon Textract und Google Document AI bietet es Enterprise-taugliche Dokumentenverarbeitung mit starkem Layout-Verständnis

75. Docling

Docling ist eine Open-Source-Bibliothek für Python und TypeScript für fortgeschrittene Dokumentenverarbeitung unstrukturierter Daten
Sie löst das oft übersehene „Last-Mile“-Problem, reale Dokumente wie PDF und PowerPoint in saubere, maschinenlesbare Formate umzuwandeln
Im Unterschied zu traditionellen Extractors nutzt Docling einen Computer-Vision-basierten Ansatz, um Dokument-Layout und semantische Struktur zu interpretieren, wodurch die Ausgabe besonders wertvoll für retrieval-augmented generation (RAG)-Pipelines wird
Es unterstützt Techniken wie structured output from LLMs, indem komplexe Dokumente in strukturierte Formate wie JSON oder Markdown umgewandelt werden

76. E2B

E2B ist ein Open-Source-Tool zur Ausführung von AI-generiertem Code in sicheren, isolierten Sandboxes in der Cloud
Agenten können diese auf Firecracker microVMs basierenden Sandboxes nutzen, um Code sicher auszuführen, Daten zu analysieren, Research zu betreiben oder virtuelle Maschinen zu betreiben
Dadurch lassen sich Enterprise-taugliche AI-Agenten mit vollständiger Kontrolle über die Laufzeitumgebung und hoher Sicherheit entwickeln und deployen

77. Helix editor

Es gab eine gewisse Wiederbelebung einfacher Texteditoren, die den Kommandozeilen-Favoriten Vim ersetzen wollen
Helix ist neben Neovim und dem jüngeren Kakoune einer der Kandidaten in diesem dicht besetzten Feld
Mit einem augenzwinkernden Selbstverständnis als postmoderner Texteditor bietet Helix mehrere Cursor, Tree-sitter-Support und integrierte Unterstützung für das Language Server Protocol (LSP), was ursprünglich unsere Aufmerksamkeit geweckt hat
Er wird mit einem noch in Arbeit befindlichen Plugin-System aktiv weiterentwickelt und ist insgesamt ein leichtgewichtiger modaler Editor, der sich für Vim-Nutzer vertraut anfühlt, aber einige moderne Komfortfunktionen ergänzt

78. Kueue

Kueue ist ein Kubernetes-nativer Controller für Job Queues, der Quoten und Ressourcenverbrauch verwaltet
Es stellt APIs für die Verarbeitung von Kubernetes-Workloads mit unterschiedlichen Prioritäten und Ressourcenanforderungen bereit und fungiert als Job-Level-Manager, der entscheidet, wann Jobs zugelassen oder entfernt werden
Kueue wurde für effizientes Ressourcenmanagement, Job-Priorisierung und fortgeschrittenes Scheduling entwickelt und hilft dabei, die Ausführung von Workloads in Kubernetes-Umgebungen zu optimieren, insbesondere bei ML-Workloads mit Tools wie Kubeflow
Es ersetzt cluster-autoscaler und kube-scheduler nicht, sondern arbeitet mit ihnen zusammen und konzentriert sich auf die Job-Zulassung auf Basis von Reihenfolge, Quoten, Prioritäten und Topologie-Bewusstsein

79. MCPScan.ai

MCPScan.ai ist ein Security-Scanner für Model Context Protocol (MCP)-Server, der in zwei Modi arbeitet: Scan und Proxy
Im Scan-Modus analysiert er Konfigurationen und Tool-Beschreibungen, um bekannte Schwachstellen wie Prompt Injection, Tool Poisoning und toxic flows zu erkennen
Im Proxy-Modus fungiert MCPScan.ai als Brücke zwischen Agent-Systemen und MCP-Servern und überwacht den Runtime-Traffic kontinuierlich
Dieser Modus erzwingt außerdem Custom-Sicherheitsregeln und Guardrails, einschließlich Validierung von Tool-Calls, PII-Erkennung und Beschränkungen des Datenflusses

80. oRPC

oRPC (OpenAPI Remote Procedure Call) bietet End-to-End typsichere APIs in TypeScript und erfüllt dabei die OpenAPI-Spezifikation vollständig
Kann automatisch eine vollständige OpenAPI-Spezifikation erzeugen und so Integration und Dokumentation vereinfachen
Während Alternativen wie tRPC und ElysiaJS häufig die Einführung neuer Frameworks erfordern, um Typsicherheit zu erreichen, integriert sich oRPC nahtlos in bestehende Node.js-Frameworks einschließlich Express, Fastify, Hono und Next.js
Diese Flexibilität macht es zu einer hervorragenden Wahl für Teams, die End-to-End-Typsicherheit in bestehende APIs übernehmen wollen, ohne disruptive Refactorings

81. Power user for dbt

Power user for dbt ist eine Erweiterung für Visual Studio Code, die sich direkt sowohl in dbt als auch in dbt Cloud-Umgebungen integriert
Da dbt eines unserer bevorzugten Tools bleibt, ist alles, was die Nutzbarkeit verbessert, eine willkommene Ergänzung des Ökosystems
Zuvor waren Entwickler darauf angewiesen, mehrere Tools außerhalb der IDE zu nutzen, um SQL-Code zu validieren oder die Modell-Lineage zu prüfen
Mit dieser Erweiterung sind diese Funktionen nun in VS Code integriert und bieten Code-Autovervollständigung, Query-Ergebnisse in Echtzeit sowie visuelle Modell- und Spalten-Lineage

82. Serena

Serena ist ein leistungsfähiges Coding-Toolkit, das Coding-Agenten wie Claude Code IDE-ähnliche Funktionen für semantische Codesuche und -bearbeitung bereitstellt
Durch die Arbeit auf Symbolebene und das Verständnis der relationalen Struktur des Codes verbessert Serena die Token-Effizienz deutlich
Statt ganze Dateien zu lesen oder sich auf grobe String-Ersetzungen zu verlassen, können Coding-Agenten präzise Serena-Tools wie find_symbol, find_referencing_symbols und insert_after_symbol verwenden, um Code zu finden und zu bearbeiten
In kleinen Projekten ist die Wirkung gering, aber mit wachsender Codebasis wird diese Effizienz sehr wertvoll

83. SweetPad

Die Erweiterung SweetPad ermöglicht es Entwicklern, VS Code oder Cursor für den gesamten Lebenszyklus der Swift-Applikationsentwicklung auf Apple-Plattformen zu nutzen
Integriert essenzielle Tools wie xcodebuild, xcode-build-server und swift-format und macht den ständigen Wechsel zu Xcode überflüssig
Entwickler können Swift-Applikationen für iOS, macOS und watchOS direkt aus der IDE bauen, ausführen und debuggen sowie Simulatoren verwalten und auf Geräte deployen, ohne Xcode zu öffnen

84. Tape/Z (Tools for Assembly Program Exploration for Z/OS)

Tape/Z (Tools for Assembly Program Exploration for Z/OS) ist ein sich weiterentwickelndes Toolkit zur Analyse von Mainframe-HLASM-(High-Level Assembler)-Code
Wurde von Thoughtworkern entwickelt und bietet Funktionen wie Parsing, Aufbau von Control-Flow-Graphen, Abhängigkeitsverfolgung und Flowchart-Visualisierung
Wir haben seit Langem auf die Knappheit offener, von der Community getriebener Tools im Mainframe-Bereich hingewiesen; die meisten Optionen sind proprietär oder an Vendor-Ökosysteme gebunden
Tape/Z hilft, diese Lücke zu schließen, indem es zugängliche und skriptbare Analysefunktionen bereitstellt

[Languages and Frameworks]

Adopt

85. Fastify

Unsere positiven Erfahrungen mit Fastify setzen sich fort – ein schnelles, meinungsarmes Web-Framework mit geringem Overhead für Node.js
Bietet alle essenziellen Funktionen eines minimalistischen Web-Frameworks, einschließlich Parsing, Validierung und Serialisierung, sowie ein robustes Plugin-System und starke Community-Unterstützung
Das Team hat im Vergleich zu Alternativen wie Express.js keine wesentlichen Nachteile bei der Nutzung von Fastify gesehen und zugleich messbare Performance-Verbesserungen erzielt, was es zu einer attraktiven Wahl für minimalistische Webentwicklung mit Node.js macht

86. LangGraph

LangGraph ist ein Orchestrierungs-Framework zum Aufbau zustandsbehafteter Multi-Agenten-Anwendungen mit LLMs
Bietet Low-Level-Primitives wie Nodes und Edges sowie eingebaute Funktionen, die Entwicklern eine granulare Kontrolle über Agent-Workflows, Memory-Management und Persistenz des Zustands geben
Das bedeutet, dass Entwickler mit einfachen vorgefertigten Graphen beginnen und zu komplexen, sich weiterentwickelnden Agent-Architekturen skalieren können
Mit Unterstützung für Resilienz-Patterns wie Streaming, fortgeschrittenes Kontextmanagement, Model-Fallbacks und Tool-Fehlerbehandlung ermöglicht LangGraph den Aufbau robuster Agent-Anwendungen für den Produktiveinsatz

87. vLLM

vLLM ist eine Inferenz-Engine für LLMs mit hohem Durchsatz und effizienter Speichernutzung, die in der Cloud oder On-Premises ausgeführt werden kann
Unterstützt mehrere Modellarchitekturen und populäre Open-Source-Modelle
Teams haben dockerisierte vLLM-Worker auf GPU-Plattformen wie NVIDIA DGX und Intel HPC bereitgestellt und hosten damit Modelle einschließlich Llama 3.1 (8B und 70B), Mistral 7B und Llama-SQL für Unterstützung beim Entwickler-Coding, Wissensabruf und natürlichsprachliche Datenbankinteraktion
vLLM ist mit dem OpenAI-SDK-Standard kompatibel und ermöglicht konsistentes Model Serving

Trial

88. Crossplane

Seit dem letzten Erscheinen im Radar nimmt die Nutzung von Crossplane weiter zu, insbesondere zur Erweiterung von Kubernetes-Clustern
In unserer Arbeit haben wir festgestellt, dass Crossplane in bestimmten Anwendungsfällen glänzt, statt ein allgemeines Infrastructure-as-Code-(IaC)-Tool zu sein
Unsere frühere Beobachtung gilt weiterhin: Crossplane funktioniert am besten als Begleiter für innerhalb von Kubernetes bereitgestellte Workloads und ist kein vollständiger Ersatz für Tools wie Terraform
Teams, die bei Crossplane als primäre IaC-Lösung „all in“ gegangen sind, hatten oft Schwierigkeiten, während Teams, die es pragmatisch eingesetzt haben – für gezielte kundenspezifische Anwendungsfälle – starke Ergebnisse sahen

89. DeepEval

DeepEval ist ein Open-Source-Python-basiertes Evaluierungs-Framework zur Bewertung der LLM-Performance
Kann für die Evaluierung von mit LlamaIndex oder LangChain gebauten retrieval-augmented generation (RAG)- und anderen Anwendungen sowie für Model-Baselines und Benchmarks verwendet werden
DeepEval bewertet Korrektheit, Relevanz und Konsistenz, um über reine Word-Matching-Scores hinaus in realen Szenarien verlässlichere Bewertungen zu liefern
Enthält Metriken wie Halluzinationserkennung, Antwortrelevanz und Hyperparameter-Optimierung und unterstützt GEval zur Erstellung benutzerdefinierter, anwendungsfallspezifischer Metriken

90. FastMCP

Model Context Protocol (MCP) etabliert sich rasch als Standard, um LLM-Anwendungen mit Kontext und Tools zu versorgen
Die Implementierung von MCP-Servern umfasst jedoch in der Regel erheblichen Boilerplate-Code für Konfiguration, Protokollverarbeitung und Fehlerbehandlung
FastMCP ist ein Python-Framework, das diesen Prozess vereinfacht, indem es die Protokollkomplexität abstrahiert und Entwicklern ermöglicht, MCP-Ressourcen und -Tools über intuitive Python-Dekoratoren zu definieren
Durch diese Abstraktion können sich Teams auf die Geschäftslogik konzentrieren, was zu saubereren und wartbareren MCP-Implementierungen führt

91. LiteLLM

LiteLLM ist ein SDK, das eine nahtlose Integration mit mehreren LLM-Anbietern über ein standardisiertes OpenAI-API-Format bietet
Es unterstützt eine breite Palette von Anbietern und Modellen und stellt eine einheitliche Schnittstelle für Textvervollständigung, Embeddings und Bilderzeugung bereit
Durch die Abstraktion anbieterspezifischer API-Unterschiede vereinfacht LiteLLM die Integration und leitet Anfragen automatisch an den richtigen Modell-Endpunkt weiter
Über sein Proxy-Framework umfasst es zudem produktionsreife Funktionen wie Guardrails, Caching, Logging, Rate Limiting und Load Balancing

92. MLForecast

MLForecast ist ein Python-Framework und eine Bibliothek für Zeitreihenprognosen, die Machine-Learning-Modelle auf große Datensätze anwendet
Es vereinfacht den normalerweise komplexen automatisierten Feature-Engineering-Prozess, einschließlich Lags, Rolling-Statistiken und datumsbasierter Features
Es ist eine der wenigen Bibliotheken mit nativer Unterstützung für verteilte Computing-Frameworks wie Spark und Dask und gewährleistet damit Skalierbarkeit
Es unterstützt auch probabilistische Prognosen mit Methoden wie conformal prediction und liefert damit ein quantitatives Maß für Prognoseunsicherheit

93. Nuxt

Nuxt ist ein meinungsstarkes Meta-Framework, das auf Vue.js aufbaut, um Full-Stack-Webanwendungen zu erstellen, und wird oft als „Next.js für Vue.js“ bezeichnet
Ähnlich wie sein React-Pendant bietet Nuxt SEO-freundliche Funktionen wie Pre-Rendering, Server-Side Rendering (SSR) und Metadatenverwaltung
Nuxt wird von Vercel unterstützt, demselben Unternehmen hinter Next.js, und profitiert von einer starken Community sowie einem Ökosystem aus offiziellen und Drittanbieter-Modulen
Diese Module vereinfachen die Integration von Funktionen wie Bildverarbeitung, Sitemaps und Tailwind CSS

94. Phoenix

Die positiven Erfahrungen mit Phoenix setzen sich fort – einem serverseitigen Web-MVC-Framework, das in Elixir geschrieben ist
Phoenix baut auf den Lehren aus der schnellen Anwendungsentwicklung und der Developer Experience von Ruby on Rails auf und entwickelt diese zugleich im Paradigma der funktionalen Programmierung weiter
In diesem Band wird die Veröffentlichung von Phoenix LiveView 1.0 hervorgehoben
LiveView ist eine HTML-over-the-wire-Lösung ähnlich HTMX oder Hotwire, mit der Entwickler vollständig servergerendertes HTML für reichhaltige Echtzeit-User-Experiences erstellen können

95. Presidio

Presidio ist ein Datenschutz-SDK zum Identifizieren und Anonymisieren sensibler Daten in strukturierten und unstrukturierten Texten
Es verwendet Named Entity Recognition, reguläre Ausdrücke und regelbasierte Logik, um personenbezogene Daten (PII) wie Kreditkartennummern, Namen und Orte zu erkennen
Presidio unterstützt benutzerdefinierte Entity-Recognizer und Anonymisierungspipelines, sodass Organisationen es an ihre eigenen Datenschutz- und Compliance-Anforderungen anpassen können
Teams nutzen Presidio bei der Integration mit LLMs in Unternehmensumgebungen mit strengen Kontrollen zur Datenweitergabe

96. Pydantic AI

Pydantic AI erweist sich weiterhin als stabiles, gut unterstütztes Open-Source-Framework für den Aufbau von GenAI-Agenten in der Produktion
Es basiert auf dem bewährten Fundament von Pydantic und bietet starke Typsicherheit, erstklassige Sichtbarkeit über OpenTelemetry sowie integrierte Evaluierungswerkzeuge
Das Release von Version 1.0 am 4. September 2025 markiert einen wichtigen Meilenstein in seiner Reife
Seitdem hat es sich dank seiner Einfachheit und Wartbarkeit als verlässlich und breit angenommen erwiesen und reiht sich damit neben andere beliebte Agenten-Frameworks wie LangChain und LangGraph ein

97. Tauri

Tauri ist ein Framework zum Erstellen leistungsfähiger Desktop-Anwendungen mit einer einzigen Web-UI-Codebasis
Im Gegensatz zu traditionellen Web-Wrappern wie Electron basiert Tauri auf Rust und nutzt die native Webview des Betriebssystems, um kleinere Binärdateien und stärkere Sicherheit zu bieten
Tauri wurde bereits vor einigen Jahren erstmals evaluiert und hat sich seitdem über den Desktop hinaus um Unterstützung für iOS und Android erweitert
Die neueste Version führt ein flexibleres Berechtigungs- und Scope-Modell ein, ersetzt die bisherige Berechtigungsliste und zeichnet sich durch eine verbesserte Interprozesskommunikationsschicht (IPC) aus, die rohe Datenübertragung unterstützt und die Performance verbessert

Assess

98. Agent Development Kit (ADK)

Agent Development Kit (ADK) ist ein Framework für die Entwicklung und Bereitstellung von AI-Agenten, das moderne Software-Engineering-Disziplinen anwendet, statt sich nur auf Prompting zu verlassen
Es führt vertraute Abstraktionen wie Klassen, Methoden, Workflow-Muster und CLI-Unterstützung ein
Im Vergleich zu Frameworks wie LangGraph oder CrewAI liegt die Stärke von ADK in der tiefen Integration mit Googles AI-Infrastruktur, die Enterprise-taugliches Grounding, Datenzugriff und Monitoring bietet
Es wurde auf Interoperabilität ausgelegt und unterstützt das A2A protocol für Tool-Wrapper und die Kommunikation zwischen Agenten

99. Agno

Agno ist ein Framework zum Erstellen, Ausführen und Verwalten von Multi-Agenten-Systemen
Es bietet die Flexibilität, vollständig autonome Agenten oder kontrollierte schrittbasierte Workflows zu erstellen, und umfasst integrierte Unterstützung für Human-in-the-Loop, Sitzungsverwaltung, Memory und Knowledge
Der Fokus auf Effizienz mit beeindruckenden Agenten-Startzeiten und geringem Speicherverbrauch wird positiv hervorgehoben
Agno wird zusammen mit seiner eigenen Runtime AgentOS bereitgestellt, einer FastAPI-Anwendung mit einer integrierten Control Plane für vereinfachtes Testen, Monitoring und Management von Agentensystemen

100. assistant-ui

assistant-ui ist eine Open-Source-TypeScript- und React-Bibliothek für AI-Chat-Interfaces
Sie übernimmt die komplexen Teile der Implementierung von Chat-UIs, etwa Streaming, State Management und gängige UX-Funktionen für Nachrichtenbearbeitung und Branch Switching, während Entwickler mit Radix-Primitives ihre eigenen Komponenten gestalten können
Sie unterstützt die Integration mit beliebten Runtimes, darunter Vercel AI SDK und LangGraph, und bietet anpassbare Runtime-Lösungen für komplexe Anwendungsfälle
Mit assistant-ui wurden erfolgreich einfache Chat-Interfaces aufgebaut, und die Ergebnisse waren zufriedenstellend

101. AutoRound

AutoRound von Intel ist ein fortschrittlicher Quantisierungsalgorithmus, um große KI-Modelle wie LLMs und Vision Language Models (VLMs) mit minimalem Genauigkeitsverlust zu komprimieren
Verwendet sign-gradient descent-Optimierung, um die Modellgröße auf ultraniedrige Bitbreiten (2–4 Bit) zu reduzieren, und setzt für optimale Effizienz über die Layer hinweg gemischte Bitbreiten ein
Dieser Quantisierungsprozess ist außerdem sehr schnell: Ein Modell mit 7 Milliarden Parametern kann auf einer einzelnen GPU in wenigen Minuten quantisiert werden
AutoRound ist in beliebte Inference-Engines wie vLLM und Transformers integriert und damit eine attraktive Option für die Modellquantisierung

102. Browser Use

Browser Use ist eine Open-Source-Python-Bibliothek, mit der LLM-basierte Agenten Webbrowser bedienen und mit Webanwendungen interagieren können
Sie kann navigieren, Daten eingeben und Text extrahieren sowie mehrere Tabs verwalten, um Aufgaben zwischen Anwendungen zu koordinieren
Die Bibliothek ist besonders nützlich, wenn KI-Agenten auf Informationen in Webinhalten zugreifen, sie bearbeiten oder daraus abrufen müssen
Unterstützt verschiedene LLMs und nutzt Playwright, um visuelles Verständnis mit der Extraktion der HTML-Struktur für reichhaltigere Webinteraktionen zu kombinieren

103. DeepSpeed

DeepSpeed ist eine Python-Bibliothek zur Optimierung von verteiltem Deep Learning für Training und Inference
Für das Training integriert sie Techniken wie Zero Redundancy Optimizer (ZeRO) und 3D-Parallelisierung, um Modelle effizient auf Tausende GPUs zu skalieren
Für Inference kombiniert sie Tensor-, Pipeline-, Experten- und ZeRO-Parallelisierung mit Custom-Kernels und Kommunikationsoptimierungen, um die Latenz zu minimieren
DeepSpeed treibt einige der größten Sprachmodelle der Welt an, darunter Megatron-Turing NLG (530B) und BLOOM (176B)

104. Drizzle

Drizzle ist ein leichtgewichtiges TypeScript-ORM
Anders als Prisma ORM bietet es Entwicklern sowohl eine einfache SQL-ähnliche API als auch eine eher traditionelle ORM-Query-Schnittstelle
Unterstützt auch das Extrahieren von Schemata aus bestehenden Datenbanken und ermöglicht damit sowohl Database-first- als auch Code-first-Ansätze
Drizzle wurde mit Blick auf Serverless-Umgebungen entwickelt, hat eine kleine Bundle-Größe und unterstützt prepared statements

105. Java post-quantum cryptography

Quantencomputer entwickeln sich weiterhin schnell, und SaaS-Angebote wie AWS Braket bieten inzwischen Zugang zu Quantenalgorithmen über mehrere Architekturen hinweg
Seit März führt Java 24 Java post-quantum cryptography ein und ergänzt Unterstützung für Post-Quanten-Kryptografiealgorithmen wie ML-KEM und ML-DSA
Auch .Net 10 baut die Unterstützung aus
Die Empfehlung ist einfach: Wenn Sie Software in diesen Sprachen entwickeln, beginnen Sie jetzt mit der Einführung quantensicherer Algorithmen, um Ihre Systeme zukunftssicher zu machen

106. kagent

Kagent ist ein Open-Source-Framework für die Ausführung von Agentic AI innerhalb von Kubernetes-Clustern
Es ermöglicht LLM-basierten Agenten, operative Aufgaben wie Problemdiagnose, Konfigurationsänderungen und die Interaktion mit Observability-Tools über Kubernetes-native APIs und Integrationen mit dem Model Context Protocol (MCP) zu planen und auszuführen
Ziel ist es, deklaratives Management mit autonomem Reasoning zu verbinden und so „AgentOps“ in Cloud-native-Infrastrukturen zu bringen
Als CNCF-Sandbox-Projekt sollte Kagent mit Vorsicht eingeführt werden, insbesondere angesichts der Risiken, LLMs Funktionen für das Betriebsmanagement zu geben; Techniken wie toxic flow analysis können bei der Bewertung und Minderung dieser Risiken besonders wertvoll sein

107. LangExtract

LangExtract ist eine Python-Bibliothek, die LLMs verwendet, um gemäß benutzerdefinierten Anweisungen strukturierte Informationen aus unstrukturiertem Text zu extrahieren
Sie verarbeitet domänenspezifisches Material wie klinische Notizen und Berichte, identifiziert und strukturiert dabei wichtige Details und hält jeden extrahierten Datenpunkt bis zur Quelle rückverfolgbar
Extrahierte Entitäten können in .jsonl-Dateien exportiert werden, einem Standardformat für Daten von Sprachmodellen, und über eine interaktive HTML-Oberfläche zur Kontextprüfung visualisiert werden
Das Team evaluierte LangExtract für die Extraktion von Entitäten zur Befüllung domänenspezifischer Wissensgraphen und stellte fest, dass es komplexe Dokumente effektiv in strukturierte, maschinenlesbare Repräsentationen umwandelt

108. Langflow

Langflow ist eine Open-Source-Low-Code-Plattform zum Erstellen und Visualisieren von LLM-Workflows
Sie basiert auf LangChain und ermöglicht Entwicklern, Prompts, Tools, Vektordatenbanken und Speicherkomponenten per Drag-and-Drop-Oberfläche zu verketten, unterstützt aber auch Custom-Python-Code für fortgeschrittene Logik
Besonders nützlich für das Prototyping von Agent-Anwendungen, ohne vollständigen Backend-Code schreiben zu müssen
Allerdings ist Langflow noch relativ neu, hat für den produktiven Einsatz noch einige raue Kanten, und die üblichen Vorbehalte gegenüber Low-Code-Plattformen gelten auch hier

109. LMCache

LMCache ist eine Key-Value-(KV)-Cache-Lösung zur Beschleunigung von LLM-Serving-Infrastrukturen
Sie fungiert als spezialisierte Caching-Schicht über einen gesamten Pool von LLM-Inference-Engines hinweg und speichert vorab berechnete KV-Cache-Einträge für Texte wie Chatverläufe oder Dokumentensammlungen, die wahrscheinlich mehrfach verarbeitet werden
Indem diese Werte auf der Festplatte gehalten werden, werden Prefill-Berechnungen von der GPU ausgelagert, wodurch die time-to-first-token (TTFT) sinkt und die Inference-Kosten über anspruchsvolle Workloads wie RAG-Pipelines, Multi-Turn-Chat-Anwendungen und Agent-Systeme hinweg reduziert werden
LMCache kann mit wichtigen Inference-Servern wie vLLM oder NVIDIA Dynamo integriert werden; es lohnt sich, die Auswirkungen auf das eigene Setup zu bewerten

110. Mem0

Mem0 ist eine Memory-Schicht, die für KI-Agenten entwickelt wurde
Ein naiver Ansatz speichert oft den gesamten Chatverlauf in einer Datenbank und verwendet ihn in künftigen Unterhaltungen wieder, was zu übermäßigem Token-Verbrauch führt
Mem0 ersetzt dies durch eine ausgefeiltere Architektur, die Speicher in kurzfristigen Abruf und eine intelligente Langzeitschicht aufteilt, welche nur auffällige Fakten und Beziehungen extrahiert und speichert
Die Architektur kombiniert einen Vektorspeicher für semantische Ähnlichkeit mit einem Wissensgraphen zum Verständnis zeitlicher und relationaler Daten

111. Open Security Control Assessment Language (OSCAL)

Open Security Controls Assessment Language (OSCAL) ist ein offenes, maschinenlesbares Informationsaustauschformat, das entwickelt wurde, um die Automatisierung bei Compliance und Risikomanagement zu erhöhen und Teams dabei zu helfen, sich von textbasierten manuellen Ansätzen zu lösen
Unter der Federführung des US National Institute of Standards and Technology (NIST) bietet OSCAL standard representations in XML, JSON and YAML zur Darstellung von Sicherheitskontrollen im Zusammenhang mit Branchen-Frameworks wie SOC 2 und PCI sowie staatlichen Frameworks wie FedRAMP in den USA, dem Cybersecurity Control Catalogue in Singapur und dem Information Security Manual in Australien
Obwohl OSCAL außerhalb des öffentlichen Sektors noch nicht breit angenommen wurde und das Ökosystem noch reift, begeistert uns sein Potenzial, Sicherheitsbewertungen zu vereinfachen, die Abhängigkeit von Tabellenkalkulationen und Checkbox-Übungen zu verringern und automatisierte Compliance zu ermöglichen, wenn es in Plattformen für compliance-as-code und continuous compliance integriert wird

112. OpenInference

OpenInference ist ein Set aus Konventionen und Plug-ins, das OpenTelemetry ergänzt und zur Beobachtbarkeit von AI-Anwendungen entwickelt wurde
Es bietet standardisierte Instrumentierung für Machine-Learning-Frameworks und -Bibliotheken und hilft Entwicklern dabei, LLM-Aufrufe zusammen mit umgebendem Kontext wie Vector-Store-Abrufen oder externen Tool-Aufrufen an APIs und Suchmaschinen nachzuverfolgen
Spans können an jeden OTEL-kompatiblen Collector exportiert werden, was die Abstimmung mit bestehenden Telemetrie-Pipelines sicherstellt
Zuvor haben wir Langfuse geblippt, eine häufig genutzte Plattform für LLM-Visibilität, und das OpenInference SDK kann Traces in Langfuse und andere OpenTelemetry-kompatible Visibilitätsplattformen schreiben

113. Valibot

Valibot ist eine Schema-Validierungsbibliothek für TypeScript
Wie andere beliebte TypeScript-Validierungsbibliotheken wie Zod und Ajv bietet es Typinferenz, unterscheidet sich aber durch sein modulares Design
Diese Architektur ermöglicht es Bundlern, effektives Tree Shaking und Code-Splitting durchzuführen, sodass nur die tatsächlich verwendeten Validierungsfunktionen enthalten sind
Valibot kann die Bundle-Größe gegenüber Zod im besten Fall um bis zu 95 % reduzieren und ist damit eine attraktive Wahl für Schema-Validierung in Umgebungen, in denen die Bundle-Größe wichtig ist, etwa bei clientseitiger Validierung oder serverlosen Funktionen

114. Vercel AI SDK

Vercel AI SDK ist ein Open-Source-Full-Stack-Toolkit zum Aufbau AI-gestützter Anwendungen und Agenten im TypeScript-Ökosystem
Es besteht aus zwei Hauptkomponenten: AI SDK Core standardisiert modellunabhängige LLM-Aufrufe und unterstützt Textgenerierung, die Generierung strukturierter Objekte und Tool-Calling
AI SDK UI vereinfacht ähnlich wie assistant-ui die Frontend-Entwicklung in React, Vue, Next.js und Svelte mit Streaming, State-Management und Echtzeit-UI-Updates
Für Teams, die bereits im TypeScript- und Next.js-Ökosystem arbeiten, bietet das Vercel AI SDK einen schnellen und nahtlosen Weg, AI-Anwendungen mit umfangreichen clientseitigen Erfahrungen zu entwickeln

Thoughtworks Technology Radar, Band 33 veröffentlicht

Einführung von Infrastruktur-Orchestrierung für AI

Aufstieg MCP-basierter Agenten

AI-Coding-Workflows

Entstehung neuer AI-Antipatterns

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

Trial

Assess

Hold

[Platforms]

Adopt

Trial

Assess

[Tools]

Adopt

Trial

Assess

[Languages and Frameworks]

Adopt

Trial

Assess

Verwandte Beiträge

Noch keine Kommentare.