15 Punkte von GN⁺ 2025-11-07 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Neueste Trends in den Bereichen Techniken/Tools/Plattformen/Programmiersprachen und Frameworks werden visualisiert und in vier Stufen erläutert: Adopt (Einführung empfohlen), Trial (testweise Nutzung), Assess (bewerten), Hold (Vorsicht)
  • Vier Kernthemen: Orchestrierung von AI-Infrastruktur, Aufstieg MCP-basierter Agenten, AI-Coding-Workflows, Entstehung von AI-Antipatterns

Einführung von Infrastruktur-Orchestrierung für AI

  • AI-Workloads zwingen Organisationen zur Orchestrierung großer GPU-Flotten für Training und Inferenz
    • Da die Zahl großer Modelle steigt, die die HBM-Kapazitätsgrenze (80 GB) einer einzelnen GPU überschreiten, werden verteiltes Training und Multi-GPU-Inferenz unverzichtbar
    • Plattform-Teams bauen komplexe mehrstufige Pipelines auf und justieren Durchsatz und Latenz kontinuierlich
    • Mit dem Nvidia DCGM Exporter wird Fleet-Telemetrie erfasst, und durch topologiebewusstes Scheduling werden Jobs dort platziert, wo die Interconnect-Bandbreite am höchsten ist
  • Kubernetes ist die zentrale Grundlage für das Management von AI-Workloads im großen Maßstab, doch auch alternative Plattformen wie microVM (Firecracker) und Uncloud erhalten Aufmerksamkeit
    • Strategien für die Platzierung unter Berücksichtigung schneller Kommunikation zwischen GPU-Links entwickeln sich weiter, etwa Warteschlangen- und Quotenverwaltung mit Kueue, topology-aware scheduling und gang scheduling
    • Platzierung von Multi-GPU-Jobs innerhalb zusammenhängender Rechenzentrums-"Inseln" (Racks oder Pods) mit Hochgeschwindigkeitsverbindungen zwischen GPUs wie NVLink/NVSwitch und RDMA
  • Jüngste API-Verbesserungen für Multi-GPU- und NUMA-Bewusstsein in Kubernetes stärken diese Fähigkeiten und erhöhen die Bandbreite zwischen Geräten, senken Tail Latency und steigern die effektive Auslastung
    • Mit der steigenden Nachfrage nach AI-Coding-Workflows und dem Aufkommen durch MCP verbesserter Agenten wird bei AI-Infrastruktur eine schnelle Innovation erwartet
    • GPU-bewusste Orchestrierung wird zur Grundanforderung, und Topologie entwickelt sich zu einem erstklassigen Scheduling-Kriterium

Aufstieg MCP-basierter Agenten

  • Der gleichzeitige Aufstieg von MCP und Agenten sowie die Ausweitung des darum aufgebauten Protokoll- und Tool-Ökosystems sind ein Hauptthema dieses Radar
    • MCP etabliert sich als ultimatives einheitliches Protokoll für den Betrieb von Agenten und deren effiziente sowie halbautonome Arbeitsweise
  • Nahezu alle großen Anbieter ergänzen MCP-Unterstützung, und agentenzentrierte Workflows wachsen schnell
  • Laufende Innovationen bei Agenten-Workflows sind zu beobachten, und Context Engineering entwickelt sich zum Schlüssel für die Optimierung von Modellverhalten und Ressourceneffizienz
    • Neue Protokolle wie A2A (Agent-to-Agent) und AG-UI senken die Komplexität beim Aufbau kollaborativer Multi-Agenten-Apps
    • Technologien wie AGENTS.md, Anchoring coding agents und Context7 MCP server werden in reale Entwicklungs-Workflows übernommen
  • Aufgrund der Natur des AI-Ökosystems kommt es mit jedem Radar zu einer explosionsartigen Welle neuer Innovationen
    — letztes Mal war es RAG, dieses Mal sind es Agenten-Workflows und die wachsende Konstellation von Tools, Techniken und Plattformen, die sie unterstützen
    • Und auch einige bemerkenswerte AI-Antipatterns treten auf

AI-Coding-Workflows

  • AI verändert die Art und Weise, wie Software entwickelt und gewartet wird, und ist in den jüngsten Diskussionen das dominierende Thema
    • Vom Einsatz von AI zum Verständnis von Legacy-Codebasen bis zu GenAI für Forward Engineering wird AI strategisch entlang der gesamten Software-Wertschöpfungskette verankert
    • Es wird gelernt, wie Wissen wirksamer in Coding-Agenten eingespeist werden kann
  • Teams experimentieren mit neuen Praktiken wie der Definition maßgeschneiderter Anweisungen über AGENTS.md-Dateien und der Integration mit MCP-Servern wie Context7, um aktuelle Dokumentation zu Abhängigkeiten abzurufen
    • Es wächst die Erkenntnis, dass AI nicht nur einzelne Mitwirkende, sondern das gesamte Team verstärken sollte
    • Kuratiert geteilte Anweisungen und benutzerdefinierte Befehle entstehen, um eine faire Verbreitung von Wissen sicherzustellen
  • Das Tool-Umfeld entwickelt sich lebhaft weiter:
    • Designer nutzen UX Pilot und AI Design Reviewer, Entwickler erstellen mit v0 und Bolt durch Self-Service-UI-Prototyping schnell Prototypen
    • Die Debatte über Umfang, Granularität und die mögliche Rolle von spezifikationsbasierter Entwicklung als Single Source of Truth für inkrementelle Lieferung hält an
    • Trotz aller Begeisterung bleibt Sorglosigkeit gegenüber AI-generiertem Code ein verbreitetes Anliegen und erinnert daran, dass AI das Engineering beschleunigen kann, menschliches Urteilsvermögen aber weiterhin unverzichtbar ist

Entstehung neuer AI-Antipatterns

  • Mit der beschleunigten AI-Einführung in der gesamten Industrie treten neben wirksamen Praktiken auch entstehende Antipatterns zutage
    • Während der klare Nutzen von Konzepten wie Self-Service-Einweg-UI-Prototyping mit GenAI anerkannt wird, wird zugleich das Potenzial erkannt, Organisationen in das Antipattern AI-beschleunigtes Shadow IT zu führen
    • Da MCP (Model Context Protocol) Aufmerksamkeit erhält, geraten viele Teams in das Antipattern der naiven API-to-MCP-Konvertierung
  • Die Wirksamkeit von Text-to-SQL-Lösungen bleibt hinter den frühen Erwartungen zurück, und Sorglosigkeit gegenüber AI-generiertem Code bleibt weiterhin ein relevantes Problem
    • Selbst innerhalb aufkommender Praktiken wie spezifikationsbasierter Entwicklung besteht das Risiko einer Rückkehr zu traditionellen Software-Engineering-Antipatterns
      — insbesondere zu übermäßiger Vorab-Spezifikation und einer Tendenz zu Big-Bang-Releases
  • Da sich GenAI mit beispielloser Geschwindigkeit und in beispiellosem Maßstab weiterentwickelt, ist mit einem schnellen Auftreten neuer Antipatterns zu rechnen
    • Teams müssen wachsam gegenüber Mustern bleiben, die anfangs effektiv wirken, mit der Zeit aber die Leistung verschlechtern, Feedback verlangsamen, Anpassungsfähigkeit beeinträchtigen oder Verantwortlichkeit verwischen

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

1. Continuous compliance

  • Eine Praxis, die sicherstellt, dass Softwareentwicklungsprozesse und -technologien regulatorische und Sicherheitsstandards durch Automatisierung fortlaufend erfüllen
  • Durch die Integration von Policy-as-Code-Tools wie Open Policy Agent und die Erstellung von SBOM innerhalb der CD-Pipeline lassen sich Compliance-Probleme frühzeitig im Einklang mit den SLSA-Richtlinien erkennen und beheben
  • Durch die Kodifizierung von Regeln und Best Practices lassen sich Standards teamweit konsistent durchsetzen, ohne Engpässe zu verursachen
  • Da das Risiko von Sorglosigkeit gegenüber AI-generiertem Code steigt, ist es wichtiger denn je, Compliance im Entwicklungsprozess zu verankern

2. Curated shared instructions for software teams

  • Für Teams, die AI aktiv in der Softwarebereitstellung einsetzen, geht der Trend über individuelles Prompting hinaus hin zu kuratierten Anweisungen
  • Die intuitivste Umsetzung besteht darin, Anweisungsdateien wie AGENTS.md direkt in das Projekt-Repository zu committen
  • Die meisten AI-Coding-Tools wie Cursor, Windsurf und Claude Code unterstützen das Teilen von Anweisungen über benutzerdefinierte Slash-Befehle oder Workflows
  • Sobald Prompts verbessert werden, profitiert das gesamte Team sofort davon, was einen konsistenten Zugang zu den besten AI-Anweisungen sicherstellt

3. Pre-commit hooks

  • Git hooks gibt es schon lange, sie werden aber noch immer nicht ausreichend genutzt
  • Mit dem Aufstieg von AI-unterstütztem und agentenbasiertem Coding steigt das Risiko, versehentlich Geheimnisse oder problematischen Code zu committen
  • Es gibt viele Mechanismen zur Codeprüfung wie continuous integration, aber Pre-commit-Hooks sind eine einfache und wirksame Schutzmaßnahme, die mehr Teams übernehmen sollten
  • Am besten hält man sie schlank und fokussiert sie auf Risiken wie Secret Scanning, die sich in dieser Phase des Workflows am wirksamsten abfangen lassen

4. Einsatz von GenAI zum Verständnis von Legacy-Codebasen

  • Der Einsatz von GenAI zum Verständnis von Legacy-Codebasen beschleunigt das Verständnis großer, komplexer Systeme erheblich
  • Tools wie Cursor, Claude Code, Copilot, Windsurf, Aider, Cody, Swimm, Unblocked, PocketFlow-Tutorial-Codebase-Knowledge helfen dabei, Geschäftsregeln sichtbar zu machen, Logik zusammenzufassen und Abhängigkeiten zu identifizieren
  • In Kombination mit Open-Source-Frameworks und direktem LLM-Prompting verkürzt sich die Zeit zum Verständnis von Legacy-Codebasen drastisch
  • Der Einrichtungsaufwand für fortgeschrittene Ansätze wie GraphRAG variiert insbesondere je nach Größe und Komplexität der analysierten Codebasis, die Auswirkungen auf die Produktivität sind jedoch durchweg konsistent und erheblich

Trial

5. AGENTS.md

  • Ein gemeinsames Format, um AI-Coding-Agenten, die an einem Projekt arbeiten, Anweisungen zu geben
  • Im Wesentlichen eine README-Datei für Agenten, ohne verpflichtende Felder oder Formate außerhalb von Markdown
  • Beruht auf der Fähigkeit LLM-basierter Coding-Agenten, von Menschen geschriebene und lesbare Anweisungen zu interpretieren
  • Häufig werden Tipps zur Tool-Nutzung in der Coding-Umgebung, Testanweisungen und bevorzugte Praktiken für das Commit-Management aufgenommen

6. AI für Code-Migrationen

  • Code-Migrationen gibt es in vielen Formen, von Sprach-Neuschreibungen bis zu Upgrades von Abhängigkeiten oder Frameworks, und sie erfordern oft monatelange manuelle Arbeit
  • Teams für Upgrades der .NET framework version experimentieren mit dem Einsatz von AI, um den Prozess zu verkürzen
  • Früher wurden deterministische, regelbasierte Refactoring-Tools wie OpenRewrite verwendet; AI allein ist kostspielig und Gespräche driften leicht ab
  • Statt das gesamte Upgrade zu delegieren, wird der Prozess in kleinere, überprüfbare Schritte zerlegt, etwa die Analyse von Compilerfehlern, das Erzeugen von Migrations-Diffs und die iterative Validierung von Tests
  • Branchenbeispiele wie Googles groß angelegte int32-to-int64 migration spiegeln einen ähnlichen Trend wider

7. Delta Lake liquid clustering

  • Eine Technik für Delta Lake-Tabellen, die als Alternative zu Partitionierung und Z-ordering dient
  • Historisch erforderte die Optimierung der Leseleistung von Delta-Tabellen, beim Erstellen der Tabelle Partitions- und Z-order-Schlüssel anhand erwarteter Abfragemuster zu definieren
  • liquid clustering verwendet einen baumbasierten Algorithmus, um Daten anhand festgelegter Schlüssel zu clustern
  • Änderungen können schrittweise vorgenommen werden, ohne alle Daten neu zu schreiben, was mehr Flexibilität zur Unterstützung verschiedener Abfragemuster bietet
  • Databricks Runtime for Delta Lake unterstützt automatisches liquid clustering durch Analyse vergangener Query-Workloads, Identifizierung optimaler Spalten und entsprechendes Clustering der Daten

8. Self-serve-UI-Prototyping mit GenAI

  • Tools wie Claude Code, Figma Make, Miro AI, v0 ermöglichen es Produktmanagern, direkt aus Text-Prompts interaktive, nutzertestbare Prototypen zu erstellen
  • Statt Wireframes manuell zu bauen, können Teams in wenigen Minuten funktionsfähige HTML-, CSS- und JS-Artefakte erzeugen
  • Diese „wegwerfbaren“ Prototypen tauschen Poliertheit gegen schnelles Lernen ein und sind ideal für frühe Validierung während Design Sprints
  • Eine höhere Detailtreue kann zu einem falschen Fokus auf Details oder zu unrealistischen Erwartungen an den Produktionsaufwand führen, daher sind klares Framing und Erwartungsmanagement essenziell

9. Strukturierte Ausgaben von LLMs

  • Eine Praxis, LLMs darauf zu beschränken, Antworten in einem vordefinierten Format wie JSON oder einer bestimmten Programmierklasse zu erzeugen
  • Wandelt den sonst typischerweise unvorhersehbaren Text von LLMs in maschinenlesbare und deterministische Datenverträge um und ist damit essenziell für den Aufbau zuverlässiger produktionsreifer Anwendungen
  • Die Ansätze reichen von einfachem promptbasiertem Formatting und model-native structured outputs bis zu robusteren Methoden des constrained decoding mit Tools wie Outlines und Instructor
  • Erfolgreich eingesetzt, um komplexe, unstrukturierte Daten aus verschiedenen Dokumenttypen zu extrahieren und in strukturiertes JSON für nachgelagerte Geschäftslogik umzuwandeln

10. TCR (Test && Commit || Revert)

  • Ein aus testgetriebener Entwicklung abgeleiteter Programmier-Workflow, der durch einfache Regeln sehr kleine, kontinuierliche Schritte fördert
  • Nach jeder Änderung werden die Änderungen committet, wenn die Tests erfolgreich sind; schlagen sie fehl, werden die Änderungen zurückgesetzt
  • Die Umsetzung ist einfach, da nur ein Skript definiert werden muss, das diesen Zyklus innerhalb der Codebasis automatisiert
  • TCR wurde erstmals im offiziellen article von Kent Beck vorgestellt und stärkt positive Coding-Praktiken wie YAGNI und KISS

Assess

11. AI-gestütztes UI-Testing

  • Im früheren Radar konzentrierte sich AI-basiertes UI-Testing vor allem auf exploratives Testen, wobei erwähnt wurde, dass die Nichtdeterministik von LLMs zu Instabilität führen kann
  • Mit dem Aufstieg von MCP führen führende UI-Test-Frameworks wie Playwright und Selenium eigene MCP-Server ein (playwright-mcp, mcp-selenium)
  • Durch zuverlässige Browser-Automatisierung mit nativen Techniken können Coding-Assistenten verlässlich UI-Tests für Playwright oder Selenium erzeugen
  • Die Entwicklungen wie Playwright Agents in aktuellen Playwright-Releases werden mit großer Spannung verfolgt, und es werden praxisnähere Leitlinien sowie mehr Erfahrungen aus dem Feldeinsatz erwartet

12. Verankerung von Coding Agents an einer Referenzanwendung

  • In der Vergangenheit wurde das Muster tailored service templates als Blip aufgenommen; es hilft Organisationen, die Microservices einführen, neue Services zu bootstrapen und nahtlos in die bestehende Infrastruktur zu integrieren
  • Im Lauf der Zeit nimmt die Code-Drift zwischen diesen Templates und bestehenden Services tendenziell zu, wenn neue Abhängigkeiten, Frameworks und Architekturpattern aufkommen
  • Im Zeitalter der Coding Agents wird mit anchoring coding agents to a reference application experimentiert, um Best Practices und architektonische Konsistenz zu bewahren
  • Ein Server für das Model Context Protocol (MCP) stellt sowohl Referenz-Template-Code als auch Commit-Diffs bereit, sodass Agents Drift erkennen und Reparaturvorschläge machen können

13. Context engineering

  • Systematisches Design und Optimierung der Informationen, die einem LLM während der Inferenz bereitgestellt werden, um zuverlässig die gewünschte Ausgabe zu erzeugen
  • Umfasst die Strukturierung, Auswahl und Reihenfolge von Kontextelementen wie Prompts, abgerufenen Daten, Speicher, Anweisungen und Umgebungssignalen
  • Anders als Prompt Engineering, das sich nur auf die Formulierung des Prompts konzentriert, betrachtet Context Engineering die gesamte Kontextzusammenstellung
  • Heute nutzen Engineers verschiedene Einzeltechniken, die sich in drei Bereiche gruppieren lassen: Context setup, Context management for long-horizon tasks, Dynamic information retrieval

14. GenAI für Forward Engineering

  • Eine aufkommende Technik zur Modernisierung von Legacy-Systemen mithilfe KI-generierter Beschreibungen des Legacy-Codebestands
  • Führt einen expliziten Schritt ein, der sich darauf konzentriert, was der Legacy-Code tut (die Spezifikation), während bewusst verborgen wird, wie er aktuell implementiert ist
  • Verwandt mit spec-driven development, aber speziell auf die Legacy-Modernisierung angewendet
  • Entlang der Schleife reverse-engineering → design/solutioning → forward-engineering können sowohl Menschen als auch AI Agents auf höherer Ebene schlussfolgern, bevor sie sich auf eine Implementierung festlegen

15. GraphQL als Datenzugriffsmuster für LLMs

  • Ein aufkommender Ansatz zur Schaffung einer einheitlichen, modellfreundlichen Datenzugriffsschicht zur Verbesserung von context engineering
  • Ermöglicht es, strukturierte und abfragbare Daten offenzulegen, ohne dem Modell direkten Datenbankzugriff zu gewähren
  • Anders als bei REST-APIs, die für jeden Anwendungsfall neue Endpunkte oder Filter benötigen, kann GraphQL dem Modell erlauben, nur die benötigten Daten abzurufen
  • Ein klar definiertes GraphQL-Schema liefert Metadaten, die LLMs nutzen können, um über verfügbare Entitäten und Beziehungen zu schlussfolgern

16. Knowledge Flows statt Knowledge Stocks

  • Es wird häufig gefragt: „Wie kann der Informationsaustausch zwischen Teams verbessert werden?“
  • Das aus dem Systemdenken entlehnte Konzept knowledge flows and knowledge stocks bietet eine wertvolle Perspektive
  • Es ermutigt dazu, das Wissen einer Organisation als System zu betrachten – Stocks stehen für angesammeltes Wissen, Flows dafür, wie Wissen sich durch die Organisation bewegt und weiterentwickelt
  • Wenn der Flow externen Wissens in die Organisation zunimmt, fördert das tendenziell Innovation; der Aufbau von communities of practice ist eine bewährte Methode, um Flows zu verbessern

17. LLM as a judge

  • Die Nutzung eines LLM als Richter zur Bewertung der Ausgaben anderer Systeme (typischerweise LLM-basierter Generatoren) erhält Aufmerksamkeit, weil sie das Potenzial für skalierbare und automatisierte Evaluation in der generativen KI bietet
  • Dieser Blip wurde angesichts neu erkannter Komplexität und Risiken von Trial nach Assess verschoben
  • Bewertungen sind anfällig für position bias, verbosity bias und geringe Robustheit; ein noch schwerwiegenderes Problem ist scaling contamination
  • Um diesen Mängeln zu begegnen, werden verbesserte Techniken untersucht, etwa LLMs as a jury (mehrere Modelle zur Konsensbildung) oder chain-of-thought-Reasoning während der Evaluation

18. On-device information retrieval

  • Eine Technik, die Suche, Kontextbewusstsein und retrieval-augmented generation (RAG) vollständig auf dem Gerät des Nutzers ausführt (mobil, Desktop oder Edge-Gerät)
  • Priorisiert Datenschutz und Recheneffizienz, indem leichte lokale Datenbanken mit für On-device-Inferenz optimierten Modellen kombiniert werden
  • Eine vielversprechende Implementierung kombiniert sqlite-vec (eine SQLite-Erweiterung, die Vektorsuche in eingebetteten Datenbanken unterstützt) mit EmbeddingGemma (ein Embedding-Modell mit 300 Millionen Parametern auf Basis der Gemma-3-Architektur)
  • Wird zur Evaluierung für Local-first-Anwendungen sowie andere Anwendungsfälle empfohlen, bei denen Datensouveränität, geringe Latenz und Datenschutz wichtig sind

19. SAIF

  • SAIF (Secure AI Framework) ist ein von Google entwickeltes Framework, das praxisnahe Leitlinien für das Management von AI-Sicherheitsrisiken bietet
  • Behandelt gängige Bedrohungen wie Data Poisoning und Prompt Injection systematisch mit klaren Risikokarten, Komponentenanalysen und praktischen Minderungsstrategien
  • Der Fokus auf die sich wandelnden Risiken beim Aufbau agentischer Systeme ist besonders zeitgemäß und wertvoll
  • Bietet ein kompaktes, umsetzbares Playbook zur Stärkung von Sicherheitspraktiken beim Einsatz von LLMs und AI-basierten Anwendungen

20. Service Mesh ohne Sidecar

  • Da Kosten und operative Komplexität sidecar-basierter Service Meshes fortbestehen, sorgt das Aufkommen sidecar-loser Service-Mesh-Optionen wie Istio ambient mode für Begeisterung
  • Ambient Mode führt eine geschichtete Architektur ein, die Verantwortlichkeiten auf zwei Hauptkomponenten verteilt: einen L4-Proxy pro Node (ztunnel) und einen L7-Proxy pro Namespace (Waypoint proxy)
  • ztunnel stellt sicher, dass L3- und L4-Traffic effizient und sicher übertragen wird, beschafft Zertifikate für alle Identitäten eines Nodes und verarbeitet die Traffic-Umleitung zu ambient-fähigen Workloads
  • Waypoint proxy ist eine optionale Komponente des Ambient Mode, die umfangreichere Istio-Funktionen wie Traffic-Management, Sicherheit und Observability aktiviert

21. Small language models

  • Über mehrere Ausgaben des Technology Radar hinweg wurde die stetige Weiterentwicklung von small language models (SLMs) beobachtet
  • Mit dem wachsenden Interesse am Aufbau von Agentenlösungen gibt es zunehmend Belege dafür, dass SLMs Agentic AI effizient antreiben können
  • Die meisten aktuellen Agenten-Workflows konzentrieren sich auf eng umrissene, wiederholbare Aufgaben, die kein fortgeschrittenes Schlussfolgern erfordern, und eignen sich daher gut für SLMs
  • Die kontinuierliche Weiterentwicklung von SLMs wie Phi-3, SmolLM2 und DeepSeek bietet für diese Aufgaben ausreichende Fähigkeiten

22. Spec-driven development

  • Ein aufkommender Ansatz für AI-gestützte Coding-Workflows, dessen Begriffsdefinition sich noch weiterentwickelt
  • Bezeichnet im Allgemeinen einen Workflow, der mit einer strukturierten Funktionsspezifikation beginnt und diese dann in mehreren Schritten in kleinere Teile, Lösungen und Aufgaben zerlegt
  • Amazons Kiro führt Nutzer durch drei Workflow-Phasen: Anforderungen, Design und Aufgabenerstellung
  • GitHubs spec-kit folgt einem ähnlichen dreistufigen Prozess, ergänzt aber reichhaltigere Orchestrierung, konfigurierbare Prompts und eine „constitution“, die unveränderliche Prinzipien definiert, denen immer gefolgt werden soll

23. Team of coding agents

  • Eine Technik, bei der Entwickler mehrere AI-Coding-Agenten orchestrieren, die jeweils eigene Rollen wie Architect, Back-end Specialist oder Tester haben
  • Tools wie Claude Code, Roo Code und Kilo Code unterstützen Subagenten und mehrere Betriebsmodi
  • Aufbauend auf dem belegten Prinzip, dass die Zuweisung spezifischer Rollen und Personas an LLMs die Ausgabequalität verbessert, werden bessere Ergebnisse erzielt, indem mehrere rollenbasierte Agenten koordiniert werden, statt sich auf einen einzigen universellen Agenten zu verlassen
  • Markiert einen Übergang zu orchestrierten, mehrstufigen AI-gestützten Entwicklungs-Pipelines

24. Topology-aware scheduling

  • GPUs und LPUs sind keine eigenständigen Geräte mehr, sondern eng gekoppelte Beschleunigernetzwerke, deren Leistung von Platzierung und Topologie abhängt
  • In Rack-scale-Systemen wie NVL72 von NVIDIA teilen 72 GPUs mehr als 13 TB VRAM und arbeiten als einzelner Beschleuniger, aber wenn Workloads Switch-Islands überschreiten, werden kollektive Operationen zum Flaschenhals
  • Groqs zur Compile-Zeit festgelegte, softwaregeplante Architektur setzt deterministische Datenbewegung voraus; zufälliges Scheduling zerstört diese Annahmen und die Vorhersagbarkeit
  • Scheduler, die die Topologie ignorieren, verteilen Multi-GPU-Workloads oft willkürlich und verursachen dadurch längere Schrittzeiten und geringere Effizienz

25. Toxic flow analysis for AI

  • Der bekannte Witz, dass das S in MCP für „security“ steht, verdeckt ein sehr reales Problem
  • Wenn Agenten über Tool-Calls oder API-Aufrufe miteinander kommunizieren, können sie schnell auf das treffen, was als lethal trifecta bekannt ist: Zugriff auf persönliche Daten, Kontakt mit nicht vertrauenswürdigen Inhalten und die Fähigkeit zur externen Kommunikation
  • Agenten, die alle drei Eigenschaften besitzen, sind hochgradig verwundbar, und da LLMs dazu neigen, Anweisungen aus Eingaben zu befolgen, können Inhalte aus nicht vertrauenswürdigen Quellen, die Anweisungen zum Exfiltrieren von Daten enthalten, leicht zu Datenlecks führen
  • toxic flow analysis untersucht den Flussgraphen eines Agentensystems, um potenziell unsichere Datenpfade für eine weitere Prüfung zu identifizieren

Hold

26. AI-accelerated shadow IT

  • AI senkt die Hürden dafür, dass Nichtprogrammierer Software selbst erstellen und integrieren, anstatt auf die IT-Abteilung zu warten
  • Man ist begeistert von dem Potenzial, das dadurch freigesetzt wird, beobachtet aber die ersten Anzeichen von AI-accelerated shadow IT mit Vorsicht
  • No-Code-Plattformen für Workflow-Automatisierung unterstützen nun die Integration von AI-APIs wie OpenAI oder Anthropic und schaffen damit die Versuchung, AI als Klebeband zu benutzen, um Integrationen zu verbinden, die zuvor nicht möglich waren
  • Gleichzeitig werden AI-Coding-Assistenten agentischer, sodass Nichtprogrammierer mit grundlegender Schulung interne Utility-Anwendungen erstellen können

27. Capacity-driven development

  • Ein Schlüssel zum Erfolg moderner Softwareentwicklungspraktiken ist die konsequente Fokussierung auf den Arbeitsfluss
  • Stream-aligned Teams konzentrieren sich auf einen einzelnen wertvollen Flow wie eine User Journey oder ein Produkt, um End-to-End-Wert effizient zu liefern
  • Es wird jedoch ein besorgniserregender Trend hin zu capacity-driven development beobachtet, bei dem auf diese Weise ausgerichtete Teams bei freier Kapazität Features für andere Produkte oder Streams übernehmen
  • Kurzfristig mag das effizient wirken, ist aber eine lokale Optimierung, die sich am besten für die Bewältigung von Nachfragespitzen eignet; wenn sie zum Normalfall wird, steigen kognitive Belastung und technische Schulden

28. Complacency with AI-generated code

  • Da AI-Coding-Assistenten und -Agenten viel Aufmerksamkeit erhalten, mehren sich Daten und Studien, die Sorgen über complacency with AI-generated code hervorheben
  • Es gibt zwar genügend Belege dafür, dass diese Tools die Entwicklung beschleunigen können, doch Studien zeigen, dass die Codequalität mit der Zeit sinken kann
  • In der 2024 research von GitClear nahmen duplizierter Code und Code Churn stärker als erwartet zu, während Refactoring-Aktivitäten in der Commit-Historie zurückgingen
  • Die research von Microsoft zu Wissensarbeitern zeigt, dass AI-basiertes Selbstvertrauen oft auf Kosten kritischen Denkens entsteht

29. Naive API-to-MCP conversion

  • Organisationen wollen ihre internen APIs nahtlos und direkt in das Model Context Protocol (MCP) umwandeln, damit AI-Agenten mit bestehenden Systemen interagieren können
  • Es gibt eine wachsende Zahl von Tools wie MCP link und FastAPI-MCP, die diese Umwandlung unterstützen sollen
  • Man spricht sich gegen diese naive API-to-MCP conversion aus, da APIs in der Regel für menschliche Entwickler konzipiert sind und aus fein granularen atomaren Operationen bestehen, die bei der Verkettung durch AI zu übermäßigem Token-Verbrauch, Kontextverschmutzung und schlechterer Agentenleistung führen können
  • Solche APIs legen häufig sensible Daten offen oder erlauben destruktive Operationen, insbesondere im Fall interner APIs

30. Eigenständige Data-Engineering-Teams

  • Eine separate Organisation aus Data-Engineering-Teams, die Datenpipelines und Produkte unabhängig von der Business-Domäne entwickeln und verantworten, für die sie geordnete Streams bereitstellen, ist ein Antipattern, das zu Ineffizienz und schwachen Geschäftsergebnissen führt
  • Diese Struktur wiederholt frühere Fehler, bei denen DevOps-, Test- oder Deployment-Funktionen getrennt wurden, und erzeugt Wissenssilos, Engpässe und verschwendeten Aufwand
  • Ohne enge Zusammenarbeit fehlt Data Engineers oft der Business- und Domänenkontext, der nötig ist, um sinnvolle Datenprodukte zu entwerfen, was sowohl Akzeptanz als auch Nutzen begrenzt
  • Stattdessen sollten sich Data-Platform-Teams auf die Pflege gemeinsamer Infrastruktur konzentrieren, während funktionsübergreifende Business-Teams ihre eigenen data products gemäß den Prinzipien von data mesh aufbauen und verantworten

31. Text to SQL

  • Text to SQL verwendet LLMs, um natürliche Sprache in ausführbares SQL zu übersetzen, aber die Zuverlässigkeit bleibt oft hinter den Erwartungen zurück
  • Dieser Blip wurde auf Hold verschoben, um von einer Nutzung in unbeaufsichtigten Workflows abzuraten – etwa wenn die Ausgabe verborgen ist oder automatisch erzeugte Benutzerabfragen dynamisch umgewandelt werden
  • In solchen Fällen halluzinieren LLMs aufgrund eines begrenzten Verständnisses von Schema oder Domäne häufig, was das Risiko falscher Datenabfragen oder unbeabsichtigter Datenänderungen erhöht
  • Für agentische Business Intelligence sollte direkter Datenbankzugriff vermieden und stattdessen eine verwaltete semantische Abstraktionsschicht für Daten wie Cube oder dbt's semantic layer verwendet werden

[Platforms]

Adopt

32. Arm in der Cloud

  • Arm compute instances in der Cloud sind in den letzten Jahren aufgrund ihrer Kosten- und Energieeffizienz gegenüber traditionellen x86-basierten Instanzen zunehmend beliebt geworden
  • Große Cloud-Anbieter einschließlich AWS, Azure und GCP bieten inzwischen leistungsfähige Arm-Optionen an
  • Viele Teams haben Workloads wie Microservices, Open-Source-Datenbanken und sogar High Performance Computing erfolgreich auf Arm migriert – mit minimalen Codeänderungen und nur wenigen Anpassungen an Build-Skripten
  • Moderne Werkzeuge wie multi-arch Docker images vereinfachen Build und Deployment sowohl für Arm- als auch für x86-Umgebungen

Trial

33. Apache Paimon

  • Apache Paimon ist ein Open-Source-Datenlake-Format, das dafür entwickelt wurde, eine lakehouse architecture zu ermöglichen
  • Es integriert sich nahtlos mit Verarbeitungs-Engines wie Flink und Spark und unterstützt sowohl Streaming- als auch Batch-Workloads
  • Ein wesentlicher Vorteil der Paimon-Architektur ist die Kombination standardisierter Datenlake-Formate mit der Struktur eines LSM (log-structured merge tree)
  • Diese Kombination löst die klassischen Herausforderungen von Datenlakes: performante Updates und Reads mit geringer Latenz

34. DataDog LLM Observability

  • Datadog LLM Observability bietet End-to-End-Tracking, Monitoring und Diagnose für Workflows mit großen Sprachmodellen und Agent-Anwendungen
  • Es ordnet jeden Prompt, Tool-Aufruf und Zwischenschritt Spans und Traces zu, verfolgt Latenz, Token-Verbrauch, Fehler und Qualitätsmetriken und integriert sich in Datadogs umfassende APM- und Observability-Produktfamilie
  • Organisationen, die Datadog bereits nutzen und mit der Kostenstruktur vertraut sind, werden feststellen, dass dessen LLM-Observability-Funktionen ein naheliegender Weg sind, Transparenz für AI-Workloads zu gewinnen – sofern sie diese Workloads instrumentieren können
  • Die Konfiguration und Nutzung von LLM-Instrumentierung erfordert Sorgfalt und ein solides Verständnis von Workload und Implementierung; bei der Einführung wird eine enge Zusammenarbeit zwischen Data Engineers und Betriebsteams empfohlen

35. Delta Sharing

  • Delta Sharing ist ein von Databricks und der Linux Foundation entwickelter offener Standard und ein Protokoll für sicheres plattformübergreifendes Data Sharing
  • Es ist cloudunabhängig und ermöglicht Organisationen, Live-Daten über Cloud-Anbieter und On-Premises-Standorte hinweg zu teilen, ohne Daten zu kopieren oder zu replizieren
  • Über eine einfache REST API werden kurzlebige vorab signierte URLs ausgegeben, damit Empfänger große Datensätze mit Tools wie pandas, Spark oder Power BI abrufen können
  • Es unterstützt das Teilen von Datentabellen, Views, AI-Modellen und Notebooks und bietet starke zentrale Governance- und Audit-Funktionen

36. Dovetail

  • Die Dovetail platform adressiert die anhaltende Herausforderung, verteilte qualitative Forschungsdaten zu verwalten
  • Sie bietet ein zentrales Repository für Nutzerinterviews, Transkripte und Erkenntnisse und wandelt Rohdaten in strukturierte, analysierbare Assets um
  • Besonders nützlich ist sie in Product-Discovery-Workflows, da sie eine Evidenz-Nachverfolgung schafft, die Kundenzitate und synthetisierte Themen direkt mit Produkthypothesen und erwartetem ROI verbindet
  • Dadurch stärkt Dovetail die Rolle qualitativer Daten bei Produktentscheidungen

37. Langdock

  • Langdock ist eine Plattform, mit der Organisationen generative AI-Agenten und Workflows für den internen Betrieb entwickeln und ausführen können
  • Sie bietet eine integrierte Umgebung mit internem Chat-Assistenten, einer API-Schicht zur Anbindung mehrerer LLMs und Tools zum Aufbau von Agent-Workflows, die sich mit Systemen wie Slack, Confluence und Google Drive integrieren
  • Die Plattform bietet On-Premises- und EU-Hosting-Optionen mit Enterprise-Compliance-Standards und betont damit Datensouveränität
  • Organisationen, die Langdock einsetzen, müssen dennoch sehr sorgfältig auf Data Governance achten und Techniken wie toxic flow analysis nutzen, um die lethal trifecta zu vermeiden

38. LangSmith

  • LangSmith ist die gehostete Plattform des LangChain-Teams und bietet Observability, Tracking und Evaluation für LLM-Anwendungen
  • Sie erfasst detaillierte Traces von Chains, Tools und Prompts, sodass Teams Modellverhalten debuggen und messen, Performance-Regressionen verfolgen und Evaluations-Datensätze verwalten können
  • LangSmith ist eine proprietäre SaaS-Plattform mit eingeschränkter Unterstützung für non-LangChain-Workflows und daher besonders attraktiv für Teams, die bereits in dieses Ökosystem investiert haben
  • Die integrierte Unterstützung für Prompt-Evaluation und Experimente wirkt besonders ausgereift, insbesondere im Vergleich zu Open-Source-Alternativen wie Langfuse

39. Model Context Protocol (MCP)

  • Model Context Protocol (MCP) ist ein offener Standard, der definiert, wie LLM-Anwendungen und Agenten externe Datenquellen und Tools integrieren
  • MCP unterscheidet sich vom Protokoll Agent2Agent (A2A), das die Kommunikation zwischen Agenten verwaltet, indem es sich auf Kontext und Tool-Zugriff konzentriert
  • Seit dem letzten Blip ist die Einführung von MCP stark angestiegen, sodass große Unternehmen wie JetBrains (IntelliJ) und Apple gemeinsam mit aufkommenden Frameworks wie FastMCP zum Ökosystem gestoßen sind
  • Der Preview-Standard MCP Registry unterstützt nun die Erkennung öffentlicher und proprietärer Tools

40. n8n

  • n8n ist eine Workflow-Automatisierungsplattform mit fair-code-Lizenz ähnlich wie Zapier oder Make (früher Integromat), wurde jedoch für Entwickler entwickelt, die Self-Hosting, Erweiterbarkeit und per Code steuerbare Optionen wünschen
  • Bietet einen Low-Code-, visuellen Ansatz zur Erstellung von Workflows im Vergleich zu Apache Airflow und unterstützt dennoch benutzerdefinierten Code in JavaScript oder Python
  • Ein zentraler Anwendungsfall ist die Integration mehrerer Services in automatisierte Workflows, aber es kann auch LLMs mit konfigurierbaren Datenquellen, Speicher und Tools verbinden
  • Viele Teams nutzen n8n, um Agenten-Workflows, die durch Chat-Anwendungen oder Webhooks ausgelöst werden, schnell zu prototypisieren, und verwenden dabei häufig die Import- und Exportfunktionen zur KI-gestützten Workflow-Erstellung

41. OpenThread

  • OpenThread ist eine Open-Source-Implementierung des von Google entwickelten Thread-Netzwerkprotokolls
  • Unterstützt alle wichtigen Funktionen der Thread-Spezifikation, einschließlich Netzwerk-Layern wie IPv6, 6LoWPAN und LR-WPAN, sowie Mesh-Netzwerkfunktionen, bei denen Geräte als Knoten und Border Router fungieren können
  • OpenThread läuft auf einer breiten Palette von Hardwareplattformen und nutzt eine flexible Abstraktionsschicht sowie Integrations-Hooks, mit denen Anbieter ihre eigenen Funk- und Kryptografie-Funktionen integrieren können
  • Dieses ausgereifte Protokoll wird in kommerziellen Produkten breit eingesetzt und hat sich unserer Erfahrung nach als zuverlässig für den Aufbau verschiedenster IoT-Lösungen erwiesen, von batteriebetriebenen Low-Power-Geräten bis hin zu großen Mesh-Sensornetzwerken

Assess

42. AG-UI Protocol

  • AG-UI ist ein offenes Protokoll und eine Bibliothek, die darauf ausgelegt sind, umfangreiche Benutzeroberflächen und die Kommunikation zwischen Agenten zu standardisieren
  • Konzentriert sich auf direkt nutzergerichtete Agenten und lässt sich mithilfe von Middleware- und Client-Integrationen auf jedes Frontend und Backend verallgemeinern
  • Das Protokoll definiert eine konsistente Methode, mit der Backend-Agenten mit Frontend-Anwendungen kommunizieren, und ermöglicht so zustandsbehaftete Zusammenarbeit in Echtzeit zwischen KI und menschlichen Nutzern
  • Unterstützt mehrere Transportprotokolle einschließlich SSE und WebSockets und bietet standardisierte Ereignistypen, die verschiedene Zustände der Agentenausführung darstellen

43. Agent-to-Agent (A2A) Protocol

  • Agent2Agent (A2A) ist ein Protokoll, das Standards für Kommunikation und Interaktion zwischen Agenten in komplexen Multi-Agenten-Workflows definiert
  • Beschreibt mithilfe von Agent Cards Kernelemente der Kommunikation zwischen Agenten, einschließlich Spezifikationen für Capability Discovery und Transport sowie Sicherheitsmechanismen
  • A2A ergänzt Model Context Protocol (MCP), indem es sich auf die Kommunikation zwischen Agenten konzentriert, ohne interne Details wie Zustand, Speicher oder Interna eines Agenten offenzulegen
  • Das Protokoll fördert Best Practices wie einen asynchron-first-Ansatz für lang laufende Aufgaben, Streaming-Antworten für schrittweise Updates sowie sichere Übertragung mit HTTPS, Authentifizierung und Autorisierung

44. Amazon S3 Vectors

  • Amazon S3 Vectors erweitert den S3-Objektspeicher um native Vektor-Funktionen und bietet integrierte Vektorspeicherung sowie Ähnlichkeitssuche
  • Lässt sich nahtlos in das AWS-Ökosystem einschließlich Amazon Bedrock und OpenSearch integrieren und bietet zusätzliche Funktionen wie Metadatenfilterung und Governance über IAM
  • Befindet sich noch im Preview-Stadium und hat Einschränkungen, aber das Wertversprechen ist attraktiv – dieser kosteneffiziente und zugängliche Ansatz für Vektorspeicher eignet sich für verschiedene Anwendungen mit großen Datenvolumen, bei denen geringe Latenz nicht das Hauptanliegen ist

45. Ardoq

  • Ardoq ist eine Enterprise-Architecture-(EA)-Plattform, mit der Organisationen ihre Architektur-Wissensbasis aufbauen, verwalten und skalieren können, um die Zukunft effektiver zu planen
  • Anders als traditionelle statische Dokumentation, die zu Drift und Silobildung neigt, erzeugt Ardoqs datengetriebener Ansatz dynamische Wissensgraphen, indem Informationen aus bestehenden Systemen übernommen und mit der Weiterentwicklung der Landschaft aktuell gehalten werden
  • Eine besonders nützliche Funktion ist Ardoq Scenarios, mit der sich mithilfe eines Git-ähnlichen Branch-and-Merge-Ansatzes visuell mögliche Zielzustände modellieren und definieren lassen
  • Organisationen, die eine Architekturtransformation anstreben, sollten dedizierte EA-Plattformen wie Ardoq hinsichtlich ihres Potenzials zur Vereinfachung und Beschleunigung dieses Prozesses evaluieren

46. CloudNativePG

  • CloudNativePG ist ein Kubernetes Operator, der das Hosting und Management hochverfügbarer PostgreSQL-Cluster auf Kubernetes vereinfacht
  • Der Betrieb zustandsbehafteter Services wie PostgreSQL auf Kubernetes kann komplex sein, da dafür tiefes Wissen sowohl über Kubernetes als auch über PostgreSQL-Replikation erforderlich ist
  • CloudNativePG abstrahiert einen Großteil dieser Komplexität, indem es den gesamten PostgreSQL-Cluster als einzelne konfigurierbare deklarative Ressource behandelt
  • Bietet eine nahtlose Primary/Standby-Architektur mit nativer Streaming-Replikation und liefert Hochverfügbarkeitsfunktionen sofort mit, darunter Self-Healing, automatisches Failover durch Promotion des am weitesten synchronisierten Replikats und automatische Neuerstellung ausgefallener Replikate

47. Coder

  • Coder ist eine Plattform zur schnellen Bereitstellung standardisierter Coding-Umgebungen gemäß der zuvor beschriebenen Praxis development environments in the cloud
  • Im Vergleich zu ähnlichen Tools wie Gitpod (jetzt in Ona umbenannt) und GitHub Codespaces bietet Coder mehr Kontrolle über die Anpassung von Workstations über Terraform
  • Hostet Workstations auf der eigenen Infrastruktur in der Cloud oder im Rechenzentrum statt auf den Servern des Anbieters
  • Dieser Ansatz bietet mehr Flexibilität, einschließlich der Möglichkeit, KI-Coding-Agenten auszuführen und auf interne Organisationssysteme zuzugreifen

48. Graft

  • Graft ist eine transaktionale Storage-Engine, die robuste Konsistenz und effiziente Datensynchronisierung in Edge- und verteilten Umgebungen ermöglicht
  • Nutzt lazy replication, um Daten nur bei Bedarf zu synchronisieren, minimiert durch partial replication den Bandbreitenverbrauch und gewährleistet mit serializable snapshot isolation die Datenintegrität
  • Für ähnliche Anwendungsfälle wurde im Radar Electric erwähnt, doch Graft ist dadurch einzigartig, dass es Objektspeicher in ein transaktionales System verwandelt, das konsistente Updates auf Seitenebene unterstützt, ohne ein Datenformat vorzugeben
  • Eignet sich gut als Grundlage für Local-first-Mobilanwendungen, für die Verwaltung komplexer plattformübergreifender Synchronisierung und als Backbone für zustandslose Replikate in serverlosen oder eingebetteten Systemen

49. groundcover

  • groundcover ist eine Cloud-native Observability-Plattform, die Logs, Traces, Metriken und Kubernetes-Ereignisse in einer einzigen Oberfläche zusammenführt
  • Nutzt eBPF, um granulare Observability-Daten per Zero-Code-Instrumentierung zu erfassen, ohne Agents oder SDKs in den Anwendungscode einzubetten
  • Die eBPF-Sensoren von groundcover laufen auf dedizierten Nodes in jedem überwachten Cluster und arbeiten unabhängig von den beobachteten Anwendungen
  • Zu den wichtigsten Funktionen gehören tiefe Transparenz auf Kernel-Ebene, eine Bring-your-own-cloud-(BYOC)-Architektur für Datenschutz sowie ein von Datenvolumen unabhängiges Preismodell, das die Kosten planbar hält

50. Karmada

  • Karmada ("Kubernetes Armada") ist eine Plattform zur Orchestrierung von Workloads über mehrere Kubernetes-Cluster, Clouds und Rechenzentren hinweg
  • Viele Teams kombinieren derzeit GitOps-Tools wie Flux oder ArgoCD mit benutzerdefinierten Skripten für clusterübergreifende Deployments, daher sind zweckgerichtete Lösungen willkommen
  • Karmada nutzt Kubernetes-native APIs, sodass Anwendungen, die bereits für Cloud-native Umgebungen entwickelt wurden, nicht angepasst werden müssen
  • Bietet erweiterte Scheduling-Funktionen für Multi-Cloud-Management, Hochverfügbarkeit, Disaster Recovery und Traffic-Scheduling

51. OpenFeature

  • Mit dem Wachstum von Unternehmen wird das Management von Feature Flags oft zunehmend komplex, und Teams brauchen eine Abstraktionsschicht, die über einfache Feature Toggles hinausgeht
  • OpenFeature bietet diese Schicht durch eine anbieterunabhängige, Community-getriebene API-Spezifikation, die standardisiert, wie Feature Flags definiert und genutzt werden
  • Die CLI bietet umfassende Unterstützung für verschiedene Schemadefinitionen, von Basiskonfigurationen mit Umgebungsvariablen oder In-Memory-Konfigurationen bis hin zu ausgereiften Plattformen wie ConfigCat oder LaunchDarkly
  • Es bleibt jedoch ein wichtiger Hinweis: Teams sollten die verschiedenen Kategorien von Flags getrennt und diszipliniert verwalten, um Flag-Wildwuchs, Anwendungs­komplexität und übermäßigen Testaufwand zu vermeiden

52. Oxide

  • Der Aufbau und Betrieb privater Infrastruktur ist komplex, was einer der Hauptgründe dafür ist, dass Public Cloud für die meisten Organisationen die Standardwahl ist
  • Für diejenigen, die sie dennoch benötigen, bietet Oxide eine Alternative, bei der Hardware und Software von Grund auf zusammengestellt und integriert werden
  • Bietet vorkonfigurierte Racks mit Compute, Networking und Storage, auf denen vollständig integrierte Systemsoftware läuft
  • Teams können Ressourcen über die IaaS-API von Oxide mit Terraform und anderen Automatisierungstools verwalten – das, was Oxide als elastische On-Premises-Infrastruktur bezeichnet

53. Restate

  • Restate ist eine Plattform für dauerhafte Ausführung, die dafür entwickelt wurde, komplexe Herausforderungen verteilter Systeme beim Aufbau zustandsbehafteter, fehlertoleranter Anwendungen zu lösen
  • Durch Execution Journaling wird jeder Schritt aufgezeichnet, um Fehlertoleranz, zuverlässige Wiederherstellung und Exactly-once-Kommunikation zwischen Services sicherzustellen
  • Ein zentraler Architekturvorteil der Plattform ist die Aufteilung der Anwendungslogik in drei Typen dauerhafter Services: Basic Services für zustandslose Funktionen, Virtual Objects zur Modellierung nebenläufiger zustandsbehafteter Entitäten und Workflows zur Orchestrierung komplexer mehrstufiger Prozesse
  • Wir evaluieren Restate derzeit sorgfältig in einem großen Versicherungssystem und sind bisher mit der Performance sehr zufrieden

54. SkyPilot

  • SkyPilot ist eine Open-Source-Plattform zum Ausführen und Skalieren von AI-Workloads On-Premises oder in der Cloud
  • SkyPilot wurde im Sky Computing Lab der UC Berkeley entwickelt und fungiert als intelligenter Broker, der automatisch die günstigsten verfügbaren GPUs in führenden Clouds und Kubernetes-Clustern findet und bereitstellt, was die Rechenkosten häufig senkt
  • Für Infrastrukturteams vereinfacht es die Ausführung von AI auf Kubernetes durch Funktionen wie eine Benutzerfreundlichkeit ähnlich Slurm, Cloud-native Robustheit, direkten SSH-Zugriff auf Pods, Gang Scheduling und Multi-Cluster-Unterstützung
  • Unterstützt die nahtlose Skalierung von Trainings- oder Inferenz-Workloads

55. StarRocks

  • StarRocks ist eine analytische Datenbank, die die Geschwindigkeit traditioneller OLAP-Systeme mit der Flexibilität moderner Data Lakehouses kombiniert und damit Business Intelligence in Echtzeit neu definiert
  • Erzielt durch eine SIMD-optimierte Execution Engine, spaltenorientierten Speicher und einen ausgefeilten kostenbasierten Optimizer Query-Latenzen von unter einer Sekunde auch in großem Maßstab
  • Diese Hochleistungsarchitektur ermöglicht es Nutzern, komplexe Analysen direkt auf offenen Datenformaten wie Apache Iceberg auszuführen, ohne Vorabberechnungen oder Datenkopien
  • In diesem Bereich gibt es viele Plattformen, aber wir sehen StarRocks als starken Kandidaten für eine kosteneffiziente Lösung, die sowohl extreme Parallelität als auch konsistent aktuelle Datenfrische erfordert

56. Uncloud

  • Uncloud ist ein leichtgewichtiges Tool für Container-Orchestrierung und Clustering, mit dem Entwickler Docker-Compose-Anwendungen in die Produktion bringen können
  • Bietet eine einfache, Cloud-ähnliche Erfahrung ohne den operativen Overhead von Kubernetes
  • Ermöglicht maschinenübergreifende Skalierung und Zero-Downtime-Deployments, indem automatisch ein sicheres Mesh-Netzwerk mit WireGuard für die Kommunikation konfiguriert wird und ein Caddy Reverse Proxy automatisches HTTPS und Load Balancing bereitstellt
  • Der zentrale Architekturvorteil von Uncloud ist das vollständig verteilte Design, das die Notwendigkeit einer zentralen Control Plane eliminiert und sicherstellt, dass der Cluster funktional weiterarbeitet, selbst wenn einzelne Maschinen offline gehen

[Tools]

Adopt

57. ClickHouse

  • ClickHouse ist eine Open-Source, verteilte spaltenorientierte Online Analytical Processing (OLAP)-Datenbank für Echtzeitanalysen
  • Hat sich zu einer hochperformanten und skalierbaren Engine entwickelt, die große Datenanalysen bewältigen kann
  • Mit inkrementellen materialisierten Sichten, einer effizienten Query Engine und starker Datenkompression ist sie ideal für interaktive Abfragen
  • Durch integrierte Unterstützung für approximative Aggregatfunktionen sind Abwägungen zwischen Genauigkeit und Performance möglich, was besonders für Analysen mit hoher Kardinalität nützlich ist

58. NeMo Guardrails

  • NeMo Guardrails ist ein Open-Source-Toolkit von NVIDIA, das programmierbare Sicherheits- und Kontrollmechanismen für dialogorientierte Anwendungen auf LLM-Basis einfach hinzufügt
  • Definiert und erzwingt Verhaltensregeln, damit Ausgaben sicher, thematisch passend und regelkonform bleiben
  • Entwickler verwenden die zweckgebundene Sprache Colang, um flexible Dialogabläufe zu erstellen, Gespräche zu steuern und vordefinierte Pfade sowie Betriebsverfahren durchzusetzen
  • NeMo Guardrails bietet eine Async-first-API für Performance und unterstützt Schutzmechanismen für Content-Sicherheit, Security sowie die Steuerung von Eingaben und Ausgaben

59. pnpm

  • Seit dem letzten Radar erhält das Team weiterhin positives Feedback zu pnpm
  • pnpm ist ein Paketmanager für Node.js, der im Vergleich zu Alternativen sowohl bei der Geschwindigkeit als auch bei der Effizienz der Speichernutzung deutlich bessere Leistung bietet
  • Unterstützt inkrementelle Optimierungen auf Dateiebene, die die Leistung weiter verbessern, indem doppelte Pakete aus den node_modules-Ordnern mehrerer Projekte per Hardlink auf einen einzigen Speicherort auf der Festplatte verweisen
  • pnpm ist zur Standardwahl für das Paketmanagement in Node.js geworden, da es mit minimalen Kompatibilitätsproblemen einen deutlich schnelleren Feedback-Loop bietet

60. Pydantic

  • Pydantic ist eine Python-Bibliothek, die Datenmodelle mit standardmäßigen Type Hints definiert und Datenschemata zur Laufzeit erzwingt
  • Typannotationen wurden ursprünglich für statische Analyse zu Python hinzugefügt, doch ihre zunehmende Vielfalt führte zu breiteren Einsatzmöglichkeiten einschließlich Laufzeitvalidierung
  • Auf einem schnellen Rust-Core aufgebaut und bietet effiziente Datenvalidierung, Parsing und Serialisierung
  • Ist in LLM-Anwendungen unverzichtbar geworden und wird typischerweise zusammen mit der Technik structured output from LLMs verwendet, um die Unvorhersehbarkeit von LLMs zu handhaben

Trial

61. AI Design Reviewer

  • AI Design Reviewer ist ein Figma-Plugin, um Design-Audits oder heuristische Evaluierungen durchzuführen und umsetzbares Feedback zu bestehenden oder neuen Designs zu sammeln
  • Die Audits decken UX-Kritik, UI-Inkonsistenzen, Barrierefreiheitslücken, Content-Qualität und Edge-Case-Szenarien ab
  • Neben der Identifikation von Problemen liefert es domänenbewusste Empfehlungen, die Teams helfen, ein gemeinsames Designvokabular und die Begründung hinter Designentscheidungen aufzubauen
  • Das Team nutzte AI Design Reviewer zur Analyse von Legacy-Designs – um positive Erfahrungen zu identifizieren, die beibehalten werden sollten, und negative Erfahrungen, die behoben werden müssen, und so UX-Ziele für ein Redesign zu informieren

62. Barman

  • Barman (Backup and Recovery Manager) ist ein Open-Source-Tool zur Verwaltung von Backups und Disaster Recovery für PostgreSQL-Server
  • Vereinfacht die Erstellung physischer Backups über verschiedene Methoden, organisiert sie in einem umfassenden Katalog und unterstützt den gesamten Disaster-Recovery-Prozess durch das Wiederherstellen von Backups auf Live-Server mit Point-in-Time-Recovery-Funktionen
  • Es wurde festgestellt, dass Barman robust und einfach zu bedienen ist; besonders beeindruckend war die Geschwindigkeit von Point-in-Time-Recovery-Vorgängen während Migrationsaktivitäten
  • Ist auch bei geplanten Backups leistungsfähig und kann komplexe, gemischte Konfigurationen für Planung und Aufbewahrung bewältigen

63. Claude Code

  • Claude Code von Anthropic ist ein agentisches AI-Coding-Tool, das eine natürlichsprachliche Schnittstelle und ein agentisches Ausführungsmodell zur Planung und Umsetzung komplexer mehrstufiger Workflows bietet
  • Wurde vor weniger als einem Jahr veröffentlicht, ist aber bereits unter Entwicklern innerhalb und außerhalb von Thoughtworks weit verbreitet und wurde deshalb in Trial eingeordnet
  • Konsolenbasierte Coding-Agenten wie OpenAIs Codex CLI, Googles Gemini CLI und das Open-Source-Projekt OpenCode sind erschienen, und IDE-basierte Assistenten wie Cursor, Windsurf und GitHub Copilot enthalten inzwischen einen Agent Mode
  • Es wurde beobachtet, dass Teams das Tool nicht nur zum Schreiben und Ändern von Code verwenden, sondern als universellen AI-Agenten für die Verwaltung von Spezifikationen, Stories, Konfiguration, Infrastruktur und Dokumentation

64. Cleanlab

  • Im Paradigma der datenorientierten AI bringt die Verbesserung der Datensatzqualität oft größere Leistungssteigerungen als das Tuning des Modells selbst
  • Cleanlab ist eine Open-Source-Python-Bibliothek, die zur Lösung dieses Problems entwickelt wurde und häufige Datenprobleme wie falsche Labels, Ausreißer und Duplikate in Text-, Bild-, tabellarischen und Audio-Datensätzen automatisch identifiziert
  • Cleanlab basiert auf den Prinzipien des confident learning und nutzt Modellvorhersagewahrscheinlichkeiten, um Label-Rauschen zu schätzen und die Datenqualität zu quantifizieren
  • Dieser modellunabhängige Ansatz ermöglicht es Entwicklern, Fehler in Datensätzen zu diagnostizieren und zu beheben und das Modell anschließend für verbesserte Robustheit und Genauigkeit neu zu trainieren

65. Context7

  • Context7 ist ein MCP-Server zur Behebung von Ungenauigkeiten in AI-generiertem Code
  • Während LLMs auf veraltete Trainingsdaten angewiesen sind, stellt Context7 sicher, dass präziser, aktueller und versionsspezifischer Code für die im Projekt verwendeten Bibliotheken und Frameworks erzeugt wird
  • Holt aktuelle Dokumentation und funktionsfähige Codebeispiele direkt aus den Source-Repositories der Frameworks und injiziert sie im Moment des Promptings in das Kontextfenster des LLM
  • Nach den Erfahrungen damit reduziert Context7 Code-Halluzinationen und die Abhängigkeit von veralteten Trainingsdaten deutlich

66. Data Contract CLI

  • Data Contract CLI ist ein Open-Source-Command-Line-Tool, das für die Arbeit mit der Data Contract-Spezifikation entwickelt wurde
  • Ermöglicht das Erstellen und Bearbeiten von Datenverträgen und vor allem die Validierung von Daten gegen diese Verträge, was wesentlich ist, um Integrität und Qualität von Datenprodukten sicherzustellen
  • Das CLI bietet umfassende Unterstützung für mehrere Schemadefinitionen (Avro, SQL DDL, Open Data Contract Standard usw.) und kann verschiedene Vertragsversionen vergleichen, um Breaking Changes sofort zu erkennen
  • Es erwies sich als besonders nützlich, um die Governance von Verträgen zwischen Datenprodukten per CI/CD-Integration zu operationalisieren, insbesondere im Data-Mesh-Umfeld

67. Databricks Assistant

  • Databricks Assistant ist ein AI-gestütztes dialogorientiertes Tool, das direkt in die Databricks-Plattform integriert ist und als kontextbezogener Pair Programmer für Datenexperten dient
  • Anders als universelle Coding-Assistenten profitiert es von einem grundlegenden Verständnis der Databricks-Umgebung und des Datenkontexts, einschließlich der Metadaten im Unity Catalog
  • Der Assistant geht über die Erzeugung von Code-Snippets hinaus und kann komplexe mehrstufige SQL- und Python-Abfragen erstellen, Fehler diagnostizieren und detaillierte, Workspace-spezifische Erklärungen liefern
  • Für Organisationen, die bereits in das Databricks-Ökosystem investiert haben, kann es die Produktivität beschleunigen und die Einstiegshürde für komplexe Datenarbeit senken

68. Hoppscotch

  • Hoppscotch ist ein leichtgewichtiges Open-Source-Tool für API-Entwicklung, Debugging, Tests und Zusammenarbeit
  • Unterstützt mehrere Protokolle einschließlich HTTP, GraphQL und WebSocket und bietet plattformübergreifende Clients für Web-, Desktop- und CLI-Umgebungen
  • Der Markt für API-Tools ist zwar mit Alternativen wie Postman, Insomnia und Bruno dicht besetzt, doch Hoppscotch hebt sich durch seinen geringen Footprint und sein datenschutzfreundliches Design ab
  • Verzichten auf Analytics, nutzt Local-First-Speicher und unterstützt Self-Hosting, wodurch es eine starke Wahl für Organisationen ist, die eine intuitive Möglichkeit suchen, API-Skripte zu teilen und dabei einen hohen Datenschutz zu wahren

69. NVIDIA DCGM Exporter

  • NVIDIA DCGM Exporter ist ein Open-Source-Tool, das Teams hilft, verteiltes GPU-Training im großen Maßstab zu überwachen
  • Wandelt die proprietäre Telemetrie von NVIDIA Data Center GPU Manager (DCGM) in ein offenes Format um, das mit Standard-Monitoring-Systemen kompatibel ist
  • Stellt wichtige Echtzeitmetriken sowohl von GPUs als auch von Host-Servern bereit, etwa GPU-Auslastung, Temperatur, Stromverbrauch und die Anzahl von ECC-Fehlern
  • Diese Transparenz ist essenziell für Organisationen, die benutzerdefinierte LLMs feinabstimmen oder langlaufende, GPU-intensive Trainingsjobs ausführen

70. RelationalAI

  • Wenn große Mengen unterschiedlichster Daten in Snowflake importiert werden, können die einzigartigen Beziehungen und impliziten Regeln in diesen Daten unklar werden
  • RelationalAI, aufgebaut als Snowflake Native App, ermöglicht es Teams, anspruchsvolle Modelle zu entwickeln, die sinnvolle Konzepte erfassen, zentrale Business-Entitäten definieren und komplexe Logik direkt in Snowflake-Tabellen einbetten
  • Mit einem leistungsstarken Graph Reasoner können Nutzer auf Basis dieser Modelle relationale Wissensgraphen erzeugen, analysieren und visualisieren
  • Für Organisationen, die große, sich schnell verändernde Datensätze verwalten, kann der Aufbau von Wissensgraphen entscheidend für proaktives Monitoring und die Generierung reichhaltigerer, umsetzbarer Erkenntnisse sein

71. UX Pilot

  • UX Pilot ist ein AI-Tool, das mehrere Schritte des UX-Design-Prozesses unterstützt, vom Wireframing bis hin zu hochauflösendem visuellen Design und Reviews
  • Es akzeptiert Text- oder Bildeingaben und kann automatisch Screens, Flows und Layouts erzeugen
  • Die Autoflow-Funktion erstellt Übergänge in User Flows, und Deep Design erzeugt reichhaltigere und detailliertere Ausgaben
  • UX Pilot enthält außerdem ein Figma-Plugin, das die erzeugten Designs zur weiteren Verfeinerung innerhalb gängiger Design-Tools exportiert

72. v0

  • v0 hat sich seit seiner letzten Erwähnung im Radar weiterentwickelt
  • Es enthält nun einen Design-Modus, mit dem Produktmanager Self-Service-UI-Prototypen einfacher erstellen und anpassen können
  • Das neueste Release führt ein eigenes Modell mit großem Kontextfenster und multimodalen Fähigkeiten ein, sodass v0 UIs sowohl aus Text- als auch aus visuellen Eingaben erzeugen und verbessern kann
  • Eine weitere bemerkenswerte Ergänzung ist der Agent-Modus, in dem das System komplexere Aufgaben zerlegen und für jede davon das passende Modell auswählen kann

Assess

73. Augment Code

  • Augment Code ist ein AI-Coding-Assistent, der tiefes kontextsensitives Arbeiten in großen Codebases unterstützt
  • Er sticht durch fortschrittliches context engineering hervor, das schnelle Updates des Code-Index und zügige Suche ermöglicht, selbst wenn sich der Code häufig ändert
  • Augment unterstützt Modelle wie Claude Sonnet 4 und 4.5 sowie GPT-5, integriert sich mit GitHub, Jira und Confluence und unterstützt das Model Context Protocol (MCP) für die Interoperabilität mit externen Tools
  • Es bietet Schritt-für-Schritt-Anleitungen für komplexe Änderungen an Codebases, von Refactoring und Dependency-Upgrades bis zu Schema-Updates

74. Azure AI Document Intelligence

  • Azure AI Document Intelligence (früher Form Recognizer) extrahiert Text, Tabellen und Schlüssel-Wert-Paare aus unstrukturierten Dokumenten und wandelt sie in strukturierte Daten um
  • Dabei werden vortrainierte Deep-Learning-Modelle genutzt, um Layout und Bedeutung zu interpretieren; für spezielle Formate können über eine No-Code-Oberfläche auch Custom-Modelle trainiert werden
  • Eines der Teams berichtete, dass ADI die manuelle Dateneingabe deutlich reduziert, die Datengenauigkeit verbessert und das Reporting beschleunigt hat, was zu schnelleren datenbasierten Entscheidungen führte
  • Wie Amazon Textract und Google Document AI bietet es Enterprise-taugliche Dokumentenverarbeitung mit starkem Layout-Verständnis

75. Docling

  • Docling ist eine Open-Source-Bibliothek für Python und TypeScript für fortgeschrittene Dokumentenverarbeitung unstrukturierter Daten
  • Sie löst das oft übersehene „Last-Mile“-Problem, reale Dokumente wie PDF und PowerPoint in saubere, maschinenlesbare Formate umzuwandeln
  • Im Unterschied zu traditionellen Extractors nutzt Docling einen Computer-Vision-basierten Ansatz, um Dokument-Layout und semantische Struktur zu interpretieren, wodurch die Ausgabe besonders wertvoll für retrieval-augmented generation (RAG)-Pipelines wird
  • Es unterstützt Techniken wie structured output from LLMs, indem komplexe Dokumente in strukturierte Formate wie JSON oder Markdown umgewandelt werden

76. E2B

  • E2B ist ein Open-Source-Tool zur Ausführung von AI-generiertem Code in sicheren, isolierten Sandboxes in der Cloud
  • Agenten können diese auf Firecracker microVMs basierenden Sandboxes nutzen, um Code sicher auszuführen, Daten zu analysieren, Research zu betreiben oder virtuelle Maschinen zu betreiben
  • Dadurch lassen sich Enterprise-taugliche AI-Agenten mit vollständiger Kontrolle über die Laufzeitumgebung und hoher Sicherheit entwickeln und deployen

77. Helix editor

  • Es gab eine gewisse Wiederbelebung einfacher Texteditoren, die den Kommandozeilen-Favoriten Vim ersetzen wollen
  • Helix ist neben Neovim und dem jüngeren Kakoune einer der Kandidaten in diesem dicht besetzten Feld
  • Mit einem augenzwinkernden Selbstverständnis als postmoderner Texteditor bietet Helix mehrere Cursor, Tree-sitter-Support und integrierte Unterstützung für das Language Server Protocol (LSP), was ursprünglich unsere Aufmerksamkeit geweckt hat
  • Er wird mit einem noch in Arbeit befindlichen Plugin-System aktiv weiterentwickelt und ist insgesamt ein leichtgewichtiger modaler Editor, der sich für Vim-Nutzer vertraut anfühlt, aber einige moderne Komfortfunktionen ergänzt

78. Kueue

  • Kueue ist ein Kubernetes-nativer Controller für Job Queues, der Quoten und Ressourcenverbrauch verwaltet
  • Es stellt APIs für die Verarbeitung von Kubernetes-Workloads mit unterschiedlichen Prioritäten und Ressourcenanforderungen bereit und fungiert als Job-Level-Manager, der entscheidet, wann Jobs zugelassen oder entfernt werden
  • Kueue wurde für effizientes Ressourcenmanagement, Job-Priorisierung und fortgeschrittenes Scheduling entwickelt und hilft dabei, die Ausführung von Workloads in Kubernetes-Umgebungen zu optimieren, insbesondere bei ML-Workloads mit Tools wie Kubeflow
  • Es ersetzt cluster-autoscaler und kube-scheduler nicht, sondern arbeitet mit ihnen zusammen und konzentriert sich auf die Job-Zulassung auf Basis von Reihenfolge, Quoten, Prioritäten und Topologie-Bewusstsein

79. MCPScan.ai

  • MCPScan.ai ist ein Security-Scanner für Model Context Protocol (MCP)-Server, der in zwei Modi arbeitet: Scan und Proxy
  • Im Scan-Modus analysiert er Konfigurationen und Tool-Beschreibungen, um bekannte Schwachstellen wie Prompt Injection, Tool Poisoning und toxic flows zu erkennen
  • Im Proxy-Modus fungiert MCPScan.ai als Brücke zwischen Agent-Systemen und MCP-Servern und überwacht den Runtime-Traffic kontinuierlich
  • Dieser Modus erzwingt außerdem Custom-Sicherheitsregeln und Guardrails, einschließlich Validierung von Tool-Calls, PII-Erkennung und Beschränkungen des Datenflusses

80. oRPC

  • oRPC (OpenAPI Remote Procedure Call) bietet End-to-End typsichere APIs in TypeScript und erfüllt dabei die OpenAPI-Spezifikation vollständig
  • Kann automatisch eine vollständige OpenAPI-Spezifikation erzeugen und so Integration und Dokumentation vereinfachen
  • Während Alternativen wie tRPC und ElysiaJS häufig die Einführung neuer Frameworks erfordern, um Typsicherheit zu erreichen, integriert sich oRPC nahtlos in bestehende Node.js-Frameworks einschließlich Express, Fastify, Hono und Next.js
  • Diese Flexibilität macht es zu einer hervorragenden Wahl für Teams, die End-to-End-Typsicherheit in bestehende APIs übernehmen wollen, ohne disruptive Refactorings

81. Power user for dbt

  • Power user for dbt ist eine Erweiterung für Visual Studio Code, die sich direkt sowohl in dbt als auch in dbt Cloud-Umgebungen integriert
  • Da dbt eines unserer bevorzugten Tools bleibt, ist alles, was die Nutzbarkeit verbessert, eine willkommene Ergänzung des Ökosystems
  • Zuvor waren Entwickler darauf angewiesen, mehrere Tools außerhalb der IDE zu nutzen, um SQL-Code zu validieren oder die Modell-Lineage zu prüfen
  • Mit dieser Erweiterung sind diese Funktionen nun in VS Code integriert und bieten Code-Autovervollständigung, Query-Ergebnisse in Echtzeit sowie visuelle Modell- und Spalten-Lineage

82. Serena

  • Serena ist ein leistungsfähiges Coding-Toolkit, das Coding-Agenten wie Claude Code IDE-ähnliche Funktionen für semantische Codesuche und -bearbeitung bereitstellt
  • Durch die Arbeit auf Symbolebene und das Verständnis der relationalen Struktur des Codes verbessert Serena die Token-Effizienz deutlich
  • Statt ganze Dateien zu lesen oder sich auf grobe String-Ersetzungen zu verlassen, können Coding-Agenten präzise Serena-Tools wie find_symbol, find_referencing_symbols und insert_after_symbol verwenden, um Code zu finden und zu bearbeiten
  • In kleinen Projekten ist die Wirkung gering, aber mit wachsender Codebasis wird diese Effizienz sehr wertvoll

83. SweetPad

  • Die Erweiterung SweetPad ermöglicht es Entwicklern, VS Code oder Cursor für den gesamten Lebenszyklus der Swift-Applikationsentwicklung auf Apple-Plattformen zu nutzen
  • Integriert essenzielle Tools wie xcodebuild, xcode-build-server und swift-format und macht den ständigen Wechsel zu Xcode überflüssig
  • Entwickler können Swift-Applikationen für iOS, macOS und watchOS direkt aus der IDE bauen, ausführen und debuggen sowie Simulatoren verwalten und auf Geräte deployen, ohne Xcode zu öffnen

84. Tape/Z (Tools for Assembly Program Exploration for Z/OS)

  • Tape/Z (Tools for Assembly Program Exploration for Z/OS) ist ein sich weiterentwickelndes Toolkit zur Analyse von Mainframe-HLASM-(High-Level Assembler)-Code
  • Wurde von Thoughtworkern entwickelt und bietet Funktionen wie Parsing, Aufbau von Control-Flow-Graphen, Abhängigkeitsverfolgung und Flowchart-Visualisierung
  • Wir haben seit Langem auf die Knappheit offener, von der Community getriebener Tools im Mainframe-Bereich hingewiesen; die meisten Optionen sind proprietär oder an Vendor-Ökosysteme gebunden
  • Tape/Z hilft, diese Lücke zu schließen, indem es zugängliche und skriptbare Analysefunktionen bereitstellt

[Languages and Frameworks]

Adopt

85. Fastify

  • Unsere positiven Erfahrungen mit Fastify setzen sich fort – ein schnelles, meinungsarmes Web-Framework mit geringem Overhead für Node.js
  • Bietet alle essenziellen Funktionen eines minimalistischen Web-Frameworks, einschließlich Parsing, Validierung und Serialisierung, sowie ein robustes Plugin-System und starke Community-Unterstützung
  • Das Team hat im Vergleich zu Alternativen wie Express.js keine wesentlichen Nachteile bei der Nutzung von Fastify gesehen und zugleich messbare Performance-Verbesserungen erzielt, was es zu einer attraktiven Wahl für minimalistische Webentwicklung mit Node.js macht

86. LangGraph

  • LangGraph ist ein Orchestrierungs-Framework zum Aufbau zustandsbehafteter Multi-Agenten-Anwendungen mit LLMs
  • Bietet Low-Level-Primitives wie Nodes und Edges sowie eingebaute Funktionen, die Entwicklern eine granulare Kontrolle über Agent-Workflows, Memory-Management und Persistenz des Zustands geben
  • Das bedeutet, dass Entwickler mit einfachen vorgefertigten Graphen beginnen und zu komplexen, sich weiterentwickelnden Agent-Architekturen skalieren können
  • Mit Unterstützung für Resilienz-Patterns wie Streaming, fortgeschrittenes Kontextmanagement, Model-Fallbacks und Tool-Fehlerbehandlung ermöglicht LangGraph den Aufbau robuster Agent-Anwendungen für den Produktiveinsatz

87. vLLM

  • vLLM ist eine Inferenz-Engine für LLMs mit hohem Durchsatz und effizienter Speichernutzung, die in der Cloud oder On-Premises ausgeführt werden kann
  • Unterstützt mehrere Modellarchitekturen und populäre Open-Source-Modelle
  • Teams haben dockerisierte vLLM-Worker auf GPU-Plattformen wie NVIDIA DGX und Intel HPC bereitgestellt und hosten damit Modelle einschließlich Llama 3.1 (8B und 70B), Mistral 7B und Llama-SQL für Unterstützung beim Entwickler-Coding, Wissensabruf und natürlichsprachliche Datenbankinteraktion
  • vLLM ist mit dem OpenAI-SDK-Standard kompatibel und ermöglicht konsistentes Model Serving

Trial

88. Crossplane

  • Seit dem letzten Erscheinen im Radar nimmt die Nutzung von Crossplane weiter zu, insbesondere zur Erweiterung von Kubernetes-Clustern
  • In unserer Arbeit haben wir festgestellt, dass Crossplane in bestimmten Anwendungsfällen glänzt, statt ein allgemeines Infrastructure-as-Code-(IaC)-Tool zu sein
  • Unsere frühere Beobachtung gilt weiterhin: Crossplane funktioniert am besten als Begleiter für innerhalb von Kubernetes bereitgestellte Workloads und ist kein vollständiger Ersatz für Tools wie Terraform
  • Teams, die bei Crossplane als primäre IaC-Lösung „all in“ gegangen sind, hatten oft Schwierigkeiten, während Teams, die es pragmatisch eingesetzt haben – für gezielte kundenspezifische Anwendungsfälle – starke Ergebnisse sahen

89. DeepEval

  • DeepEval ist ein Open-Source-Python-basiertes Evaluierungs-Framework zur Bewertung der LLM-Performance
  • Kann für die Evaluierung von mit LlamaIndex oder LangChain gebauten retrieval-augmented generation (RAG)- und anderen Anwendungen sowie für Model-Baselines und Benchmarks verwendet werden
  • DeepEval bewertet Korrektheit, Relevanz und Konsistenz, um über reine Word-Matching-Scores hinaus in realen Szenarien verlässlichere Bewertungen zu liefern
  • Enthält Metriken wie Halluzinationserkennung, Antwortrelevanz und Hyperparameter-Optimierung und unterstützt GEval zur Erstellung benutzerdefinierter, anwendungsfallspezifischer Metriken

90. FastMCP

  • Model Context Protocol (MCP) etabliert sich rasch als Standard, um LLM-Anwendungen mit Kontext und Tools zu versorgen
  • Die Implementierung von MCP-Servern umfasst jedoch in der Regel erheblichen Boilerplate-Code für Konfiguration, Protokollverarbeitung und Fehlerbehandlung
  • FastMCP ist ein Python-Framework, das diesen Prozess vereinfacht, indem es die Protokollkomplexität abstrahiert und Entwicklern ermöglicht, MCP-Ressourcen und -Tools über intuitive Python-Dekoratoren zu definieren
  • Durch diese Abstraktion können sich Teams auf die Geschäftslogik konzentrieren, was zu saubereren und wartbareren MCP-Implementierungen führt

91. LiteLLM

  • LiteLLM ist ein SDK, das eine nahtlose Integration mit mehreren LLM-Anbietern über ein standardisiertes OpenAI-API-Format bietet
  • Es unterstützt eine breite Palette von Anbietern und Modellen und stellt eine einheitliche Schnittstelle für Textvervollständigung, Embeddings und Bilderzeugung bereit
  • Durch die Abstraktion anbieterspezifischer API-Unterschiede vereinfacht LiteLLM die Integration und leitet Anfragen automatisch an den richtigen Modell-Endpunkt weiter
  • Über sein Proxy-Framework umfasst es zudem produktionsreife Funktionen wie Guardrails, Caching, Logging, Rate Limiting und Load Balancing

92. MLForecast

  • MLForecast ist ein Python-Framework und eine Bibliothek für Zeitreihenprognosen, die Machine-Learning-Modelle auf große Datensätze anwendet
  • Es vereinfacht den normalerweise komplexen automatisierten Feature-Engineering-Prozess, einschließlich Lags, Rolling-Statistiken und datumsbasierter Features
  • Es ist eine der wenigen Bibliotheken mit nativer Unterstützung für verteilte Computing-Frameworks wie Spark und Dask und gewährleistet damit Skalierbarkeit
  • Es unterstützt auch probabilistische Prognosen mit Methoden wie conformal prediction und liefert damit ein quantitatives Maß für Prognoseunsicherheit

93. Nuxt

  • Nuxt ist ein meinungsstarkes Meta-Framework, das auf Vue.js aufbaut, um Full-Stack-Webanwendungen zu erstellen, und wird oft als „Next.js für Vue.js“ bezeichnet
  • Ähnlich wie sein React-Pendant bietet Nuxt SEO-freundliche Funktionen wie Pre-Rendering, Server-Side Rendering (SSR) und Metadatenverwaltung
  • Nuxt wird von Vercel unterstützt, demselben Unternehmen hinter Next.js, und profitiert von einer starken Community sowie einem Ökosystem aus offiziellen und Drittanbieter-Modulen
  • Diese Module vereinfachen die Integration von Funktionen wie Bildverarbeitung, Sitemaps und Tailwind CSS

94. Phoenix

  • Die positiven Erfahrungen mit Phoenix setzen sich fort – einem serverseitigen Web-MVC-Framework, das in Elixir geschrieben ist
  • Phoenix baut auf den Lehren aus der schnellen Anwendungsentwicklung und der Developer Experience von Ruby on Rails auf und entwickelt diese zugleich im Paradigma der funktionalen Programmierung weiter
  • In diesem Band wird die Veröffentlichung von Phoenix LiveView 1.0 hervorgehoben
  • LiveView ist eine HTML-over-the-wire-Lösung ähnlich HTMX oder Hotwire, mit der Entwickler vollständig servergerendertes HTML für reichhaltige Echtzeit-User-Experiences erstellen können

95. Presidio

  • Presidio ist ein Datenschutz-SDK zum Identifizieren und Anonymisieren sensibler Daten in strukturierten und unstrukturierten Texten
  • Es verwendet Named Entity Recognition, reguläre Ausdrücke und regelbasierte Logik, um personenbezogene Daten (PII) wie Kreditkartennummern, Namen und Orte zu erkennen
  • Presidio unterstützt benutzerdefinierte Entity-Recognizer und Anonymisierungspipelines, sodass Organisationen es an ihre eigenen Datenschutz- und Compliance-Anforderungen anpassen können
  • Teams nutzen Presidio bei der Integration mit LLMs in Unternehmensumgebungen mit strengen Kontrollen zur Datenweitergabe

96. Pydantic AI

  • Pydantic AI erweist sich weiterhin als stabiles, gut unterstütztes Open-Source-Framework für den Aufbau von GenAI-Agenten in der Produktion
  • Es basiert auf dem bewährten Fundament von Pydantic und bietet starke Typsicherheit, erstklassige Sichtbarkeit über OpenTelemetry sowie integrierte Evaluierungswerkzeuge
  • Das Release von Version 1.0 am 4. September 2025 markiert einen wichtigen Meilenstein in seiner Reife
  • Seitdem hat es sich dank seiner Einfachheit und Wartbarkeit als verlässlich und breit angenommen erwiesen und reiht sich damit neben andere beliebte Agenten-Frameworks wie LangChain und LangGraph ein

97. Tauri

  • Tauri ist ein Framework zum Erstellen leistungsfähiger Desktop-Anwendungen mit einer einzigen Web-UI-Codebasis
  • Im Gegensatz zu traditionellen Web-Wrappern wie Electron basiert Tauri auf Rust und nutzt die native Webview des Betriebssystems, um kleinere Binärdateien und stärkere Sicherheit zu bieten
  • Tauri wurde bereits vor einigen Jahren erstmals evaluiert und hat sich seitdem über den Desktop hinaus um Unterstützung für iOS und Android erweitert
  • Die neueste Version führt ein flexibleres Berechtigungs- und Scope-Modell ein, ersetzt die bisherige Berechtigungsliste und zeichnet sich durch eine verbesserte Interprozesskommunikationsschicht (IPC) aus, die rohe Datenübertragung unterstützt und die Performance verbessert

Assess

98. Agent Development Kit (ADK)

  • Agent Development Kit (ADK) ist ein Framework für die Entwicklung und Bereitstellung von AI-Agenten, das moderne Software-Engineering-Disziplinen anwendet, statt sich nur auf Prompting zu verlassen
  • Es führt vertraute Abstraktionen wie Klassen, Methoden, Workflow-Muster und CLI-Unterstützung ein
  • Im Vergleich zu Frameworks wie LangGraph oder CrewAI liegt die Stärke von ADK in der tiefen Integration mit Googles AI-Infrastruktur, die Enterprise-taugliches Grounding, Datenzugriff und Monitoring bietet
  • Es wurde auf Interoperabilität ausgelegt und unterstützt das A2A protocol für Tool-Wrapper und die Kommunikation zwischen Agenten

99. Agno

  • Agno ist ein Framework zum Erstellen, Ausführen und Verwalten von Multi-Agenten-Systemen
  • Es bietet die Flexibilität, vollständig autonome Agenten oder kontrollierte schrittbasierte Workflows zu erstellen, und umfasst integrierte Unterstützung für Human-in-the-Loop, Sitzungsverwaltung, Memory und Knowledge
  • Der Fokus auf Effizienz mit beeindruckenden Agenten-Startzeiten und geringem Speicherverbrauch wird positiv hervorgehoben
  • Agno wird zusammen mit seiner eigenen Runtime AgentOS bereitgestellt, einer FastAPI-Anwendung mit einer integrierten Control Plane für vereinfachtes Testen, Monitoring und Management von Agentensystemen

100. assistant-ui

  • assistant-ui ist eine Open-Source-TypeScript- und React-Bibliothek für AI-Chat-Interfaces
  • Sie übernimmt die komplexen Teile der Implementierung von Chat-UIs, etwa Streaming, State Management und gängige UX-Funktionen für Nachrichtenbearbeitung und Branch Switching, während Entwickler mit Radix-Primitives ihre eigenen Komponenten gestalten können
  • Sie unterstützt die Integration mit beliebten Runtimes, darunter Vercel AI SDK und LangGraph, und bietet anpassbare Runtime-Lösungen für komplexe Anwendungsfälle
  • Mit assistant-ui wurden erfolgreich einfache Chat-Interfaces aufgebaut, und die Ergebnisse waren zufriedenstellend

101. AutoRound

  • AutoRound von Intel ist ein fortschrittlicher Quantisierungsalgorithmus, um große KI-Modelle wie LLMs und Vision Language Models (VLMs) mit minimalem Genauigkeitsverlust zu komprimieren
  • Verwendet sign-gradient descent-Optimierung, um die Modellgröße auf ultraniedrige Bitbreiten (2–4 Bit) zu reduzieren, und setzt für optimale Effizienz über die Layer hinweg gemischte Bitbreiten ein
  • Dieser Quantisierungsprozess ist außerdem sehr schnell: Ein Modell mit 7 Milliarden Parametern kann auf einer einzelnen GPU in wenigen Minuten quantisiert werden
  • AutoRound ist in beliebte Inference-Engines wie vLLM und Transformers integriert und damit eine attraktive Option für die Modellquantisierung

102. Browser Use

  • Browser Use ist eine Open-Source-Python-Bibliothek, mit der LLM-basierte Agenten Webbrowser bedienen und mit Webanwendungen interagieren können
  • Sie kann navigieren, Daten eingeben und Text extrahieren sowie mehrere Tabs verwalten, um Aufgaben zwischen Anwendungen zu koordinieren
  • Die Bibliothek ist besonders nützlich, wenn KI-Agenten auf Informationen in Webinhalten zugreifen, sie bearbeiten oder daraus abrufen müssen
  • Unterstützt verschiedene LLMs und nutzt Playwright, um visuelles Verständnis mit der Extraktion der HTML-Struktur für reichhaltigere Webinteraktionen zu kombinieren

103. DeepSpeed

  • DeepSpeed ist eine Python-Bibliothek zur Optimierung von verteiltem Deep Learning für Training und Inference
  • Für das Training integriert sie Techniken wie Zero Redundancy Optimizer (ZeRO) und 3D-Parallelisierung, um Modelle effizient auf Tausende GPUs zu skalieren
  • Für Inference kombiniert sie Tensor-, Pipeline-, Experten- und ZeRO-Parallelisierung mit Custom-Kernels und Kommunikationsoptimierungen, um die Latenz zu minimieren
  • DeepSpeed treibt einige der größten Sprachmodelle der Welt an, darunter Megatron-Turing NLG (530B) und BLOOM (176B)

104. Drizzle

  • Drizzle ist ein leichtgewichtiges TypeScript-ORM
  • Anders als Prisma ORM bietet es Entwicklern sowohl eine einfache SQL-ähnliche API als auch eine eher traditionelle ORM-Query-Schnittstelle
  • Unterstützt auch das Extrahieren von Schemata aus bestehenden Datenbanken und ermöglicht damit sowohl Database-first- als auch Code-first-Ansätze
  • Drizzle wurde mit Blick auf Serverless-Umgebungen entwickelt, hat eine kleine Bundle-Größe und unterstützt prepared statements

105. Java post-quantum cryptography

  • Quantencomputer entwickeln sich weiterhin schnell, und SaaS-Angebote wie AWS Braket bieten inzwischen Zugang zu Quantenalgorithmen über mehrere Architekturen hinweg
  • Seit März führt Java 24 Java post-quantum cryptography ein und ergänzt Unterstützung für Post-Quanten-Kryptografiealgorithmen wie ML-KEM und ML-DSA
  • Auch .Net 10 baut die Unterstützung aus
  • Die Empfehlung ist einfach: Wenn Sie Software in diesen Sprachen entwickeln, beginnen Sie jetzt mit der Einführung quantensicherer Algorithmen, um Ihre Systeme zukunftssicher zu machen

106. kagent

  • Kagent ist ein Open-Source-Framework für die Ausführung von Agentic AI innerhalb von Kubernetes-Clustern
  • Es ermöglicht LLM-basierten Agenten, operative Aufgaben wie Problemdiagnose, Konfigurationsänderungen und die Interaktion mit Observability-Tools über Kubernetes-native APIs und Integrationen mit dem Model Context Protocol (MCP) zu planen und auszuführen
  • Ziel ist es, deklaratives Management mit autonomem Reasoning zu verbinden und so „AgentOps“ in Cloud-native-Infrastrukturen zu bringen
  • Als CNCF-Sandbox-Projekt sollte Kagent mit Vorsicht eingeführt werden, insbesondere angesichts der Risiken, LLMs Funktionen für das Betriebsmanagement zu geben; Techniken wie toxic flow analysis können bei der Bewertung und Minderung dieser Risiken besonders wertvoll sein

107. LangExtract

  • LangExtract ist eine Python-Bibliothek, die LLMs verwendet, um gemäß benutzerdefinierten Anweisungen strukturierte Informationen aus unstrukturiertem Text zu extrahieren
  • Sie verarbeitet domänenspezifisches Material wie klinische Notizen und Berichte, identifiziert und strukturiert dabei wichtige Details und hält jeden extrahierten Datenpunkt bis zur Quelle rückverfolgbar
  • Extrahierte Entitäten können in .jsonl-Dateien exportiert werden, einem Standardformat für Daten von Sprachmodellen, und über eine interaktive HTML-Oberfläche zur Kontextprüfung visualisiert werden
  • Das Team evaluierte LangExtract für die Extraktion von Entitäten zur Befüllung domänenspezifischer Wissensgraphen und stellte fest, dass es komplexe Dokumente effektiv in strukturierte, maschinenlesbare Repräsentationen umwandelt

108. Langflow

  • Langflow ist eine Open-Source-Low-Code-Plattform zum Erstellen und Visualisieren von LLM-Workflows
  • Sie basiert auf LangChain und ermöglicht Entwicklern, Prompts, Tools, Vektordatenbanken und Speicherkomponenten per Drag-and-Drop-Oberfläche zu verketten, unterstützt aber auch Custom-Python-Code für fortgeschrittene Logik
  • Besonders nützlich für das Prototyping von Agent-Anwendungen, ohne vollständigen Backend-Code schreiben zu müssen
  • Allerdings ist Langflow noch relativ neu, hat für den produktiven Einsatz noch einige raue Kanten, und die üblichen Vorbehalte gegenüber Low-Code-Plattformen gelten auch hier

109. LMCache

  • LMCache ist eine Key-Value-(KV)-Cache-Lösung zur Beschleunigung von LLM-Serving-Infrastrukturen
  • Sie fungiert als spezialisierte Caching-Schicht über einen gesamten Pool von LLM-Inference-Engines hinweg und speichert vorab berechnete KV-Cache-Einträge für Texte wie Chatverläufe oder Dokumentensammlungen, die wahrscheinlich mehrfach verarbeitet werden
  • Indem diese Werte auf der Festplatte gehalten werden, werden Prefill-Berechnungen von der GPU ausgelagert, wodurch die time-to-first-token (TTFT) sinkt und die Inference-Kosten über anspruchsvolle Workloads wie RAG-Pipelines, Multi-Turn-Chat-Anwendungen und Agent-Systeme hinweg reduziert werden
  • LMCache kann mit wichtigen Inference-Servern wie vLLM oder NVIDIA Dynamo integriert werden; es lohnt sich, die Auswirkungen auf das eigene Setup zu bewerten

110. Mem0

  • Mem0 ist eine Memory-Schicht, die für KI-Agenten entwickelt wurde
  • Ein naiver Ansatz speichert oft den gesamten Chatverlauf in einer Datenbank und verwendet ihn in künftigen Unterhaltungen wieder, was zu übermäßigem Token-Verbrauch führt
  • Mem0 ersetzt dies durch eine ausgefeiltere Architektur, die Speicher in kurzfristigen Abruf und eine intelligente Langzeitschicht aufteilt, welche nur auffällige Fakten und Beziehungen extrahiert und speichert
  • Die Architektur kombiniert einen Vektorspeicher für semantische Ähnlichkeit mit einem Wissensgraphen zum Verständnis zeitlicher und relationaler Daten

111. Open Security Control Assessment Language (OSCAL)

  • Open Security Controls Assessment Language (OSCAL) ist ein offenes, maschinenlesbares Informationsaustauschformat, das entwickelt wurde, um die Automatisierung bei Compliance und Risikomanagement zu erhöhen und Teams dabei zu helfen, sich von textbasierten manuellen Ansätzen zu lösen
  • Unter der Federführung des US National Institute of Standards and Technology (NIST) bietet OSCAL standard representations in XML, JSON and YAML zur Darstellung von Sicherheitskontrollen im Zusammenhang mit Branchen-Frameworks wie SOC 2 und PCI sowie staatlichen Frameworks wie FedRAMP in den USA, dem Cybersecurity Control Catalogue in Singapur und dem Information Security Manual in Australien
  • Obwohl OSCAL außerhalb des öffentlichen Sektors noch nicht breit angenommen wurde und das Ökosystem noch reift, begeistert uns sein Potenzial, Sicherheitsbewertungen zu vereinfachen, die Abhängigkeit von Tabellenkalkulationen und Checkbox-Übungen zu verringern und automatisierte Compliance zu ermöglichen, wenn es in Plattformen für compliance-as-code und continuous compliance integriert wird

112. OpenInference

  • OpenInference ist ein Set aus Konventionen und Plug-ins, das OpenTelemetry ergänzt und zur Beobachtbarkeit von AI-Anwendungen entwickelt wurde
  • Es bietet standardisierte Instrumentierung für Machine-Learning-Frameworks und -Bibliotheken und hilft Entwicklern dabei, LLM-Aufrufe zusammen mit umgebendem Kontext wie Vector-Store-Abrufen oder externen Tool-Aufrufen an APIs und Suchmaschinen nachzuverfolgen
  • Spans können an jeden OTEL-kompatiblen Collector exportiert werden, was die Abstimmung mit bestehenden Telemetrie-Pipelines sicherstellt
  • Zuvor haben wir Langfuse geblippt, eine häufig genutzte Plattform für LLM-Visibilität, und das OpenInference SDK kann Traces in Langfuse und andere OpenTelemetry-kompatible Visibilitätsplattformen schreiben

113. Valibot

  • Valibot ist eine Schema-Validierungsbibliothek für TypeScript
  • Wie andere beliebte TypeScript-Validierungsbibliotheken wie Zod und Ajv bietet es Typinferenz, unterscheidet sich aber durch sein modulares Design
  • Diese Architektur ermöglicht es Bundlern, effektives Tree Shaking und Code-Splitting durchzuführen, sodass nur die tatsächlich verwendeten Validierungsfunktionen enthalten sind
  • Valibot kann die Bundle-Größe gegenüber Zod im besten Fall um bis zu 95 % reduzieren und ist damit eine attraktive Wahl für Schema-Validierung in Umgebungen, in denen die Bundle-Größe wichtig ist, etwa bei clientseitiger Validierung oder serverlosen Funktionen

114. Vercel AI SDK

  • Vercel AI SDK ist ein Open-Source-Full-Stack-Toolkit zum Aufbau AI-gestützter Anwendungen und Agenten im TypeScript-Ökosystem
  • Es besteht aus zwei Hauptkomponenten: AI SDK Core standardisiert modellunabhängige LLM-Aufrufe und unterstützt Textgenerierung, die Generierung strukturierter Objekte und Tool-Calling
  • AI SDK UI vereinfacht ähnlich wie assistant-ui die Frontend-Entwicklung in React, Vue, Next.js und Svelte mit Streaming, State-Management und Echtzeit-UI-Updates
  • Für Teams, die bereits im TypeScript- und Next.js-Ökosystem arbeiten, bietet das Vercel AI SDK einen schnellen und nahtlosen Weg, AI-Anwendungen mit umfangreichen clientseitigen Erfahrungen zu entwickeln

Noch keine Kommentare.

Noch keine Kommentare.