Thoughtworks Technology Radar, Volume 32 veröffentlicht
(thoughtworks.com)- Die neuesten Trends in den Bereichen Techniken/Tools/Plattformen/Programmiersprachen und Frameworks werden in vier Stufen visualisiert und erklärt: Hold/Assess/Trial/Adopt
- Interessante Technologieeinträge (blips) werden nachverfolgt. Blips bewegen sich im Laufe der Zeit zwischen den vier Stufen
- Adopt (Einführung empfohlen): Wird als etwas bewertet, das branchenweit aktiv eingeführt werden sollte. In geeigneten Situationen wird es tatsächlich in Projekten eingesetzt
- Trial (testweise Einführung): Lohnt sich für den experimentellen Einsatz. Wichtig ist zu verstehen, wie sich die entsprechenden Fähigkeiten aufbauen lassen. Kann in Projekten eingeführt werden, die ein gewisses Risiko tragen können
- Assess (nähere Prüfung erforderlich): Es lohnt sich, die Technologie zu untersuchen. Ziel ist zu verstehen, welche Auswirkungen sie auf die Organisation haben könnte
- Hold (vorerst zurückstellen): Sollte mit Vorsicht angegangen werden
Vier Themen dieser Ausgabe
-
Beaufsichtigte Agenten für Coding Assistants nutzen
- Eine der schnellen Entwicklungen im Bereich Generative AI ist das Wachstum dialogorientierter Coding-Agenten in der IDE
- Sogenannte „agentic“, „prompt-to-code“ und „CHOP (chat-oriented programming)“-Ansätze verbreiten sich
- Die AI erzeugt nicht nur einfache Code-Snippets, sondern übernimmt auch Code-Erkundung, Änderungen, Test-Updates, das Ausführen von Befehlen und gelegentlich sogar das automatische Beheben von Lint-/Compiler-Fehlern
- Gegenüber vollständig autonomer Code-Erzeugung bleibt man weiterhin skeptisch, aber Ansätze unter Aufsicht von Entwicklerinnen und Entwicklern liefern positive Ergebnisse
- Typische IDE-integrierte Tools: Cursor, Cline, Windsurf, GitHub Copilot
- Terminalbasierte Alternativen: aider, goose, Claude Code
- Vor übermäßigem Vertrauen in automatische AI-Code-Erzeugung wird gewarnt
- Bei Code Reviews sind fortlaufende Anleitung und Prüfung weiterhin wichtig
-
Observability im Wandel
- Mit der steigenden Komplexität verteilter Architekturen entwickelt sich der Bereich Observability rasant weiter
- Neues Interessengebiet: LLM Observability
- Die Zahl der Tools zur Überwachung und Bewertung der LLM-Leistung nimmt zu
- Beispiele: Weights & Biases Weave, Arize Phoenix, Helicone, HumanLoop
- AI-gestützte Observability-Tools verbessern die Auswertung von Insights
- Die zunehmende Verbreitung von OpenTelemetry sichert Herstellerneutralität und Flexibilität bei den Tools
- Typische Tools mit OpenTelemetry-Unterstützung: Alloy, Tempo, Loki
- Bei Observability verstärken sich Tools und Praktiken gegenseitig und entwickeln sich kontinuierlich weiter
-
Die Weiterentwicklung des „R“ in RAG
- Unter den verschiedenen Bausteinen des Generative-AI-Ökosystems entwickelt sich insbesondere das R von RAG (Retrieval-Augmented Generation) schnell weiter
- Zentrale Strömungen:
- Corrective RAG: Korrigiert Antworten auf Basis von Feedback oder Heuristiken
- Fusion-RAG: Kombiniert unterschiedliche Quellen und Suchstrategien, um Vollständigkeit und Robustheit der Antworten zu verbessern
- Self-RAG: Überspringt den Retrieval-Schritt und beschafft Daten bei Bedarf direkt
- FastGraphRAG: Verbessert das Verständnis durch Graphen, die für Menschen explorierbar sind
- Die Optimierung des Retrievals für präzise und nützliche Antworten passend zu den Anforderungen der Nutzerinnen und Nutzer wird immer wichtiger, und entsprechende Techniken und Tools entwickeln sich schnell weiter
-
Mit komplexen Daten umgehen
- Nicht mehr die Größe von Daten (Big Data), sondern deren Komplexität und Vielfalt (Rich, Complex Data) sind das zentrale Thema
- Durch die Zunahme unstrukturierter Daten ist systematisches Datenmanagement unerlässlich, um diese sinnvoll für AI oder Kundenanalysen zu nutzen
- Tool-Trends in diesem Bereich:
- Vektordatenbanken, Analysetools wie Metabase
- Der Aufstieg von Data Product Thinking
- Auf Analysetools und Strategien zur Datennutzung wird Product Thinking angewandt
- Es ist ein Versuch, Aufgaben der Datennutzung, die schon vor dem Aufkommen von AI diskutiert wurden, in die praktische Umsetzung zu bringen
- Ohne eine klare Datenstrategie laufen Unternehmen Gefahr, bei Innovationen zurückzufallen und an Wettbewerbsfähigkeit zu verlieren
Techniken (Techniques)
Adopt (Einführung empfohlen)
-
Data Product Thinking
- Daten werden wie ein Produkt behandelt, wobei Lebenszyklus, Qualitätsstandards und verbraucherorientiertes Design betont werden
- Moderne Datenkataloge wie DataHub, Collibra, Atlan und Informatica werden genutzt, um Business- und technische Metadaten gemeinsam zu verwalten
- Data Product Thinking wird genutzt, um AI-fähige Daten bereitzustellen und AI-Projekte zu skalieren
- Der Fokus liegt auf dem Management des gesamten Lebenszyklus bis hin zu Datenlöschprozessen unter Einhaltung gesetzlicher und regulatorischer Anforderungen
-
Fuzz Testing
- Eine alte Technik, aber nach wie vor eine Testmethode, die nicht breit bekannt ist
- Dem System werden verschiedene ungewöhnliche Eingaben gegeben, um sein Verhalten in Ausnahmesituationen zu überprüfen
- Im Zusammenhang mit Sicherheitslücken durch zunehmende AI-Code-Erzeugung wird diese Technik noch wichtiger
- Es gibt ausreichend gute Tool-Unterstützung, und die Einführung ist sinnvoll, um robusten und sicheren Code zu erhalten
-
Software Bill of Materials (SBOM)
- Die Erstellung von SBOMs hat sich inzwischen als grundlegende Sicherheitspraktik etabliert
- Mit Tools wie Syft, Trivy und Snyk lassen sich von Source Code bis zu Container-Images SBOMs erstellen und Schwachstellen scannen
- FOSSA, Chainloop und andere sind in Entwicklungs-Workflows integriert und wenden Sicherheitsrichtlinien automatisch an
- Dank breiter Unterstützung für SPDX und CycloneDX ist auch die Standardisierungsfrage entschärft
- Auch in AI-Systemen steigen die Anforderungen an SBOMs, und sie werden in Leitfäden für sichere Code-Praktiken berücksichtigt
-
Threat Modeling
- Eine zentrale Technik, um in AI-zentrierten Softwareentwicklungsumgebungen Sicherheit zu wahren und gleichzeitig Agilität zu sichern
- Kann auch auf Systeme mit spezifischen Sicherheitsrisiken wie Generative AI angewandt werden
- Sollte regelmäßig über das gesamte Projekt hinweg durchgeführt werden und ist besonders wirksam in Kombination mit automatisierten Security-Scannern und der Definition von Sicherheitsanforderungen
Trial (testweise Einführung)
-
API-Request-Collections als API-Produktartefakte behandeln
- Wenn APIs wie Produkte behandelt werden, sollte nicht nur die Dokumentation, sondern vor allem die Developer Experience priorisiert werden
- Swagger(OpenAPI)-Spezifikationen sind für die Dokumentation von Schnittstellen nützlich, aber das Onboarding bleibt trotzdem schwierig
- Durch die Weiterentwicklung von Client-Tools wie Postman, Bruno und Insomnia ist es sinnvoll geworden, API-Request-Collections als Produktartefakte zu nutzen
- Mit Beispielen inklusive vorkonfigurierter Authentifizierung und realistischen Testdaten ist ein schnelles und effizientes Onboarding von Entwicklerinnen und Entwicklern möglich
- API-Request-Collections sollten im Repository gespeichert und in Deployment-Pipelines integriert werden, damit sie aktuell bleiben
-
Architekturberatungsprozess
- In großen Teams ist die Dezentralisierung von Entscheidungsbefugnissen in der Architektur seit Langem eine Herausforderung
- Traditionelle Architecture Review Boards behindern vielmehr Produktivität und Flow
- Ein dezentraler Entscheidungsansatz, bei dem jede Person Architekturentscheidungen treffen kann, aber Beteiligte oder Expertinnen und Experten um Rat fragt, erweist sich als wirksam
- Mit Tools wie Architecture Decision Records und Beratungsforen lassen sich Qualität und Konsistenz aufrechterhalten
- Dieser Ansatz verbreitet sich auch in stark regulierten Branchen
-
GraphRAG
- Von Microsoft vorgeschlagener zweistufiger Ansatz: Dokumente werden segmentiert, anschließend wird per LLM-Analyse ein Wissensgraph erstellt, und bei der Suche werden entlang dieses Graphen relevante Informationen erweitert, um den Prompt zu verstärken
- Auch für die Analyse komplexer Legacy-Codebasen nützlich, indem auf Basis von abstrakten Syntaxbäumen (AST) oder Abhängigkeitsstrukturen Wissensgraphen erzeugt werden
- Mit dem Auftauchen von Tools wie dem GraphRAG Python package von Neo4j wird der Ansatz zunehmend verbreitet
- Auch Tools wie Graphiti fallen unter eine erweiterte Interpretation des GraphRAG-Musters
-
Just-in-time-Management privilegierter Zugriffe (Just-in-time privileged access management, JIT PAM)
- Eine Sicherheitstechnik zur praktischen Umsetzung des Least-Privilege-Prinzips: Administratorrechte werden nur bei Bedarf gewährt und anschließend sofort wieder entzogen
- Dauerhaft verfügbare Administratorrechte, sogenannte „standing privileges“, können eine Sicherheitslücke darstellen
- Temporäre Berechtigungen werden über automatisierte Genehmigungs-Workflows, temporäre Rollenzuweisungen und TTL-(Time-To-Live-)Einstellungen kontrolliert
- Sehr effektiv zur Erfüllung regulatorischer und Compliance-Anforderungen
-
Model Distillation
- Eine Methode, bei der Wissen aus großen Modellen extrahiert und auf kleinere Modelle übertragen wird, um Genauigkeitsverluste zu minimieren und die Ausführungseffizienz zu erhöhen
- Im Gegensatz zu Verkleinerungsverfahren wie Pruning und Quantization liegt der Fokus darauf, Domänenwissen zu erhalten
- Beispiele für verkleinerte Modelle bei gleichzeitig hoher Leistung nehmen zu, etwa destillierte Versionen von DeepSeek R1 auf Basis von Qwen/Llama
- Plattformen wie OpenAI und Amazon Bedrock bieten Anleitungen zur Distillation; das ist vorteilhaft, um die Betriebskosten von LLMs in Unternehmen zu senken und Inference on-device zu optimieren
-
Prompt Engineering
- Der Prozess des Entwerfens und Anpassens klarer, konkreter Prompts, um die Ausgabequalität generativer KI-Modelle zu optimieren
- Zero-shot-Prompts können bei Reasoning-Modellen bessere Ergebnisse liefern als Few-shot-Prompts
- CoT-(chain-of-thought-)Prompts können die Leistung von Reasoning-Modellen im Gegenteil sogar verschlechtern, was auf den Einfluss des Vortrainings mittels RL zurückzuführen ist
- Bei fortgeschrittenen Modellen könnte der Bedarf an Prompt Engineering abnehmen, dennoch bleibt es wirksam zur Reduzierung von Halluzinationen und zur Qualitätsverbesserung
- Wichtig ist, das Gleichgewicht zwischen Antwortgeschwindigkeit, Token-Kosten und Leistung zu wahren; beim Entwurf agentischer Apps sind strategische Entscheidungen passend zu den Modelleigenschaften erforderlich
-
Kleine Sprachmodelle (Small Language Models, SLMs)
- Kleine destillierte Versionen von DeepSeek R1 (Qwen, Llama) können auf Standardhardware ausgeführt werden, auch wenn dafür ein Teil der Leistung geopfert wird
- Der Bereich SLM entwickelt sich sehr schnell weiter, und es erscheinen verschiedene Modelle wie Meta Llama 3.2 (1B, 3B), Microsoft Phi-4 (14B) und Google PaliGemma 2 (3B~28B)
- Kleine Modelle haben geringere Inference-Kosten und weniger Einschränkungen bei der Laufzeitumgebung, was ihr Potenzial für breite Einsatzszenarien erhöht
- Im Spannungsfeld zwischen Leistung und Effizienz gelten SLMs als wichtiger Technologietrend
-
Verständnis von Legacy-Codebasen mit GenAI
- Wichtige Tools wie GitHub Copilot und Sourcegraph Cody unterstützen das Verständnis und die Modernisierung von Legacy-Codebasen
- Sie vereinfachen die Arbeit an komplexen Systemen auf verschiedene Weise, etwa durch Strukturverständnis, Navigation und kontextbasierte Hilfestellungen
- Frameworks wie S3LLM ermöglichen auch das Verständnis von Code aus wissenschaftlich-technischen Bereichen wie Fortran und Pascal
- Da es weltweit enorme Mengen an Legacy-Software gibt, dürfte sich diese Technologie auch künftig weiter verbreiten
Assess (weitere Prüfung erforderlich)
-
KI-freundliches Code-Design (AI-friendly code design)
- KI-basierte Software-Agenten können zunehmend auch größere Codeänderungen erkennen und anwenden
- Mit wachsendem Vertrauen in KI-generierten Code nimmt in manchen Fällen auch der Anteil menschlicher Reviews ab
- Da KI jedoch bei gut strukturiertem Code bessere Leistungen zeigt, ist KI-freundliches Design für die Wartbarkeit wichtig
- Bewährte Designpraktiken wie sprechende Namen, Modularisierung, Abstraktion und die Vermeidung von Duplikaten (DRY) wirken sich auch positiv auf die KI-Leistung aus
- Künftig dürften zudem Designmuster entstehen, die speziell auf KI zugeschnitten sind
-
KI-gestütztes UI-Testing (AI-powered UI testing)
- Eine neue Form des UI-Testings auf Basis der Fähigkeit von LLMs, GUIs zu interpretieren, ist im Aufschwung
- QA.tech und KaneAI ermöglichen es, snapshot-basiertes UI per natürlicher Sprache zu testen
- Browser Use führt Tests auf Basis der Strukturdaten von Playwright durch und nutzt multimodale Modelle
- Zwar kann dies zu nicht deterministischen Ergebnissen führen, die Flexibilität ist jedoch bei Tests von Legacy-Systemen oder bei häufigen UI-Änderungen von Vorteil
- Es lässt sich komplementär zu explorativen manuellen Tests einsetzen
-
Competence-Envelope-Modell zum Verständnis von Systemausfällen
- Ein Konzept, das die Grenzen definiert, innerhalb derer ein System normal funktionieren kann; wird diese Grenze überschritten, scheitert das System leicht
- Nützlich zur Interpretation komplexer Ausfälle wie der Canva-Störung von 2024
- Die Residuality Theory analysiert die Anpassungsfähigkeit eines Systems anhand seiner früheren Belastungshistorie und seiner aktuellen Reaktion
- Es steht in Verbindung mit Konzepten wie Systemresilienz, Robustheit und Antifragilität; es gibt Erwartungen an seine praktische Anwendbarkeit
-
Strukturierte Ausgaben von LLMs (Structured output from LLMs)
- Eine Technik, bei der Antworten von Sprachmodellen auf ein definiertes Schema wie JSON beschränkt werden
- OpenAI unterstützt strukturierte Ausgaben unter Verwendung von JSON Schema, pydantic, Zod-Objekten usw.
- Sehr nützlich in Bereichen, in denen ein exaktes Format erforderlich ist, etwa bei Function Calling oder API-Integrationen
- Unterstützt vielfältige Einsatzmöglichkeiten wie die Erzeugung von Chart-Markup und kann auch Halluzinationen verringern
Hold (Zurückstellung empfohlen)
-
Durch KI beschleunigte Shadow IT (AI-accelerated shadow IT)
- Durch Fortschritte bei KI können nun auch Nicht-Entwickler Software direkt erstellen, ohne die IT-Abteilung durchlaufen zu müssen
- Mit No-Code-Tools, die APIs von OpenAI, Anthropic und anderen unterstützen, lassen sich auch komplexe Integrationen leicht umsetzen
- Allerdings steigt mit der Verbreitung unkontrollierter Anwendungen die Wahrscheinlichkeit von Problemen bei Sicherheit und Datenmanagement
- Es wirkt wie eine weiterentwickelte Form von Tabellenkalkulationen, aber in deutlich größerem Umfang
- Das Gleichgewicht zwischen schneller Problemlösung und langfristiger Stabilität muss sorgfältig abgewogen werden
-
Selbstzufriedenheit im Umgang mit KI-generiertem Code (Complacency with AI-generated code)
- Es zeigen sich Tendenzen zu Qualitätsverlusten durch KI-Nutzung, etwa mehr Duplikatcode, mehr Code Churn und weniger Refactoring
- Laut Untersuchungen von Microsoft kann KI Nutzern falsches Vertrauen vermitteln und kritisches Denken beeinträchtigen
- Da KI immer mehr Code erzeugt, besteht das Risiko, dass es für Entwickler schwieriger wird, Änderungen zu überprüfen
- Ansätze wie „vibe coding“, bei denen KI Code erzeugt und nur minimal geprüft wird, sind für Produktionscode hochriskant
-
Lokale Coding-Assistenten (Local coding assistants)
- KI-Coding-Assistenten, die lokal ohne externe Übertragung ausgeführt werden, bieten Sicherheitsvorteile
- Ihre Leistung ist jedoch im Vergleich zu Cloud-basierten Modellen begrenzt, und sie haben Schwierigkeiten mit komplexen Prompts oder Integrationsfunktionen
- In die IDE integrierte Funktionen (Xcode, JetBrains) oder Integrationen auf Basis von Qwen Coder und Continue + Ollama sind für einfache Aufgaben nützlich
- Empfohlen wird, die Erwartungen niedrig anzusetzen und sie experimentell einzuführen
-
Vollständiger Ersatz von Pair Programming durch KI (Replacing pair programming with AI)
- Tools wie Copilot präsentieren sich zwar als KI-Pair-Programmierer, können die teambasierten Vorteile menschlicher Pairs jedoch nicht ersetzen
- KI ist nützlich für Lernen, Onboarding und die Konzentration auf strategisches Design, weist aber Defizite bei Teamzusammenarbeit, geteilter Code-Verantwortung und der Vermeidung von Wissensinseln auf
- Angesichts der kollaborativen Wirkung traditionellen Pair Programmings wird ein vollständiger Ersatz nicht empfohlen
-
Reverse ETL
- Reverse ETL, also das Zurückspielen von Daten aus dem Data Warehouse in Transaktionssysteme, nimmt zu
- Für vorübergehende Migrationen oder Integrationszwecke kann das sinnvoll sein, bei übermäßiger Nutzung verschärft es jedoch die Probleme zentralisierter Architekturen
- Einige Anbieter missbrauchen dies, um Business-Logik auf ihrer eigenen Plattform zu konzentrieren
- Da dies die langfristige Architekturqualität und Flexibilität beeinträchtigen kann, ist bei der Einführung äußerste Vorsicht geboten
-
SAFe™ (Scaled Agile Framework)
- Noch immer setzen viele Unternehmen SAFe™ ein.
- Übermäßig standardisierte, schrittweise Prozesse führen jedoch zu Silos zwischen Abteilungen, Verschwendung entlang des Value Streams und einer Hemmung der Kreativität.
- Teamautonomie und eine Kultur des Experimentierens werden eingeschränkt, und der Versuch, komplexe organisatorische Veränderungsprobleme mit einfachen Prozessen zu lösen, stößt an Grenzen.
- Thoughtworks begegnet dem intern mit Schulungen und Beratung, hält jedoch einen Lean-basierten, wertorientierten Ansatz und entsprechende Veränderungsprogramme für wirksamer.
Plattformen (Platforms)
Adopt (Empfohlen für den Einsatz)
-
GitLab CI/CD
- Ein vollständig in GitLab integriertes CI/CD-System, das den gesamten Softwareentwicklungslebenszyklus von der Code-Integration über Tests und Deployment bis hin zum Monitoring unterstützt.
- Eignet sich für komplexe Workflows mit Multi-Stage-Pipelines, Caching, paralleler Ausführung und Autoscaler-Runnern.
- Dank integrierter Sicherheits- und Compliance-Tools (SAST, DAST usw.) auch in stark regulierten Umgebungen verlässlich einsetzbar.
- Unterstützt durch die Integration mit Kubernetes Cloud-native Workflows umfassend.
- Bietet Echtzeit-Logs, Testberichte und Tracing-Funktionen und stärkt damit die Observability.
-
Trino
- Eine Open-Source-Distributed-SQL-Query-Engine, mit der sich interaktive Analyseabfragen auf großen Datenmengen ausführen lassen.
- Läuft optimiert sowohl On-Premises als auch in Cloud-Umgebungen und kann über verschiedene Connectoren direkt relationale Datenbanken sowie proprietäre Speicher abfragen.
- Unterstützt außerdem Datei- und Tabellenformate wie Parquet und Apache Iceberg.
- Mit der Föderationsfunktion für Abfragen lassen sich mehrere Datenquellen wie eine einzige logische Tabelle abfragen.
- Wird auch in verschiedenen kommerziellen Datenplattformen wie AWS Athena und Starburst als Kerntechnologie eingesetzt und ist eine verlässliche Option für unterschiedliche Analyse-Workloads.
Trial (Testeinsatz)
-
ABsmartly
- Eine Plattform für schnelle und zuverlässige A/B-Tests und Experimente.
- Mit der Group Sequential Testing (GST)-Engine sind Tests im Vergleich zu herkömmlichen Verfahren bis zu 80 % schneller möglich.
- Bietet Echtzeit-Reports, tiefe Datensegmentierung und umfassende API-zentrierte Integrationsfunktionen.
- Ermöglicht Experimente in großem Umfang – von Web und Mobile über Microservices bis hin zu ML-Modellen.
- Ist durch verkürzte Iterationszyklen und automatische Ergebnisauswertung effektiv für die Optimierung der User Experience.
-
Dapr
- Eine Runtime für verteilte Anwendungen, die durch jüngste Funktionserweiterungen nun auch Job-Scheduling, virtuelle Akteure und verbesserte Sicherheit unterstützt.
- Sicherheitsorientierte Konfigurationen wie mTLS und distroless Images wurden ausgebaut, zudem kommen kontinuierlich weitere Building Blocks hinzu.
- Wird im Team stabil eingesetzt, und auch die weitere Entwicklung erscheint vielversprechend.
-
Grafana Alloy
- Früher unter dem Namen Grafana Agent bekannt, ist dies ein Open-Source-Tool, das die Rolle eines OpenTelemetry Collectors übernimmt.
- Es wurde als einheitlicher Telemetrie-Collector konzipiert, der Logs, Metriken und Traces gleichermaßen erfassen kann.
- Unterstützt OpenTelemetry-, Prometheus- und Datadog-Formate.
- Seit dem Ende von Promtail entwickelt es sich besonders bei der Log-Erfassung zu einer starken Option.
-
Grafana Loki
- Ein horizontal skalierbares, hochverfügbares Log-Aggregationssystem, das nur Metadaten indexiert und so Speicherkosten und Betriebsaufwand reduziert.
- Speichert Logs auf Block-Storage-Basis wie S3, GCS und Azure Blob Storage.
- Integriert sich mit Grafana und Grafana Alloy und bietet zusätzlich OpenTelemetry-Support sowie Multi-Tenancy-Funktionen.
- Enthält außerdem Schutzmechanismen gegen unkontrollierte Auswirkungen zwischen Tenants (shuffle-sharding).
-
Grafana Tempo
- Ein performantes Backend für Distributed Tracing, das offene Standards wie OpenTelemetry unterstützt.
- Speichert Daten in einem spaltenorientierten Format auf Basis von Apache Parquet, was eine hohe Query-Performance ermöglicht.
- Die Erkundung von Tracing-Daten ist über TraceQL und die CLI möglich.
- Unser Team nutzt Tempo auf GKE im Self-Hosting zusammen mit MinIO und OpenTelemetry.
-
Railway
- Eine Full-Stack-PaaS-Plattform als Alternative zu Heroku und Vercel, die von der GitHub-/Docker-Integration über Deployment bis hin zur betrieblichen Sichtbarkeit alles unterstützt.
- Unterstützt die meisten wichtigen Frameworks und Datenbanken sowie containerbasierte Deployments.
- Ein Kostenvergleich ist zwar nötig, insgesamt bietet die Plattform aber gute Erfahrungen in Bezug auf Deployment und Betriebsstabilität.
-
Unblocked
- Ein KI-Teamassistent, der sich mit Codebases, Dokumentation sowie Projektmanagement- und Kommunikationstools verbinden lässt.
- Bietet Antworten auf Fragen zu geschäftlichen und technischen Konzepten, Architekturdesigns und operativen Prozessen.
- Besonders nützlich für die Navigation in komplexen oder Legacy-Systemen und gut geeignet für Teams, die schnellen Zugriff auf Kontextinformationen priorisieren.
- Für Codegenerierung oder Automatisierung sind spezialisierte KI-Agenten besser geeignet.
-
Weights & Biases
- Wurde um stärkere LLM-zentrierte Funktionen erweitert, darunter Systembewertung, benutzerdefinierte Metriken und die Weave-Plattform, die LLMs als Evaluatoren nutzt.
- Eignet sich gut für Performance-Tracking und Debugging von Agentensystemen sowie für das Sammeln von Feedback und das Tuning von Modellen.
- Ist passend für Performance-Optimierung auf lokaler und globaler Ebene sowie für iterative Entwicklungs-Workflows.
Assess (Zur Evaluierung)
-
Arize Phoenix
- Mit der Zunahme von LLM- und agentenbasierten Anwendungen wächst auch die Bedeutung von LLM-Observability.
- Arize Phoenix bietet Funktionen für LLM-Tracing, Evaluierung und Prompt-Management und integriert sich nahtlos in wichtige LLM-Plattformen und Frameworks.
- Die Analyse von Ausgaben, Latenzzeiten und Token-Verbrauch ist mit nur geringem Einrichtungsaufwand möglich.
- Derzeit wird zwar nur die Open-Source-Version genutzt, die vollständige Arize-Plattform bietet jedoch zusätzliche Funktionen und ist eine nähere Evaluierung wert.
-
Chainloop
- Eine Open-Source-Plattform für die Sicherheit der Software-Lieferkette, die es Sicherheitsteams ermöglicht, Richtlinien zu definieren, die Entwicklungsteams dann in CI/CD-Pipelines einhalten können.
- Über die CLI sammelt und validiert sie Sicherheitsartefakte wie SBOMs und Schwachstellenberichte und prüft automatisch die Einhaltung von Richtlinien.
- Verwendet OPA Rego als Richtliniensprache und kann Standards wie das CycloneDX-Format validieren.
- Bietet durch konsistente Security-Compliance und auditierbare Workflows eine Umgebung für das Metadatenmanagement auf dem Niveau von SLSA Level 3.
-
DeepSeek R1
- Die erste Reihe von Reasoning-Modellen von DeepSeek, die durch MLA, MoE-Gating, FP8-Training und PTX-Optimierung die Hardwareauslastung maximiert.
- DeepSeek-R1-Zero ist ein innovatives Modell, das Reasoning-Fähigkeiten allein durch einfaches Reinforcement Learning erlangt hat.
- Alle Modelle werden mit Open Weights bereitgestellt, und DeepSeek-R1-Distill-Qwen-32B zeigt in verschiedenen Benchmarks eine bessere Leistung als OpenAI o1-mini.
- Der Trainingscode und die Daten sind zwar nicht öffentlich, im Repository sind jedoch verschiedene vortrainierte Modelle enthalten.
-
Deno
- Eine von Ryan Dahl, dem Schöpfer von Node.js, entwickelte Plattform, die Schwächen von Node.js in mehreren Punkten verbessert, darunter Security-Sandboxing, Dependency-Management und native TypeScript-Unterstützung.
- Seit Deno 2 besteht Kompatibilität mit Node.js- und npm-Bibliotheken, wodurch die Hürden für eine Migration geringer sind als zuvor.
- Mit ausgebauter Standardbibliothek und verbessertem Tooling eignet sich Deno gut für serverseitige TypeScript-Entwicklung.
- Bei der Wahl der Plattform sollte Deno jedoch nicht allein aus dem Wunsch heraus gewählt werden, Mehrsprachigkeit zu vermeiden.
-
Graphiti
- Erstellt zeitbewusste Wissensgraphen, um Beziehungen zwischen sich kontinuierlich verändernden Daten nachzuverfolgen.
- Verarbeitet strukturierte und unstrukturierte Daten als zeitbasierte Episoden und unterstützt Abfragen, die Zeit, Text, Semantik und Graph-Algorithmen kombinieren.
- Trägt in GraphRAG-basierten Anwendungen zur Verbesserung der Genauigkeit bei der Informationssuche bei.
- Ermöglicht Langzeitgedächtnis und zustandsbasiertes Reasoning in RAG- und agentenbasierten LLM-Systemen.
-
Helicone
- Eine Open-Source-orientierte LLMOps-Plattform für LLM-Kostenmanagement, ROI-Bewertung und Risikominderung.
- Unterstützt den gesamten LLM-Lebenszyklus, einschließlich Prompt-Experimenten, Monitoring, Debugging und Optimierung.
- Ermöglicht Echtzeit-Tracking und Analysen von Kosten, Auslastung, Performance und Agenten-Stacks über verschiedene LLM-Anbieter hinweg.
- Die Funktionen sind leistungsstark, die Plattform befindet sich jedoch noch in einer frühen Phase, sodass für die Nutzung fortgeschrittener Funktionen ein gewisses Maß an Fachkenntnis erforderlich ist.
- Die bisherigen Nutzungserfahrungen sind positiv.
-
Humanloop
- Eine Plattform mit Fokus darauf, AI-Systeme durch die Einbindung menschlichen Feedbacks zuverlässiger und flexibler zu machen
- Bietet Labeling, Active Learning, Fine-Tuning mit Human-in-the-Loop sowie Evaluierungstools auf Basis geschäftlicher Anforderungen
- Enthält gemeinsam nutzbare Workspaces für die Zusammenarbeit, versionierte Prompts und CI/CD-Integrationen
- Verfügt zudem über Observability-Funktionen wie Tracing, Logging, Alerts und Guardrails
- Eignet sich für den Aufbau verantwortungsvoller AI in stark regulierten Umgebungen
-
Model Context Protocol (MCP)
- Ein von Anthropic vorgeschlagener Open-Standard, der so konzipiert ist, dass AI-Tools den Kontext bestehender Systeme leicht nutzen können
- Standardisiert die Integration von Informationen aus Wikis, Issue-Trackern, Datenbanken und ähnlichen Quellen mit AI
- Besteht aus einer MCP-Server-/Client-Struktur; üblich ist der lokale Betrieb als Python- oder Node-Prozess
- Derzeit vor allem auf technische Nutzer ausgerichtet; für Nicht-Entwickler bestehen Hürden bei Zugänglichkeit, Governance und Update-Management
- Langfristig besteht großes Potenzial für eine Weiterentwicklung zu einem nutzerfreundlichen Ökosystem
-
Open WebUI
- Eine Open-Source-Self-Hosting-AI-Plattform, die sich mit verschiedenen Modellen und APIs verbinden lässt, darunter OpenAI-kompatible APIs, OpenRouter und GroqCloud
- Über Ollama lassen sich lokale oder eigene Modelle ausführen; die Nutzung ist auch in Offline-Umgebungen möglich
- Bietet mit integrierten RAG-Funktionen eine dokumentenbasierte Chat-Oberfläche
- Ermöglicht auf RBAC-Basis die Steuerung des Zugriffs auf Modelle und Funktionen nach Nutzergruppen
- Kann über Python-basierte Functions erweitert werden und enthält auch Funktionen zur LLM-Evaluierung
- Lässt sich flexibel vom persönlichen Einsatz über Teamkollaboration bis hin zur Enterprise-Plattform skalieren
-
pg_mooncake
- Eine PostgreSQL-Erweiterung, die spaltenorientierte Speicherung und vektorisierte Ausführung unterstützt
- Daten können in den Formaten Iceberg und Delta Lake lokal oder in S3-kompatiblem Storage gespeichert werden
- Das Laden von Daten aus verschiedenen Formaten wie Parquet, CSV und Hugging Face-Datensätzen ist möglich
- Eignet sich für Umgebungen, die hochperformante Datenanalyse benötigen, ohne einen separaten spaltenorientierten Speicher einzuführen
-
Reasoning models
- „Reasoning Models“, die bei Mathematik, Coding und ähnlichen Aufgaben Leistungen auf menschlichem Niveau zeigen, gehören zu den derzeit meistbeachteten AI-Fortschritten
- Fähigkeiten wie CoT (Chain of Thought), ToT (Tree of Thoughts) und Self-correction sind weiter ausgebaut
- Es sind verschiedene Modelle erschienen, darunter OpenAI o1/o3, DeepSeek R1 und Gemini 2.0 Flash Thinking
- Wegen langsamerer Antwortzeiten und höherem Token-Verbrauch werden sie auch als „Slow AI“ bezeichnet
- Sie eignen sich eher für komplexe Problemlösung oder erklärbare Ergebnisse in STEM-Bereichen als für einfache Aufgaben
-
Restate
- Eine Plattform zur Ausführung langlebiger Workflows ähnlich wie Temporal, entwickelt von den Gründern von Apache Flink
- Ist in Rust geschrieben und wird als einzelnes Binary ausgeliefert
- Gewährleistet Datenhaltbarkeit auch in Ausfallsituationen durch einen flexiblen Paxos-basierten virtuellen Konsensalgorithmus
- Bietet SDKs für Java, Go, Rust und TypeScript
- Wenn sich verteilte Transaktionen nicht vermeiden lassen, ist diese Plattform eine Überlegung wert
-
Supabase
- Eine Open-Source-Alternative zu Firebase, die die Backend-Entwicklung mit Skalierbarkeit und Sicherheit unterstützt
- Basiert auf PostgreSQL und bietet zahlreiche Funktionen wie Authentifizierung, Realtime-Subscriptions, APIs, Edge Functions und Vector Embeddings
- Bei Prototyping oder MVP-Entwicklung ist eine spätere Migration auf SQL-Lösungen vergleichsweise einfach
-
Synthesized
- Eine Plattform zur Erzeugung realistischer Testdaten für Entwicklungs- und Testumgebungen
- Kann bestehende Daten maskieren oder statistisch aussagekräftige synthetic data erzeugen
- Lässt sich in Build-Pipelines integrieren und unterstützt irreversible Anonymisierung pro Attribut, etwa durch Hashing oder Randomisierung
- Auch die Erzeugung großer Datenmengen für Performance-Tests ist möglich; hervorzuheben ist der Fokus auf praktische Problemlösung
-
Tonic.ai
- Eine Plattform, die ähnlich wie Synthesized realistische de-identifizierte synthetic data erzeugt
- Unterstützt sowohl strukturierte als auch unstrukturierte Daten und gewährleistet Datenschutz durch Verfahren der differential privacy
- Bietet automatische Erkennung und Entfernung sensibler Informationen, Ephemeral DB sowie die Funktion Tonic Textual für RAG-Systeme
- Eignet sich für Teams, die gleichzeitig die Engineering-Geschwindigkeit erhöhen und Anforderungen an den Datenschutz erfüllen wollen
-
turbopuffer
- Eine serverlose Multi-Tenant-Suchmaschine, die vektorbasierte und Full-Text-Suche auf Basis von Object Storage unterstützt
- Kennzeichnend ist ein auf Haltbarkeit, Skalierbarkeit und Kosteneffizienz ausgerichtetes Design; die Query-Nodes sind zustandslos aufgebaut
- Bietet geringe Latenz durch Caching von Cold-Query-Ergebnissen auf NVMe-SSDs und das Vorhalten häufig abgefragter Daten im Arbeitsspeicher
- Eignet sich für RAG-basierte AI und die Suche in großen Dokumentbeständen, ist derzeit aber nur per Einladung nutzbar
-
VectorChord
- Ein als Nachfolger von pgvecto.rs entwickeltes Erweiterungsmodul für PostgreSQL zur Vektor-Ähnlichkeitssuche
- Ist mit dem pgvector-Typ kompatibel und bietet durch IVF-Indexierung und RaBitQ-Quantisierung schnelle Vektorsuche mit geringem Rechenaufwand
- Ist in das PostgreSQL-Ökosystem integriert, sodass Vektorsuche und Transaktionen gleichzeitig ausgeführt werden können
- Befindet sich noch in einer frühen Phase, ist aber als Alternative für hochperformante Vektorsuche einen Blick wert
Hold (zurückstellen empfohlen)
- Tyk Hybrid API Management (Tyk hybrid API management)
- Die Kombination aus gemanagter Control Plane und selbstverwalteter Data Plane bietet Flexibilität für Multi-Cloud- oder Hybrid-Cloud-Umgebungen
- Allerdings traten Probleme mit mangelnder Observability auf, etwa als ein Incident in der AWS-basierten Control Plane von Tyk intern früher erkannt wurde als von Tyk selbst
- Ticketbasierter Support ist für dringende Incident-Situationen ungeeignet; zudem gibt es Rückmeldungen über langsame Reaktionszeiten
- Die offizielle Dokumentation ist noch nicht ausgereift genug, was die Lösung von Problemen in komplexen Umgebungen erschwert
- Auch das Enterprise-Developer-Portal weist Probleme bei der Kompatibilität mit früheren Versionen sowie Einschränkungen bei der Anpassbarkeit auf
- Besonders in Hybrid-Konfigurationen ist eine vorsichtige Einführung ratsam; eine kontinuierliche Beobachtung des Reifegrads ist erforderlich
Tools
Adopt (Einführung empfohlen)
-
Renovate
- Ein Tool zur Automatisierung des Dependency-Versionsmanagements, das von vielen Teams bevorzugt wird
- Auf GitHub ist Dependabot der Standard, Renovate ist jedoch umfassender und besser anpassbar
- Besonders effektiv ist es, wenn man es so konfiguriert, dass es Dependencies in Tooling, Infrastruktur sowie internen und privaten Repositories überwacht
- Um Developer Fatigue zu reduzieren, kann auch das automatische Mergen von Dependency-PRs erwogen werden
-
uv
- Ein in Rust geschriebenes Python-Tool der nächsten Generation für Paket- und Projektmanagement, dessen größter Vorteil die sehr hohe Geschwindigkeit ist
- Vereint bestehende Python-Tools wie Poetry, pyenv und pipx und beschleunigt Build- und Testprozesse erheblich
- Eine ausgereifte Community und langfristige Unterstützung des Ökosystems sind wichtig, dennoch ist es derzeit das von Entwicklern am häufigsten empfohlene Tool
- Besonders geeignet für Datenteams, die sich vom bisherigen Python-Paketsystem lösen möchten
-
Vite
- Ein hochperformantes Frontend-Build-Tool, das schnelles Hot Reloading und eine effiziente Entwicklungsumgebung bietet
- Wird in Vue, SvelteKit, React und anderen Frameworks als Standardwerkzeug eingesetzt; Create React App verlagert sich in Richtung Vite
- Mit der Gründung der spezialisierten Organisation VoidZero sind langfristige Projektkontinuität und Weiterentwicklung besser abgesichert
Trial (testen)
-
Claude Sonnet
- Ein fortschrittliches Sprachmodell, das in vielen Bereichen starke Leistung zeigt, darunter Coding, Schreiben, Analyse und bildbasierte Aufgaben
- Lässt sich in Browser, Terminal, wichtige IDEs und GitHub Copilot integrieren und unterstützt auch die Interpretation von Diagrammen sowie das Extrahieren von Text aus Bildern
- Über die Funktion „Artifacts“ in der Browser-UI kann mit erzeugtem Code und HTML interagiert werden
- Version 3.5 zeigt insbesondere bei Architekturdesign und kollaborativen Projekten deutliche Produktivitätssteigerungen
- Claude 3.7 wurde zwar veröffentlicht, befindet sich hinsichtlich der Praxistauglichkeit aber noch in der Evaluierung
-
Cline
- Eine Open-Source-Erweiterung für VSCode und ein leistungsfähiges Werkzeug zur Umsetzung beaufsichtigter Software-Agenten
- Bietet fortgeschrittene Funktionen wie den Plan-&-Act-Modus, MCP-Integration und transparentes Tracking des Token-Verbrauchs
- Zeigt zusammen mit Claude 3.5 Sonnet starke Leistung bei großen Codebasen, browserloser Testautomatisierung und automatischer Fehlerbehebung
- Stärkt den Datenschutz durch lokale Datenspeicherung und hat Entwicklungspotenzial auf Basis der Open-Source-Community
- Auf Token-Kosten und API-Rate-Limits ist zu achten; die Nutzung alternativer API-Anbieter wie OpenRouter wird empfohlen
-
Cursor
- Ein KI-zentrierter Code-Editor, der fortgeschrittene Kontextanpassung und eine benutzerfreundliche Erfahrung bietet
- Kann über den API-Key des Nutzers verschiedene Modelle anbinden und integriert
git diff, frühere Gespräche, Websuche, Bibliotheksdokumentation und MCP in den Kontext - Implementierungsanweisungen können über die KI-Chat-Oberfläche gegeben werden; Dateien werden automatisch geändert und Befehle ausgeführt
- Enthält auch eine Funktion zur automatischen Behebung erkannter Lint- und Kompilierungsfehler
-
D2
- Ein Open-Source-Diagram-as-Code-Tool, mit dem sich Diagramme über textbasierte Skripte erstellen lassen
- Nutzt Layout-Engines wie Mermaid und bietet eine einfache, deklarative D2-Syntax
- Die auf Lesbarkeit ausgelegte Syntax eignet sich gut für Softwaredokumentation und Architekturdiagramme
-
Databricks Delta Live Tables (DLT)
- Ein deklaratives Tool zur Verwaltung von Datenpipelines, das sowohl Echtzeit-Streaming als auch Batch-Verarbeitung unterstützt
- Vereinfacht wiederkehrende Data-Engineering-Aufgaben wie die Automatisierung von Checkpoints und reduziert so den operativen Aufwand
- Über materialized views ist eine Leistungsoptimierung möglich
- Tabellen werden jedoch auf Pipeline-Ebene verwaltet, und Streaming-Tabellen haben eine Append-only-Struktur, weshalb bei der Architektur Sorgfalt nötig ist
- Dass beim Löschen einer DLT-Pipeline auch Tabellen und Daten mit gelöscht werden, stellt ein operatives Risiko dar
-
JSON Crack
- Eine VSCode-Erweiterung, die Textdaten wie JSON, YAML, TOML und XML als interaktive Graphen visualisiert
- Anders als Mermaid oder D2 dient es als Visualisierungstool zur Datenexploration; mit Funktionen zum Ausblenden von Knoten und Branches ist es für die Erkundung von Datensätzen nützlich
- Es gibt auch ein webbasiertes Tool, bei Online-Abhängigkeiten ist jedoch Vorsicht geboten
- Die Anzahl der Knoten ist begrenzt; für größere Datensätze wird auf eine kommerzielle Version hingeführt
-
MailSlurp
- Ein API-Dienst für die Automatisierung von E-Mail- und SMS-basierten Tests
- Bietet Funktionen wie das Erzeugen temporärer Postfächer und Telefonnummern, E-Mail-Validierung, automatische Antworten und Weiterleitung
- Über REST API und ein No-Code-Dashboard lässt sich auch die Vorbereitung manueller Tests einfach durchführen
- Eignet sich für Produkte zum Kunden-Onboarding und für die Entwicklung von Test-Workflows
-
Metabase
- Ein Open-Source-Analyse- und Business-Intelligence-Tool, mit dem sich aus verschiedenen Datenquellen Visualisierungen, Berichte und Dashboards erstellen lassen
- Über das SDK können interaktive Dashboards in Webanwendungen eingebettet werden
- Unterstützt sowohl relationale als auch NoSQL-Datenbanken und bietet eine Vielzahl offizieller sowie Community-Connectoren
- Als leichtgewichtiges BI-Tool ist es für die Verwaltung von Dashboards und Berichten nützlich
-
NeMo Guardrails
- Ein Open-Source-Toolkit von NVIDIA, mit dem sich Sicherheits-Guardrails auf LLM-basierte dialogorientierte Anwendungen anwenden lassen
- Unterstützt Colang 2.0 und ergänzt verschiedene Integrationen wie AutoAlign und Patronus Lynx
- Enthält NIM-Microservices für Content-Sicherheit, Topic-Steuerung und Prompt-Sicherheit
- Auch Leistungsverbesserungen wie die Unterstützung für Streaming-LLM-Ausgaben wurden umgesetzt
- Mit der Zunahme von Einsätzen in realen Services wurde es auf Trial hochgestuft
-
Nyx
- Ein sprach- und plattformunabhängiges Tool zur Automatisierung semantischer Releases
- Besonders gut für Trunk-based Development geeignet und unterstützt verschiedene Workflows wie Gitflow, OneFlow und GitHub Flow
- Bietet automatische Changelog-Erstellung auf Basis von Conventional Commits
- Bei Strategien mit langlebigen Branches ist weiterhin Vorsicht geboten
-
OpenRewrite
- Ein Tool zur Automatisierung großflächiger Refactorings, nützlich für API-Versions-Upgrades oder serviceweite Updates auf Basis gemeinsamer Templates
- Erweitert die Unterstützung über Java hinaus auf Sprachen wie JavaScript
- Ist bei standardisierten Änderungen stabiler und effizienter als KI-Code-Assistenten
- Bietet verschiedene Recipes (Transformationsregeln) und Plugins für Build-Tools, die alle als Open Source veröffentlicht werden
-
Plerion
- Eine auf AWS ausgerichtete Cloud-Sicherheitsplattform, die Risikoerkennung und Priorisierung über Infrastruktur, Server und Anwendungen hinweg bietet
- Unterstützt ähnlich wie Wiz dabei, sich auf das „wichtige 1 %“ zu konzentrieren
- Erhöht die Sicherheitsvisibilität für Kunden und unterstreicht die Bedeutung proaktiver Sicherheitsüberwachung
-
Software-Engineering-Agenten (Software engineering agents)
- Vollautonome Coding-Agenten sind weiterhin nicht praxistauglich, doch beaufsichtigte Agentenmodi innerhalb der IDE entwickeln sich rasant
- Entwickler steuern die Umsetzung über Chat-Oberflächen, während die KI Änderungen über mehrere Dateien hinweg, Testausführung sowie die Behandlung von Lint- und Kompilierungsfehlern übernimmt
- Sie werden als CHOP (Chat-Oriented Programming) oder Prompt-to-Code bezeichnet und übernehmen mehr Verantwortung als klassische Autocomplete-Hilfen
- Cursor, Cline und Windsurf sind hier führend, und die Kombination mit Modellen der Claude-Sonnet-Reihe zeigt besonders gute Ergebnisse
- Der Produktivitätsgewinn ist besonders groß, wenn der Problemumfang klein gehalten wird und in strukturierten Codebasen gearbeitet wird
- Beim Einsatz auf Produktionscode sollten Prüfverfahren wie Pair Programming parallel eingesetzt werden
-
Tuple
- Ein Tool für Remote Pair Programming, das als Alternative zu Screenhero von Slack gestartet ist
- Unterstützt inzwischen auch Windows, bietet stärkere Privatsphäre-Einstellungen und die Möglichkeit, bestimmte App-Fenster auszublenden
- Durch UI-Verbesserungen ist nun auch die Zusammenarbeit an Inhalten außerhalb der IDE möglich
- Da die Gegenstelle aus der Ferne auf den gesamten Desktop zugreifen kann, bestehen Sicherheitsbedenken → vor der Nutzung werden Privatsphäre-Einstellungen und Team-Schulungen empfohlen
- Dank intuitiver UX und geringer Latenz ist es als Tool für Remote Pairing praxistauglich
-
Turborepo
- Ein Tool zur Build-Optimierung für große JavaScript/TypeScript-Monorepos, das durch Abhängigkeitsanalyse, Caching und parallele Ausführung die Build-Geschwindigkeit erhöht
- Anders als Nx erlaubt es projektbezogene
package.json-Dateien und damit vorübergehend mehrere Versionen von Abhängigkeiten - Das kann beim Umstieg von mehreren Repositories auf ein Monorepo nützlich sein
- Die Konfiguration ist einfach, und auch in großen Projekten zeigt es stabile Leistung
Assess (weitere Prüfung nötig)
-
AnythingLLM
- Eine Open-Source-Desktop-Anwendung zur Interaktion mit großen Dokumenten oder Inhalten, die sich mit verschiedenen LLMs und Vektor-Datenbanken integrieren lässt
- Ist auch mit Open-Weight-Modellen auf Basis von Ollama kompatibel, und Embedding-Modelle können pluginbasiert konfiguriert werden
- Neben RAG lassen sich auch verschiedene Skills als Agenten konfigurieren, um benutzerdefinierte Workflows auszuführen
- Verwaltet Dokumente und Gesprächsverläufe pro Workspace und kann inzwischen auch als Multi-User-Web-App bereitgestellt werden
- Wird auch als lokales Tool für persönliche Assistenten nützlich eingesetzt
-
Gemma Scope
- Ein Tool zur mechanistischen Interpretierbarkeit, das helfen soll, die internen Abläufe von LLMs zu verstehen, und offene Modelle der Gemma2-Familie analysieren kann
- Hilft dabei, Ursachen für Halluzinationen, Bias und anomale Ausgaben zu verstehen und zu debuggen
- Seine Bedeutung wächst nicht nur für Forschende, sondern auch, weil das Training eigener Modelle für Unternehmen zunehmend eine realistische Option wird
-
Hurl
- Ein Tool, mit dem sich Sequenzen von HTTP-Anfragen in einfachen Textdateien definieren und ausführen lassen; nützlich für Automatisierung und Tests
- Bietet Funktionen wie die Prüfung von Statuscodes, Response-Headern und -Bodies sowie Datenextraktion und Variabilisierung
- Kann Berichte im HTML- und JSON-Format erzeugen, und Testdefinitionen lassen sich im Code-Repository mitführen
- Geeignet, wenn ein leichteres und einfacheres API-Test-Tool als GUI-Werkzeuge wie Postman oder Bruno benötigt wird
-
Jujutsu
- Ein verteiltes Versionsverwaltungssystem, das Git als Backend nutzt und dabei einen eigenen Workflow sowie eine verbesserte Benutzerfreundlichkeit bietet
- Kompatibel mit Git-Servern und -Diensten und bietet einfacheres, intuitiveres Branching und bessere Konfliktlösung
- Richtet sich sowohl an Einsteiger als auch an fortgeschrittene Nutzer und zeichnet sich durch eine intuitive, leistungsstarke UX aus
- Besonders die hervorragende Konfliktlösung wird sehr positiv bewertet
-
kubenetmon
- Ein von ClickHouse als Open Source veröffentlichtes Tool zur Überwachung des Kubernetes-Netzwerkverkehrs
- Ermöglicht detaillierte Messungen von Datenübertragungsvolumen und -kosten in Multi-Cloud-Umgebungen
- Wenn in Kubernetes-basierter Infrastruktur unerwartete Kosten für Datenübertragung zum Problem werden, ist ein Einsatz erwägenswert
-
Mergiraf
- Ein Git-Merge-Driver, der Merge-Konflikte auf Basis des Syntaxbaums (AST) von Code auflöst
- Besonders effektiv bei komplexen Merge-Konflikten, die durch lange Änderungshistorien oder AI-generierten Code entstehen
- Arbeitet präziser als der standardmäßige zeilenbasierte Merge-Ansatz von Git und kann auch für Auto-Merge und
cherry-pickeingesetzt werden - Kann für Teams nützlich sein, die komplexe Git-Workflows wie lange Feature-Branches verwenden
-
ModernBERT
- Eine Next-Generation-NLP-Modellreihe auf Basis eines Encoder-only-Transformers als Nachfolger von BERT
- Überwindet mit Alternating Attention die Begrenzung der Kontextlänge und verbessert Genauigkeit und Performance gegenüber klassischem BERT
- Sollte vorrangig in Betracht gezogen werden, wenn statt eines universellen generativen Modells ein auf NLP spezialisiertes Modell benötigt wird
-
OpenRouter
- Eine Plattform, die verschiedene LLM-Anbieter über eine einzige API bündelt und so Experimente sowie Kostenoptimierung unterstützt
- Kann Anfragen an unterschiedliche Modelle wie Claude, OpenAI und Mistral weiterleiten und bietet auch Funktionen zum Umgehen von API-Rate-Limits
- Da diese Struktur jedoch mit Preisaufschlägen verbunden ist, sollte sie nur erwogen werden, wenn ein Wechsel zwischen mehreren Modellen wirklich nötig ist
-
Redactive
- Eine Enterprise-Plattform, die den sicheren Aufbau von RAG-basierten AI-Assistenten in regulierten Umgebungen unterstützt
- Integriert sich unter anderem mit Confluence, erstellt dokumentbasierte Indizes und berücksichtigt Benutzerrechte in Echtzeit
- Stellt sicher, dass nur für das Modell freigegebene Informationen offengelegt werden, und schafft ein ausgewogenes Verhältnis zwischen Sicherheit und Zugänglichkeit
-
System Initiative
- Ein experimentelles DevOps-Tool, das sich von klassischen Infrastructure-as-Code-Ansätzen unterscheidet und kürzlich als Open Source veröffentlicht wurde (Apache 2.0)
- Wird bereits in Produktivumgebungen genutzt, braucht aber noch Zeit, um auf Enterprise-Niveau zu skalieren
- Einen Versuch wert, wenn man einen anderen Ansatz als bei etablierten DevOps-Tools kennenlernen möchte
-
TabPFN
- Ein transformerbasiertes Klassifikationsmodell, das für kleine tabellarische Datensätze optimiert ist
- Das vortrainierte Modell generalisiert auf Basis von Millionen synthetischer Datensätze
- Liefert schnelle und präzise Ergebnisse ohne Hyperparameter-Tuning und ist robust gegenüber fehlenden Werten und Ausreißern
- Für große Datensätze oder Regressionsprobleme ist es nicht geeignet
-
v0 (by Vercel)
- Ein AI-Tool, das auf Basis von Screenshots, Figma-Designs und Prompts Frontend-Code generiert
- Unterstützt verschiedene Frameworks wie React, Vue, Tailwind und shadcn; der generierte Code kann direkt deployt werden
- Hat zwar Grenzen bei der vollständigen Umsetzung komplexer Apps, ist aber nützlich für frühe Prototypen oder als Ausgangspunkt für UI-Entwicklung
-
Windsurf
- Ein von Codeium entwickelter AI-Coding-Assistent, der eine agentenbasierte Entwicklungsumgebung ähnlich wie Cursor und Cline bietet
- Seine Ausführungsfähigkeiten werden durch Browser-DOM-Navigation, Konsolenzugriff und Websuche erweitert
- Unterstützt verschiedene Modelle und bietet zudem starke Kontextfunktionen wie MCP und Dokumentreferenzen
-
YOLO (You Only Look Once)
- Ein leistungsstarkes, leichtgewichtiges Modell für verschiedene Computer-Vision-Aufgaben wie Echtzeit-Bildklassifikation, Objekterkennung, Pose Estimation und Segmentierung
- Die aktuelle Version YOLO11 verbessert Präzision und Verarbeitungseffizienz weiter und eignet sich dadurch auch für Edge Devices
- Erinnert daran, dass für bestimmte Vision-Aufgaben klassische CV-Modelle besser geeignet sein können als LLMs
Sprachen und Frameworks (Languages and Frameworks)
Adopt (zur Einführung empfohlen)
-
OpenTelemetry
- Etabliert sich schnell als Industriestandard für Observability
- Mit der OTLP(OpenTelemetry Protocol)-Spezifikation lassen sich Trace-, Metrik- und Log-Daten in einem Standardformat verarbeiten
- Reduziert Vendor Lock-in und integriert sich mit wichtigen Tools wie Datadog, New Relic und Grafana
- Unterstützt gzip- und zstd-Komprimierung, was die Effizienz bei großen Datenübertragungen erhöht, und eignet sich gut für Microservice-Umgebungen
- Durch den Ausbau von Log- und Profiling-Unterstützung wird Full-Stack-Observability noch einfacher
-
React Hook Form
- Eine Alternative zu Formik, die standardmäßig uncontrolled Komponenten nutzt und dadurch sehr performant ist
- Lässt sich leicht mit schemabasierten Validierungsbibliotheken wie Yup und Zod integrieren
- Integriert sich auch gut in bestehende Codebases sowie externe Komponentenbibliotheken wie shadcn und AntD
- Eine stabile und flexible Wahl für große Formulare oder formularzentrierte Anwendungen
Trial (zum Testen)
-
Effect
- Eine funktionale Programmbibliothek für TypeScript, die die Implementierung asynchroner und synchroner Programme vereinfacht
- Kann komplexe Logik wie State Management, Fehlerbehandlung und Concurrency mit Typsicherheit abbilden
- Bietet bessere Komponierbarkeit und Testbarkeit als klassische Ansätze mit
Promise,async/awaitundtry/catch - Liefert Abstraktionen, die sich für den alltäglichen Entwicklungsalltag besser eignen als das zuvor genutzte
fp-ts
-
Hasura GraphQL Engine
- Bietet Echtzeit-GraphQL-APIs für verschiedene Datenquellen wie PostgreSQL, MongoDB und ClickHouse
- Wird in Datenproduktprojekten effektiv für die serverseitige Ressourcenintegration und den schnellen Aufbau von APIs eingesetzt
- Federated Query und integriertes Schema-Management sind leistungsfähig, erfordern aber Vorsicht
- Die kürzlich hinzugefügte PromptQL-Funktion ermöglicht natürliche Datenabfragen mit Unterstützung von LLMs
-
LangGraph
- Ein graphbasiertes Orchestrierungs-Framework für zustandsbehaftete Multi-Agent-Anwendungen auf LLM-Basis
- Bietet im Vergleich zu LangChain eine niedrigere Kontrollebene über Knoten und Kanten und ermöglicht dadurch anpassbare Workflows
- Überzeugt bei vorhersehbarem State Management, Debugging, Wartbarkeit und Skalierbarkeit
- Hat zwar eine gewisse Lernkurve, ist aber in Bezug auf Leichtgewichtigkeit und Modularität sehr leistungsfähig
-
MarkItDown
- Ein CLI-Tool zur Umwandlung von Dokumenten wie PDF, HTML, Word und PowerPoint in Markdown
- Nutzt die strukturellen Eigenschaften von Markdown, um die Genauigkeit der Dokumentverarbeitung und das Kontextverständnis von LLMs zu verbessern
- Als Vorverarbeitung in RAG-Systemen verbessert es die Klarheit von Retrieval-Antworten erheblich
- Ein nützliches Tool zur Steigerung der Entwicklerproduktivität, das auch häufig für Dokumentation verwendet wird
-
Module Federation
- Ermöglicht das Teilen von Modulen zwischen Micro Frontends und reduziert doppelte Abhängigkeiten
- Seit Version 2.0 funktioniert es unabhängig von Webpack und unterstützt Rspack, Vite, React, Angular und mehr
- Kann große Webanwendungen so strukturieren, dass unabhängige Teams sie jeweils getrennt entwickeln, deployen und skalieren können
-
Prisma ORM
- Ein Open-Source-Datenbank-Toolkit für Node.js- und TypeScript-Anwendungen
- Datenmodelle lassen sich ohne Dekoratoren oder Klassen mit einfachen Objekten definieren; Typsicherheit und Portabilität sind hoch
- Bietet automatische Migrationsfunktionen und eine intuitive Query-API
- Passt auch gut zu funktionalen Programmierparadigmen und ist für TypeScript-Entwicklungsumgebungen optimiert
Assess (näher prüfen)
-
.NET Aspire
- Ein .NET-basiertes Tool, das die Orchestrierung verteilter Anwendungen in lokalen Entwicklungsumgebungen vereinfacht
- Kann mehrere .NET-Projekte, Datenbanken und Docker-Container mit einem einzigen Befehl starten
- Bietet lokale Observability-Tools wie Logging, Tracing und Metrik-Dashboards, was Debugging und Developer Experience verbessert
-
Android XR SDK
- Ein speziell für XR-Headsets entwickeltes Android-Betriebssystem und SDK, das Google in Zusammenarbeit mit Samsung und Qualcomm entwickelt hat
- Unterstützt die meisten Android-Apps mit minimalen Anpassungen und eignet sich für neu entwickelte Spatial-Computing-Apps
- Befindet sich derzeit im Developer-Preview-Status und wird als Standard-SDK für die Entwicklung räumlicher Apps positioniert
-
Browser Use
- Eine Open-Source-Python-Bibliothek, mit der LLM-basierte KI-Agenten einen Webbrowser steuern können
- Basiert auf Playwright und ermöglicht Automatisierung wie Navigation, Eingaben und Textextraktion
- Unterstützt die Steuerung mehrerer Tabs und Koordinationsaufgaben zwischen Web-Apps, was sie in Multi-Agent-Workflows nützlich macht
-
CrewAI
- Eine Plattform für Agentenmanagement und -orchestrierung, mit der mehrere Agenten kombiniert werden können, um komplexe Aufgaben auszuführen
- Neben der Python-Bibliothek ist über eine Enterprise-Version auch die Integration mit externen Systemen wie SharePoint und JIRA möglich
- Wird auf reale Business-Aufgaben wie die Validierung von Promotion-Codes, die Untersuchung fehlgeschlagener Transaktionen und die Automatisierung des Kundensupports angewendet
- Für alle, die sich für den Aufbau agentenbasierter Systeme interessieren, sehr erkundenswert
-
ElysiaJS
- Ein typsicheres TypeScript-Web-Framework, das für die Bun-Runtime optimiert ist und die Entwicklung von RESTful- und OpenAPI-artigen APIs ermöglicht
- Erzwingt im Gegensatz zu tRPC keine API-Struktur und bietet gleichzeitig hohe Performance und Typsicherheit
- Eignet sich für den Aufbau von BFFs (Backend-for-Frontend) und zielt auf Performance auf dem Niveau von Java oder Go ab
-
FastGraphRAG
- Eine High-Performance-GraphRAG-Implementierung, die über Personalized PageRank nur relevante Knoten durchsucht und so Genauigkeit und Performance verbessert
- Bietet Visualisierungsunterstützung und inkrementelle Updates und eignet sich daher für große dynamische Datensätze
- Eine GraphRAG-Lösung, die zugleich die Qualität von LLM-Antworten verbessert und Ressourcen spart
-
Gleam
- Eine statisch typisierte funktionale Sprache auf Basis von Erlang/OTP, die Laufzeitfehler reduziert und die Wartbarkeit verbessert
- Bewahrt eine moderne Syntax und die Kompatibilität mit dem BEAM-Ökosystem (Erlang, Elixir)
- Geeignet für Systeme, die hohe Nebenläufigkeit, Stabilität und Skalierbarkeit erfordern, insbesondere für Teams, die gegenüber klassischem Erlang mehr Typsicherheit benötigen
Assess (nähere Prüfung erforderlich)
-
GoFr
- Ein auf Golang basierendes Microservices-Framework, das Logging, Tracing, Metriken, Konfigurationsmanagement und Swagger-Dokumentation standardmäßig unterstützt
- Enthält Anbindungen an verschiedene Datenbanken sowie Kafka- und NATS-basiertes Pub/Sub und Funktionen zur Planung von Cron-Jobs
- Ein produktivitätsorientiertes Tool, das wiederkehrende Arbeiten reduziert und mehr Fokus auf die Implementierung der Business-Logik ermöglicht
-
Java Post-Quantum Cryptography
- Kryptografietechnologie für das Zeitalter der Quantencomputer, die in JDK 24 über JEP 496/497 erstmals unterstützt wird
- Implementiert gitterbasierte kryptografische Algorithmen (KEM, digitale Signaturen) und eignet sich zum Schutz von Daten, bei denen langfristige Sicherheit wichtig ist
- Es gibt auch
liboqsvon Open Quantum Safe, doch die native Java-Implementierung wird als wichtiger Fortschritt bewertet
-
Presidio
- Ein Datenschutz-SDK, das sensible Informationen in strukturierten und unstrukturierten Texten identifiziert und anonymisiert
- Erkennt PII-Elemente (Kreditkartennummern, Namen, Orte usw.) regelbasiert, per Regex und mittels NER
- Ist stark anpassbar, doch da keine perfekte Erkennung garantiert ist, ist bei der Interpretation der Ergebnisse Vorsicht geboten
-
PydanticAI
- Ein Framework zum Aufbau von LLM- und agentenbasierten Anwendungen, entwickelt vom Team hinter Pydantic
- Zielt auf minimale Komplexität ab und bietet strukturierte Ausgabe-Verarbeitung, Integration wichtiger Model-APIs und graphbasierte Workflows
- Geeignet für Entwickler, die übermäßige Abstraktion vermeiden und eine praktische, schlanke Struktur bevorzugen
-
Swift for Resource-Constrained Applications
- Seit Swift 6.0 wurde die Unterstützung für verschiedene Betriebssysteme ausgebaut, wodurch der Einsatz auch in ressourcenbeschränkten Umgebungen realistischer wird
- Bietet mit starker Typsicherheit und ARC-basierter Speicherverwaltung ein ausgewogenes Verhältnis von Performance und Stabilität
- Ist zugänglicher als Rust, erfüllt aber Sicherheitszertifizierungsstandards (wie MISRA) noch nicht ausreichend, was den Einsatz in Umgebungen mit hohen Sicherheitsanforderungen einschränkt
-
Tamagui
- Eine UI-Bibliothek, die die gemeinsame Nutzung von Styles zwischen React Web und React Native optimiert
- Bietet ein Design-System und einen optimierten Compiler; im Web wird als Atomic CSS gerendert, nativ mit hoisted Styles
- Nützlich, wenn bei plattformübergreifender UI-Entwicklung konsistente Styles und Performance-Optimierung gewünscht sind
-
torchtune
- Eine PyTorch-basierte Bibliothek für LLMs, die Post-Training, Fine-Tuning und Inferenz-Experimente unterstützt
- Unterstützt verteiltes Training auf Basis von FSDP2 sowie Single- und Multi-GPU-Umgebungen
- YAML-basierte Recipes ermöglichen intuitive Experimente ohne komplexe Konfiguration, und per CLI lassen sich Model-Downloads und Experimente bequem ausführen
Hold (eher zurückstellen)
- Node overload
- Die übermäßige Wahl von Node.js ist weiterhin ein Problem; oft wird es ohne ernsthafte Prüfung von Alternativen eingesetzt
- Für IO-zentrierte Aufgaben ist es weiterhin effizient, für rechenintensive oder datenlastige Aufgaben jedoch nicht gut geeignet
- Mit der jüngsten Zunahme datenorientierter Workloads werden die Grenzen von Node.js noch deutlicher sichtbar
- Die Vorliebe für einen Single-Language-Stack ist nachvollziehbar, dennoch empfehlen wir weiterhin einen Polyglot-Ansatz
- Da es inzwischen viele alternative Frameworks mit besseren APIs und höherer Performance gibt, sollte der Einsatz von Node.js sorgfältig geprüft werden
1 Kommentare
Thoughtworks Technology Radar, Volume 31
Thoughtworks Technology Radar, Volume 30
Thoughtworks Technology Radar, Volume 29
Thoughtworks Technology Radar, Volume 28
Thoughtworks Technology Radar, Volume 27
Thoughtworks Technology Radar, Volume 26
ThoughtWorks Technology Radar, Volume 23
ThoughtWorks Technology Radar, Volume 22
Technik-News von ThoughtWorks, die alle 6 Monate erscheinen – Radar Vol.21