19 Punkte von xguru 2025-04-04 | 1 Kommentare | Auf WhatsApp teilen
  • Die neuesten Trends in den Bereichen Techniken/Tools/Plattformen/Programmiersprachen und Frameworks werden in vier Stufen visualisiert und erklärt: Hold/Assess/Trial/Adopt
  • Interessante Technologieeinträge (blips) werden nachverfolgt. Blips bewegen sich im Laufe der Zeit zwischen den vier Stufen
    • Adopt (Einführung empfohlen): Wird als etwas bewertet, das branchenweit aktiv eingeführt werden sollte. In geeigneten Situationen wird es tatsächlich in Projekten eingesetzt
    • Trial (testweise Einführung): Lohnt sich für den experimentellen Einsatz. Wichtig ist zu verstehen, wie sich die entsprechenden Fähigkeiten aufbauen lassen. Kann in Projekten eingeführt werden, die ein gewisses Risiko tragen können
    • Assess (nähere Prüfung erforderlich): Es lohnt sich, die Technologie zu untersuchen. Ziel ist zu verstehen, welche Auswirkungen sie auf die Organisation haben könnte
    • Hold (vorerst zurückstellen): Sollte mit Vorsicht angegangen werden

Vier Themen dieser Ausgabe

  • Beaufsichtigte Agenten für Coding Assistants nutzen

    • Eine der schnellen Entwicklungen im Bereich Generative AI ist das Wachstum dialogorientierter Coding-Agenten in der IDE
    • Sogenannte „agentic“, „prompt-to-code“ und „CHOP (chat-oriented programming)“-Ansätze verbreiten sich
      • Die AI erzeugt nicht nur einfache Code-Snippets, sondern übernimmt auch Code-Erkundung, Änderungen, Test-Updates, das Ausführen von Befehlen und gelegentlich sogar das automatische Beheben von Lint-/Compiler-Fehlern
    • Gegenüber vollständig autonomer Code-Erzeugung bleibt man weiterhin skeptisch, aber Ansätze unter Aufsicht von Entwicklerinnen und Entwicklern liefern positive Ergebnisse
    • Typische IDE-integrierte Tools: Cursor, Cline, Windsurf, GitHub Copilot
    • Terminalbasierte Alternativen: aider, goose, Claude Code
    • Vor übermäßigem Vertrauen in automatische AI-Code-Erzeugung wird gewarnt
      • Bei Code Reviews sind fortlaufende Anleitung und Prüfung weiterhin wichtig
  • Observability im Wandel

    • Mit der steigenden Komplexität verteilter Architekturen entwickelt sich der Bereich Observability rasant weiter
    • Neues Interessengebiet: LLM Observability
      • Die Zahl der Tools zur Überwachung und Bewertung der LLM-Leistung nimmt zu
      • Beispiele: Weights & Biases Weave, Arize Phoenix, Helicone, HumanLoop
    • AI-gestützte Observability-Tools verbessern die Auswertung von Insights
    • Die zunehmende Verbreitung von OpenTelemetry sichert Herstellerneutralität und Flexibilität bei den Tools
      • Typische Tools mit OpenTelemetry-Unterstützung: Alloy, Tempo, Loki
    • Bei Observability verstärken sich Tools und Praktiken gegenseitig und entwickeln sich kontinuierlich weiter
  • Die Weiterentwicklung des „R“ in RAG

    • Unter den verschiedenen Bausteinen des Generative-AI-Ökosystems entwickelt sich insbesondere das R von RAG (Retrieval-Augmented Generation) schnell weiter
    • Zentrale Strömungen:
      • Corrective RAG: Korrigiert Antworten auf Basis von Feedback oder Heuristiken
      • Fusion-RAG: Kombiniert unterschiedliche Quellen und Suchstrategien, um Vollständigkeit und Robustheit der Antworten zu verbessern
      • Self-RAG: Überspringt den Retrieval-Schritt und beschafft Daten bei Bedarf direkt
      • FastGraphRAG: Verbessert das Verständnis durch Graphen, die für Menschen explorierbar sind
    • Die Optimierung des Retrievals für präzise und nützliche Antworten passend zu den Anforderungen der Nutzerinnen und Nutzer wird immer wichtiger, und entsprechende Techniken und Tools entwickeln sich schnell weiter
  • Mit komplexen Daten umgehen

    • Nicht mehr die Größe von Daten (Big Data), sondern deren Komplexität und Vielfalt (Rich, Complex Data) sind das zentrale Thema
    • Durch die Zunahme unstrukturierter Daten ist systematisches Datenmanagement unerlässlich, um diese sinnvoll für AI oder Kundenanalysen zu nutzen
    • Tool-Trends in diesem Bereich:
      • Vektordatenbanken, Analysetools wie Metabase
    • Der Aufstieg von Data Product Thinking
      • Auf Analysetools und Strategien zur Datennutzung wird Product Thinking angewandt
      • Es ist ein Versuch, Aufgaben der Datennutzung, die schon vor dem Aufkommen von AI diskutiert wurden, in die praktische Umsetzung zu bringen
    • Ohne eine klare Datenstrategie laufen Unternehmen Gefahr, bei Innovationen zurückzufallen und an Wettbewerbsfähigkeit zu verlieren

Techniken (Techniques)

Adopt (Einführung empfohlen)

  • Data Product Thinking

    • Daten werden wie ein Produkt behandelt, wobei Lebenszyklus, Qualitätsstandards und verbraucherorientiertes Design betont werden
    • Moderne Datenkataloge wie DataHub, Collibra, Atlan und Informatica werden genutzt, um Business- und technische Metadaten gemeinsam zu verwalten
    • Data Product Thinking wird genutzt, um AI-fähige Daten bereitzustellen und AI-Projekte zu skalieren
    • Der Fokus liegt auf dem Management des gesamten Lebenszyklus bis hin zu Datenlöschprozessen unter Einhaltung gesetzlicher und regulatorischer Anforderungen
  • Fuzz Testing

    • Eine alte Technik, aber nach wie vor eine Testmethode, die nicht breit bekannt ist
    • Dem System werden verschiedene ungewöhnliche Eingaben gegeben, um sein Verhalten in Ausnahmesituationen zu überprüfen
    • Im Zusammenhang mit Sicherheitslücken durch zunehmende AI-Code-Erzeugung wird diese Technik noch wichtiger
    • Es gibt ausreichend gute Tool-Unterstützung, und die Einführung ist sinnvoll, um robusten und sicheren Code zu erhalten
  • Software Bill of Materials (SBOM)

    • Die Erstellung von SBOMs hat sich inzwischen als grundlegende Sicherheitspraktik etabliert
    • Mit Tools wie Syft, Trivy und Snyk lassen sich von Source Code bis zu Container-Images SBOMs erstellen und Schwachstellen scannen
    • FOSSA, Chainloop und andere sind in Entwicklungs-Workflows integriert und wenden Sicherheitsrichtlinien automatisch an
    • Dank breiter Unterstützung für SPDX und CycloneDX ist auch die Standardisierungsfrage entschärft
    • Auch in AI-Systemen steigen die Anforderungen an SBOMs, und sie werden in Leitfäden für sichere Code-Praktiken berücksichtigt
  • Threat Modeling

    • Eine zentrale Technik, um in AI-zentrierten Softwareentwicklungsumgebungen Sicherheit zu wahren und gleichzeitig Agilität zu sichern
    • Kann auch auf Systeme mit spezifischen Sicherheitsrisiken wie Generative AI angewandt werden
    • Sollte regelmäßig über das gesamte Projekt hinweg durchgeführt werden und ist besonders wirksam in Kombination mit automatisierten Security-Scannern und der Definition von Sicherheitsanforderungen

Trial (testweise Einführung)

  • API-Request-Collections als API-Produktartefakte behandeln

    • Wenn APIs wie Produkte behandelt werden, sollte nicht nur die Dokumentation, sondern vor allem die Developer Experience priorisiert werden
    • Swagger(OpenAPI)-Spezifikationen sind für die Dokumentation von Schnittstellen nützlich, aber das Onboarding bleibt trotzdem schwierig
    • Durch die Weiterentwicklung von Client-Tools wie Postman, Bruno und Insomnia ist es sinnvoll geworden, API-Request-Collections als Produktartefakte zu nutzen
    • Mit Beispielen inklusive vorkonfigurierter Authentifizierung und realistischen Testdaten ist ein schnelles und effizientes Onboarding von Entwicklerinnen und Entwicklern möglich
    • API-Request-Collections sollten im Repository gespeichert und in Deployment-Pipelines integriert werden, damit sie aktuell bleiben
  • Architekturberatungsprozess

    • In großen Teams ist die Dezentralisierung von Entscheidungsbefugnissen in der Architektur seit Langem eine Herausforderung
    • Traditionelle Architecture Review Boards behindern vielmehr Produktivität und Flow
    • Ein dezentraler Entscheidungsansatz, bei dem jede Person Architekturentscheidungen treffen kann, aber Beteiligte oder Expertinnen und Experten um Rat fragt, erweist sich als wirksam
    • Mit Tools wie Architecture Decision Records und Beratungsforen lassen sich Qualität und Konsistenz aufrechterhalten
    • Dieser Ansatz verbreitet sich auch in stark regulierten Branchen
  • GraphRAG

    • Von Microsoft vorgeschlagener zweistufiger Ansatz: Dokumente werden segmentiert, anschließend wird per LLM-Analyse ein Wissensgraph erstellt, und bei der Suche werden entlang dieses Graphen relevante Informationen erweitert, um den Prompt zu verstärken
    • Auch für die Analyse komplexer Legacy-Codebasen nützlich, indem auf Basis von abstrakten Syntaxbäumen (AST) oder Abhängigkeitsstrukturen Wissensgraphen erzeugt werden
    • Mit dem Auftauchen von Tools wie dem GraphRAG Python package von Neo4j wird der Ansatz zunehmend verbreitet
    • Auch Tools wie Graphiti fallen unter eine erweiterte Interpretation des GraphRAG-Musters
  • Just-in-time-Management privilegierter Zugriffe (Just-in-time privileged access management, JIT PAM)

    • Eine Sicherheitstechnik zur praktischen Umsetzung des Least-Privilege-Prinzips: Administratorrechte werden nur bei Bedarf gewährt und anschließend sofort wieder entzogen
    • Dauerhaft verfügbare Administratorrechte, sogenannte „standing privileges“, können eine Sicherheitslücke darstellen
    • Temporäre Berechtigungen werden über automatisierte Genehmigungs-Workflows, temporäre Rollenzuweisungen und TTL-(Time-To-Live-)Einstellungen kontrolliert
    • Sehr effektiv zur Erfüllung regulatorischer und Compliance-Anforderungen
  • Model Distillation

    • Eine Methode, bei der Wissen aus großen Modellen extrahiert und auf kleinere Modelle übertragen wird, um Genauigkeitsverluste zu minimieren und die Ausführungseffizienz zu erhöhen
    • Im Gegensatz zu Verkleinerungsverfahren wie Pruning und Quantization liegt der Fokus darauf, Domänenwissen zu erhalten
    • Beispiele für verkleinerte Modelle bei gleichzeitig hoher Leistung nehmen zu, etwa destillierte Versionen von DeepSeek R1 auf Basis von Qwen/Llama
    • Plattformen wie OpenAI und Amazon Bedrock bieten Anleitungen zur Distillation; das ist vorteilhaft, um die Betriebskosten von LLMs in Unternehmen zu senken und Inference on-device zu optimieren
  • Prompt Engineering

    • Der Prozess des Entwerfens und Anpassens klarer, konkreter Prompts, um die Ausgabequalität generativer KI-Modelle zu optimieren
    • Zero-shot-Prompts können bei Reasoning-Modellen bessere Ergebnisse liefern als Few-shot-Prompts
    • CoT-(chain-of-thought-)Prompts können die Leistung von Reasoning-Modellen im Gegenteil sogar verschlechtern, was auf den Einfluss des Vortrainings mittels RL zurückzuführen ist
    • Bei fortgeschrittenen Modellen könnte der Bedarf an Prompt Engineering abnehmen, dennoch bleibt es wirksam zur Reduzierung von Halluzinationen und zur Qualitätsverbesserung
    • Wichtig ist, das Gleichgewicht zwischen Antwortgeschwindigkeit, Token-Kosten und Leistung zu wahren; beim Entwurf agentischer Apps sind strategische Entscheidungen passend zu den Modelleigenschaften erforderlich
  • Kleine Sprachmodelle (Small Language Models, SLMs)

    • Kleine destillierte Versionen von DeepSeek R1 (Qwen, Llama) können auf Standardhardware ausgeführt werden, auch wenn dafür ein Teil der Leistung geopfert wird
    • Der Bereich SLM entwickelt sich sehr schnell weiter, und es erscheinen verschiedene Modelle wie Meta Llama 3.2 (1B, 3B), Microsoft Phi-4 (14B) und Google PaliGemma 2 (3B~28B)
    • Kleine Modelle haben geringere Inference-Kosten und weniger Einschränkungen bei der Laufzeitumgebung, was ihr Potenzial für breite Einsatzszenarien erhöht
    • Im Spannungsfeld zwischen Leistung und Effizienz gelten SLMs als wichtiger Technologietrend
  • Verständnis von Legacy-Codebasen mit GenAI

    • Wichtige Tools wie GitHub Copilot und Sourcegraph Cody unterstützen das Verständnis und die Modernisierung von Legacy-Codebasen
    • Sie vereinfachen die Arbeit an komplexen Systemen auf verschiedene Weise, etwa durch Strukturverständnis, Navigation und kontextbasierte Hilfestellungen
    • Frameworks wie S3LLM ermöglichen auch das Verständnis von Code aus wissenschaftlich-technischen Bereichen wie Fortran und Pascal
    • Da es weltweit enorme Mengen an Legacy-Software gibt, dürfte sich diese Technologie auch künftig weiter verbreiten

Assess (weitere Prüfung erforderlich)

  • KI-freundliches Code-Design (AI-friendly code design)

    • KI-basierte Software-Agenten können zunehmend auch größere Codeänderungen erkennen und anwenden
    • Mit wachsendem Vertrauen in KI-generierten Code nimmt in manchen Fällen auch der Anteil menschlicher Reviews ab
    • Da KI jedoch bei gut strukturiertem Code bessere Leistungen zeigt, ist KI-freundliches Design für die Wartbarkeit wichtig
    • Bewährte Designpraktiken wie sprechende Namen, Modularisierung, Abstraktion und die Vermeidung von Duplikaten (DRY) wirken sich auch positiv auf die KI-Leistung aus
    • Künftig dürften zudem Designmuster entstehen, die speziell auf KI zugeschnitten sind
  • KI-gestütztes UI-Testing (AI-powered UI testing)

    • Eine neue Form des UI-Testings auf Basis der Fähigkeit von LLMs, GUIs zu interpretieren, ist im Aufschwung
    • QA.tech und KaneAI ermöglichen es, snapshot-basiertes UI per natürlicher Sprache zu testen
    • Browser Use führt Tests auf Basis der Strukturdaten von Playwright durch und nutzt multimodale Modelle
    • Zwar kann dies zu nicht deterministischen Ergebnissen führen, die Flexibilität ist jedoch bei Tests von Legacy-Systemen oder bei häufigen UI-Änderungen von Vorteil
    • Es lässt sich komplementär zu explorativen manuellen Tests einsetzen
  • Competence-Envelope-Modell zum Verständnis von Systemausfällen

    • Ein Konzept, das die Grenzen definiert, innerhalb derer ein System normal funktionieren kann; wird diese Grenze überschritten, scheitert das System leicht
    • Nützlich zur Interpretation komplexer Ausfälle wie der Canva-Störung von 2024
    • Die Residuality Theory analysiert die Anpassungsfähigkeit eines Systems anhand seiner früheren Belastungshistorie und seiner aktuellen Reaktion
    • Es steht in Verbindung mit Konzepten wie Systemresilienz, Robustheit und Antifragilität; es gibt Erwartungen an seine praktische Anwendbarkeit
  • Strukturierte Ausgaben von LLMs (Structured output from LLMs)

    • Eine Technik, bei der Antworten von Sprachmodellen auf ein definiertes Schema wie JSON beschränkt werden
    • OpenAI unterstützt strukturierte Ausgaben unter Verwendung von JSON Schema, pydantic, Zod-Objekten usw.
    • Sehr nützlich in Bereichen, in denen ein exaktes Format erforderlich ist, etwa bei Function Calling oder API-Integrationen
    • Unterstützt vielfältige Einsatzmöglichkeiten wie die Erzeugung von Chart-Markup und kann auch Halluzinationen verringern

Hold (Zurückstellung empfohlen)

  • Durch KI beschleunigte Shadow IT (AI-accelerated shadow IT)

    • Durch Fortschritte bei KI können nun auch Nicht-Entwickler Software direkt erstellen, ohne die IT-Abteilung durchlaufen zu müssen
    • Mit No-Code-Tools, die APIs von OpenAI, Anthropic und anderen unterstützen, lassen sich auch komplexe Integrationen leicht umsetzen
    • Allerdings steigt mit der Verbreitung unkontrollierter Anwendungen die Wahrscheinlichkeit von Problemen bei Sicherheit und Datenmanagement
    • Es wirkt wie eine weiterentwickelte Form von Tabellenkalkulationen, aber in deutlich größerem Umfang
    • Das Gleichgewicht zwischen schneller Problemlösung und langfristiger Stabilität muss sorgfältig abgewogen werden
  • Selbstzufriedenheit im Umgang mit KI-generiertem Code (Complacency with AI-generated code)

    • Es zeigen sich Tendenzen zu Qualitätsverlusten durch KI-Nutzung, etwa mehr Duplikatcode, mehr Code Churn und weniger Refactoring
    • Laut Untersuchungen von Microsoft kann KI Nutzern falsches Vertrauen vermitteln und kritisches Denken beeinträchtigen
    • Da KI immer mehr Code erzeugt, besteht das Risiko, dass es für Entwickler schwieriger wird, Änderungen zu überprüfen
    • Ansätze wie „vibe coding“, bei denen KI Code erzeugt und nur minimal geprüft wird, sind für Produktionscode hochriskant
  • Lokale Coding-Assistenten (Local coding assistants)

    • KI-Coding-Assistenten, die lokal ohne externe Übertragung ausgeführt werden, bieten Sicherheitsvorteile
    • Ihre Leistung ist jedoch im Vergleich zu Cloud-basierten Modellen begrenzt, und sie haben Schwierigkeiten mit komplexen Prompts oder Integrationsfunktionen
    • In die IDE integrierte Funktionen (Xcode, JetBrains) oder Integrationen auf Basis von Qwen Coder und Continue + Ollama sind für einfache Aufgaben nützlich
    • Empfohlen wird, die Erwartungen niedrig anzusetzen und sie experimentell einzuführen
  • Vollständiger Ersatz von Pair Programming durch KI (Replacing pair programming with AI)

    • Tools wie Copilot präsentieren sich zwar als KI-Pair-Programmierer, können die teambasierten Vorteile menschlicher Pairs jedoch nicht ersetzen
    • KI ist nützlich für Lernen, Onboarding und die Konzentration auf strategisches Design, weist aber Defizite bei Teamzusammenarbeit, geteilter Code-Verantwortung und der Vermeidung von Wissensinseln auf
    • Angesichts der kollaborativen Wirkung traditionellen Pair Programmings wird ein vollständiger Ersatz nicht empfohlen
  • Reverse ETL

    • Reverse ETL, also das Zurückspielen von Daten aus dem Data Warehouse in Transaktionssysteme, nimmt zu
    • Für vorübergehende Migrationen oder Integrationszwecke kann das sinnvoll sein, bei übermäßiger Nutzung verschärft es jedoch die Probleme zentralisierter Architekturen
    • Einige Anbieter missbrauchen dies, um Business-Logik auf ihrer eigenen Plattform zu konzentrieren
    • Da dies die langfristige Architekturqualität und Flexibilität beeinträchtigen kann, ist bei der Einführung äußerste Vorsicht geboten
  • SAFe™ (Scaled Agile Framework)

    • Noch immer setzen viele Unternehmen SAFe™ ein.
    • Übermäßig standardisierte, schrittweise Prozesse führen jedoch zu Silos zwischen Abteilungen, Verschwendung entlang des Value Streams und einer Hemmung der Kreativität.
    • Teamautonomie und eine Kultur des Experimentierens werden eingeschränkt, und der Versuch, komplexe organisatorische Veränderungsprobleme mit einfachen Prozessen zu lösen, stößt an Grenzen.
    • Thoughtworks begegnet dem intern mit Schulungen und Beratung, hält jedoch einen Lean-basierten, wertorientierten Ansatz und entsprechende Veränderungsprogramme für wirksamer.

Plattformen (Platforms)

Adopt (Empfohlen für den Einsatz)

  • GitLab CI/CD

    • Ein vollständig in GitLab integriertes CI/CD-System, das den gesamten Softwareentwicklungslebenszyklus von der Code-Integration über Tests und Deployment bis hin zum Monitoring unterstützt.
    • Eignet sich für komplexe Workflows mit Multi-Stage-Pipelines, Caching, paralleler Ausführung und Autoscaler-Runnern.
    • Dank integrierter Sicherheits- und Compliance-Tools (SAST, DAST usw.) auch in stark regulierten Umgebungen verlässlich einsetzbar.
    • Unterstützt durch die Integration mit Kubernetes Cloud-native Workflows umfassend.
    • Bietet Echtzeit-Logs, Testberichte und Tracing-Funktionen und stärkt damit die Observability.
  • Trino

    • Eine Open-Source-Distributed-SQL-Query-Engine, mit der sich interaktive Analyseabfragen auf großen Datenmengen ausführen lassen.
    • Läuft optimiert sowohl On-Premises als auch in Cloud-Umgebungen und kann über verschiedene Connectoren direkt relationale Datenbanken sowie proprietäre Speicher abfragen.
    • Unterstützt außerdem Datei- und Tabellenformate wie Parquet und Apache Iceberg.
    • Mit der Föderationsfunktion für Abfragen lassen sich mehrere Datenquellen wie eine einzige logische Tabelle abfragen.
    • Wird auch in verschiedenen kommerziellen Datenplattformen wie AWS Athena und Starburst als Kerntechnologie eingesetzt und ist eine verlässliche Option für unterschiedliche Analyse-Workloads.

Trial (Testeinsatz)

  • ABsmartly

    • Eine Plattform für schnelle und zuverlässige A/B-Tests und Experimente.
    • Mit der Group Sequential Testing (GST)-Engine sind Tests im Vergleich zu herkömmlichen Verfahren bis zu 80 % schneller möglich.
    • Bietet Echtzeit-Reports, tiefe Datensegmentierung und umfassende API-zentrierte Integrationsfunktionen.
    • Ermöglicht Experimente in großem Umfang – von Web und Mobile über Microservices bis hin zu ML-Modellen.
    • Ist durch verkürzte Iterationszyklen und automatische Ergebnisauswertung effektiv für die Optimierung der User Experience.
  • Dapr

    • Eine Runtime für verteilte Anwendungen, die durch jüngste Funktionserweiterungen nun auch Job-Scheduling, virtuelle Akteure und verbesserte Sicherheit unterstützt.
    • Sicherheitsorientierte Konfigurationen wie mTLS und distroless Images wurden ausgebaut, zudem kommen kontinuierlich weitere Building Blocks hinzu.
    • Wird im Team stabil eingesetzt, und auch die weitere Entwicklung erscheint vielversprechend.
  • Grafana Alloy

    • Früher unter dem Namen Grafana Agent bekannt, ist dies ein Open-Source-Tool, das die Rolle eines OpenTelemetry Collectors übernimmt.
    • Es wurde als einheitlicher Telemetrie-Collector konzipiert, der Logs, Metriken und Traces gleichermaßen erfassen kann.
    • Unterstützt OpenTelemetry-, Prometheus- und Datadog-Formate.
    • Seit dem Ende von Promtail entwickelt es sich besonders bei der Log-Erfassung zu einer starken Option.
  • Grafana Loki

    • Ein horizontal skalierbares, hochverfügbares Log-Aggregationssystem, das nur Metadaten indexiert und so Speicherkosten und Betriebsaufwand reduziert.
    • Speichert Logs auf Block-Storage-Basis wie S3, GCS und Azure Blob Storage.
    • Integriert sich mit Grafana und Grafana Alloy und bietet zusätzlich OpenTelemetry-Support sowie Multi-Tenancy-Funktionen.
    • Enthält außerdem Schutzmechanismen gegen unkontrollierte Auswirkungen zwischen Tenants (shuffle-sharding).
  • Grafana Tempo

    • Ein performantes Backend für Distributed Tracing, das offene Standards wie OpenTelemetry unterstützt.
    • Speichert Daten in einem spaltenorientierten Format auf Basis von Apache Parquet, was eine hohe Query-Performance ermöglicht.
    • Die Erkundung von Tracing-Daten ist über TraceQL und die CLI möglich.
    • Unser Team nutzt Tempo auf GKE im Self-Hosting zusammen mit MinIO und OpenTelemetry.
  • Railway

    • Eine Full-Stack-PaaS-Plattform als Alternative zu Heroku und Vercel, die von der GitHub-/Docker-Integration über Deployment bis hin zur betrieblichen Sichtbarkeit alles unterstützt.
    • Unterstützt die meisten wichtigen Frameworks und Datenbanken sowie containerbasierte Deployments.
    • Ein Kostenvergleich ist zwar nötig, insgesamt bietet die Plattform aber gute Erfahrungen in Bezug auf Deployment und Betriebsstabilität.
  • Unblocked

    • Ein KI-Teamassistent, der sich mit Codebases, Dokumentation sowie Projektmanagement- und Kommunikationstools verbinden lässt.
    • Bietet Antworten auf Fragen zu geschäftlichen und technischen Konzepten, Architekturdesigns und operativen Prozessen.
    • Besonders nützlich für die Navigation in komplexen oder Legacy-Systemen und gut geeignet für Teams, die schnellen Zugriff auf Kontextinformationen priorisieren.
    • Für Codegenerierung oder Automatisierung sind spezialisierte KI-Agenten besser geeignet.
  • Weights & Biases

    • Wurde um stärkere LLM-zentrierte Funktionen erweitert, darunter Systembewertung, benutzerdefinierte Metriken und die Weave-Plattform, die LLMs als Evaluatoren nutzt.
    • Eignet sich gut für Performance-Tracking und Debugging von Agentensystemen sowie für das Sammeln von Feedback und das Tuning von Modellen.
    • Ist passend für Performance-Optimierung auf lokaler und globaler Ebene sowie für iterative Entwicklungs-Workflows.

Assess (Zur Evaluierung)

  • Arize Phoenix

    • Mit der Zunahme von LLM- und agentenbasierten Anwendungen wächst auch die Bedeutung von LLM-Observability.
    • Arize Phoenix bietet Funktionen für LLM-Tracing, Evaluierung und Prompt-Management und integriert sich nahtlos in wichtige LLM-Plattformen und Frameworks.
    • Die Analyse von Ausgaben, Latenzzeiten und Token-Verbrauch ist mit nur geringem Einrichtungsaufwand möglich.
    • Derzeit wird zwar nur die Open-Source-Version genutzt, die vollständige Arize-Plattform bietet jedoch zusätzliche Funktionen und ist eine nähere Evaluierung wert.
  • Chainloop

    • Eine Open-Source-Plattform für die Sicherheit der Software-Lieferkette, die es Sicherheitsteams ermöglicht, Richtlinien zu definieren, die Entwicklungsteams dann in CI/CD-Pipelines einhalten können.
    • Über die CLI sammelt und validiert sie Sicherheitsartefakte wie SBOMs und Schwachstellenberichte und prüft automatisch die Einhaltung von Richtlinien.
    • Verwendet OPA Rego als Richtliniensprache und kann Standards wie das CycloneDX-Format validieren.
    • Bietet durch konsistente Security-Compliance und auditierbare Workflows eine Umgebung für das Metadatenmanagement auf dem Niveau von SLSA Level 3.
  • DeepSeek R1

    • Die erste Reihe von Reasoning-Modellen von DeepSeek, die durch MLA, MoE-Gating, FP8-Training und PTX-Optimierung die Hardwareauslastung maximiert.
    • DeepSeek-R1-Zero ist ein innovatives Modell, das Reasoning-Fähigkeiten allein durch einfaches Reinforcement Learning erlangt hat.
    • Alle Modelle werden mit Open Weights bereitgestellt, und DeepSeek-R1-Distill-Qwen-32B zeigt in verschiedenen Benchmarks eine bessere Leistung als OpenAI o1-mini.
    • Der Trainingscode und die Daten sind zwar nicht öffentlich, im Repository sind jedoch verschiedene vortrainierte Modelle enthalten.
  • Deno

    • Eine von Ryan Dahl, dem Schöpfer von Node.js, entwickelte Plattform, die Schwächen von Node.js in mehreren Punkten verbessert, darunter Security-Sandboxing, Dependency-Management und native TypeScript-Unterstützung.
    • Seit Deno 2 besteht Kompatibilität mit Node.js- und npm-Bibliotheken, wodurch die Hürden für eine Migration geringer sind als zuvor.
    • Mit ausgebauter Standardbibliothek und verbessertem Tooling eignet sich Deno gut für serverseitige TypeScript-Entwicklung.
    • Bei der Wahl der Plattform sollte Deno jedoch nicht allein aus dem Wunsch heraus gewählt werden, Mehrsprachigkeit zu vermeiden.
  • Graphiti

    • Erstellt zeitbewusste Wissensgraphen, um Beziehungen zwischen sich kontinuierlich verändernden Daten nachzuverfolgen.
    • Verarbeitet strukturierte und unstrukturierte Daten als zeitbasierte Episoden und unterstützt Abfragen, die Zeit, Text, Semantik und Graph-Algorithmen kombinieren.
    • Trägt in GraphRAG-basierten Anwendungen zur Verbesserung der Genauigkeit bei der Informationssuche bei.
    • Ermöglicht Langzeitgedächtnis und zustandsbasiertes Reasoning in RAG- und agentenbasierten LLM-Systemen.
  • Helicone

    • Eine Open-Source-orientierte LLMOps-Plattform für LLM-Kostenmanagement, ROI-Bewertung und Risikominderung.
    • Unterstützt den gesamten LLM-Lebenszyklus, einschließlich Prompt-Experimenten, Monitoring, Debugging und Optimierung.
    • Ermöglicht Echtzeit-Tracking und Analysen von Kosten, Auslastung, Performance und Agenten-Stacks über verschiedene LLM-Anbieter hinweg.
    • Die Funktionen sind leistungsstark, die Plattform befindet sich jedoch noch in einer frühen Phase, sodass für die Nutzung fortgeschrittener Funktionen ein gewisses Maß an Fachkenntnis erforderlich ist.
    • Die bisherigen Nutzungserfahrungen sind positiv.
  • Humanloop

    • Eine Plattform mit Fokus darauf, AI-Systeme durch die Einbindung menschlichen Feedbacks zuverlässiger und flexibler zu machen
    • Bietet Labeling, Active Learning, Fine-Tuning mit Human-in-the-Loop sowie Evaluierungstools auf Basis geschäftlicher Anforderungen
    • Enthält gemeinsam nutzbare Workspaces für die Zusammenarbeit, versionierte Prompts und CI/CD-Integrationen
    • Verfügt zudem über Observability-Funktionen wie Tracing, Logging, Alerts und Guardrails
    • Eignet sich für den Aufbau verantwortungsvoller AI in stark regulierten Umgebungen
  • Model Context Protocol (MCP)

    • Ein von Anthropic vorgeschlagener Open-Standard, der so konzipiert ist, dass AI-Tools den Kontext bestehender Systeme leicht nutzen können
    • Standardisiert die Integration von Informationen aus Wikis, Issue-Trackern, Datenbanken und ähnlichen Quellen mit AI
    • Besteht aus einer MCP-Server-/Client-Struktur; üblich ist der lokale Betrieb als Python- oder Node-Prozess
    • Derzeit vor allem auf technische Nutzer ausgerichtet; für Nicht-Entwickler bestehen Hürden bei Zugänglichkeit, Governance und Update-Management
    • Langfristig besteht großes Potenzial für eine Weiterentwicklung zu einem nutzerfreundlichen Ökosystem
  • Open WebUI

    • Eine Open-Source-Self-Hosting-AI-Plattform, die sich mit verschiedenen Modellen und APIs verbinden lässt, darunter OpenAI-kompatible APIs, OpenRouter und GroqCloud
    • Über Ollama lassen sich lokale oder eigene Modelle ausführen; die Nutzung ist auch in Offline-Umgebungen möglich
    • Bietet mit integrierten RAG-Funktionen eine dokumentenbasierte Chat-Oberfläche
    • Ermöglicht auf RBAC-Basis die Steuerung des Zugriffs auf Modelle und Funktionen nach Nutzergruppen
    • Kann über Python-basierte Functions erweitert werden und enthält auch Funktionen zur LLM-Evaluierung
    • Lässt sich flexibel vom persönlichen Einsatz über Teamkollaboration bis hin zur Enterprise-Plattform skalieren
  • pg_mooncake

    • Eine PostgreSQL-Erweiterung, die spaltenorientierte Speicherung und vektorisierte Ausführung unterstützt
    • Daten können in den Formaten Iceberg und Delta Lake lokal oder in S3-kompatiblem Storage gespeichert werden
    • Das Laden von Daten aus verschiedenen Formaten wie Parquet, CSV und Hugging Face-Datensätzen ist möglich
    • Eignet sich für Umgebungen, die hochperformante Datenanalyse benötigen, ohne einen separaten spaltenorientierten Speicher einzuführen
  • Reasoning models

    • „Reasoning Models“, die bei Mathematik, Coding und ähnlichen Aufgaben Leistungen auf menschlichem Niveau zeigen, gehören zu den derzeit meistbeachteten AI-Fortschritten
    • Fähigkeiten wie CoT (Chain of Thought), ToT (Tree of Thoughts) und Self-correction sind weiter ausgebaut
    • Es sind verschiedene Modelle erschienen, darunter OpenAI o1/o3, DeepSeek R1 und Gemini 2.0 Flash Thinking
    • Wegen langsamerer Antwortzeiten und höherem Token-Verbrauch werden sie auch als „Slow AI“ bezeichnet
    • Sie eignen sich eher für komplexe Problemlösung oder erklärbare Ergebnisse in STEM-Bereichen als für einfache Aufgaben
  • Restate

    • Eine Plattform zur Ausführung langlebiger Workflows ähnlich wie Temporal, entwickelt von den Gründern von Apache Flink
    • Ist in Rust geschrieben und wird als einzelnes Binary ausgeliefert
    • Gewährleistet Datenhaltbarkeit auch in Ausfallsituationen durch einen flexiblen Paxos-basierten virtuellen Konsensalgorithmus
    • Bietet SDKs für Java, Go, Rust und TypeScript
    • Wenn sich verteilte Transaktionen nicht vermeiden lassen, ist diese Plattform eine Überlegung wert
  • Supabase

    • Eine Open-Source-Alternative zu Firebase, die die Backend-Entwicklung mit Skalierbarkeit und Sicherheit unterstützt
    • Basiert auf PostgreSQL und bietet zahlreiche Funktionen wie Authentifizierung, Realtime-Subscriptions, APIs, Edge Functions und Vector Embeddings
    • Bei Prototyping oder MVP-Entwicklung ist eine spätere Migration auf SQL-Lösungen vergleichsweise einfach
  • Synthesized

    • Eine Plattform zur Erzeugung realistischer Testdaten für Entwicklungs- und Testumgebungen
    • Kann bestehende Daten maskieren oder statistisch aussagekräftige synthetic data erzeugen
    • Lässt sich in Build-Pipelines integrieren und unterstützt irreversible Anonymisierung pro Attribut, etwa durch Hashing oder Randomisierung
    • Auch die Erzeugung großer Datenmengen für Performance-Tests ist möglich; hervorzuheben ist der Fokus auf praktische Problemlösung
  • Tonic.ai

    • Eine Plattform, die ähnlich wie Synthesized realistische de-identifizierte synthetic data erzeugt
    • Unterstützt sowohl strukturierte als auch unstrukturierte Daten und gewährleistet Datenschutz durch Verfahren der differential privacy
    • Bietet automatische Erkennung und Entfernung sensibler Informationen, Ephemeral DB sowie die Funktion Tonic Textual für RAG-Systeme
    • Eignet sich für Teams, die gleichzeitig die Engineering-Geschwindigkeit erhöhen und Anforderungen an den Datenschutz erfüllen wollen
  • turbopuffer

    • Eine serverlose Multi-Tenant-Suchmaschine, die vektorbasierte und Full-Text-Suche auf Basis von Object Storage unterstützt
    • Kennzeichnend ist ein auf Haltbarkeit, Skalierbarkeit und Kosteneffizienz ausgerichtetes Design; die Query-Nodes sind zustandslos aufgebaut
    • Bietet geringe Latenz durch Caching von Cold-Query-Ergebnissen auf NVMe-SSDs und das Vorhalten häufig abgefragter Daten im Arbeitsspeicher
    • Eignet sich für RAG-basierte AI und die Suche in großen Dokumentbeständen, ist derzeit aber nur per Einladung nutzbar
  • VectorChord

    • Ein als Nachfolger von pgvecto.rs entwickeltes Erweiterungsmodul für PostgreSQL zur Vektor-Ähnlichkeitssuche
    • Ist mit dem pgvector-Typ kompatibel und bietet durch IVF-Indexierung und RaBitQ-Quantisierung schnelle Vektorsuche mit geringem Rechenaufwand
    • Ist in das PostgreSQL-Ökosystem integriert, sodass Vektorsuche und Transaktionen gleichzeitig ausgeführt werden können
    • Befindet sich noch in einer frühen Phase, ist aber als Alternative für hochperformante Vektorsuche einen Blick wert

Hold (zurückstellen empfohlen)

  • Tyk Hybrid API Management (Tyk hybrid API management)
    • Die Kombination aus gemanagter Control Plane und selbstverwalteter Data Plane bietet Flexibilität für Multi-Cloud- oder Hybrid-Cloud-Umgebungen
    • Allerdings traten Probleme mit mangelnder Observability auf, etwa als ein Incident in der AWS-basierten Control Plane von Tyk intern früher erkannt wurde als von Tyk selbst
    • Ticketbasierter Support ist für dringende Incident-Situationen ungeeignet; zudem gibt es Rückmeldungen über langsame Reaktionszeiten
    • Die offizielle Dokumentation ist noch nicht ausgereift genug, was die Lösung von Problemen in komplexen Umgebungen erschwert
    • Auch das Enterprise-Developer-Portal weist Probleme bei der Kompatibilität mit früheren Versionen sowie Einschränkungen bei der Anpassbarkeit auf
    • Besonders in Hybrid-Konfigurationen ist eine vorsichtige Einführung ratsam; eine kontinuierliche Beobachtung des Reifegrads ist erforderlich

Tools

Adopt (Einführung empfohlen)

  • Renovate

    • Ein Tool zur Automatisierung des Dependency-Versionsmanagements, das von vielen Teams bevorzugt wird
    • Auf GitHub ist Dependabot der Standard, Renovate ist jedoch umfassender und besser anpassbar
    • Besonders effektiv ist es, wenn man es so konfiguriert, dass es Dependencies in Tooling, Infrastruktur sowie internen und privaten Repositories überwacht
    • Um Developer Fatigue zu reduzieren, kann auch das automatische Mergen von Dependency-PRs erwogen werden
  • uv

    • Ein in Rust geschriebenes Python-Tool der nächsten Generation für Paket- und Projektmanagement, dessen größter Vorteil die sehr hohe Geschwindigkeit ist
    • Vereint bestehende Python-Tools wie Poetry, pyenv und pipx und beschleunigt Build- und Testprozesse erheblich
    • Eine ausgereifte Community und langfristige Unterstützung des Ökosystems sind wichtig, dennoch ist es derzeit das von Entwicklern am häufigsten empfohlene Tool
    • Besonders geeignet für Datenteams, die sich vom bisherigen Python-Paketsystem lösen möchten
  • Vite

    • Ein hochperformantes Frontend-Build-Tool, das schnelles Hot Reloading und eine effiziente Entwicklungsumgebung bietet
    • Wird in Vue, SvelteKit, React und anderen Frameworks als Standardwerkzeug eingesetzt; Create React App verlagert sich in Richtung Vite
    • Mit der Gründung der spezialisierten Organisation VoidZero sind langfristige Projektkontinuität und Weiterentwicklung besser abgesichert

Trial (testen)

  • Claude Sonnet

    • Ein fortschrittliches Sprachmodell, das in vielen Bereichen starke Leistung zeigt, darunter Coding, Schreiben, Analyse und bildbasierte Aufgaben
    • Lässt sich in Browser, Terminal, wichtige IDEs und GitHub Copilot integrieren und unterstützt auch die Interpretation von Diagrammen sowie das Extrahieren von Text aus Bildern
    • Über die Funktion „Artifacts“ in der Browser-UI kann mit erzeugtem Code und HTML interagiert werden
    • Version 3.5 zeigt insbesondere bei Architekturdesign und kollaborativen Projekten deutliche Produktivitätssteigerungen
    • Claude 3.7 wurde zwar veröffentlicht, befindet sich hinsichtlich der Praxistauglichkeit aber noch in der Evaluierung
  • Cline

    • Eine Open-Source-Erweiterung für VSCode und ein leistungsfähiges Werkzeug zur Umsetzung beaufsichtigter Software-Agenten
    • Bietet fortgeschrittene Funktionen wie den Plan-&-Act-Modus, MCP-Integration und transparentes Tracking des Token-Verbrauchs
    • Zeigt zusammen mit Claude 3.5 Sonnet starke Leistung bei großen Codebasen, browserloser Testautomatisierung und automatischer Fehlerbehebung
    • Stärkt den Datenschutz durch lokale Datenspeicherung und hat Entwicklungspotenzial auf Basis der Open-Source-Community
    • Auf Token-Kosten und API-Rate-Limits ist zu achten; die Nutzung alternativer API-Anbieter wie OpenRouter wird empfohlen
  • Cursor

    • Ein KI-zentrierter Code-Editor, der fortgeschrittene Kontextanpassung und eine benutzerfreundliche Erfahrung bietet
    • Kann über den API-Key des Nutzers verschiedene Modelle anbinden und integriert git diff, frühere Gespräche, Websuche, Bibliotheksdokumentation und MCP in den Kontext
    • Implementierungsanweisungen können über die KI-Chat-Oberfläche gegeben werden; Dateien werden automatisch geändert und Befehle ausgeführt
    • Enthält auch eine Funktion zur automatischen Behebung erkannter Lint- und Kompilierungsfehler
  • D2

    • Ein Open-Source-Diagram-as-Code-Tool, mit dem sich Diagramme über textbasierte Skripte erstellen lassen
    • Nutzt Layout-Engines wie Mermaid und bietet eine einfache, deklarative D2-Syntax
    • Die auf Lesbarkeit ausgelegte Syntax eignet sich gut für Softwaredokumentation und Architekturdiagramme
  • Databricks Delta Live Tables (DLT)

    • Ein deklaratives Tool zur Verwaltung von Datenpipelines, das sowohl Echtzeit-Streaming als auch Batch-Verarbeitung unterstützt
    • Vereinfacht wiederkehrende Data-Engineering-Aufgaben wie die Automatisierung von Checkpoints und reduziert so den operativen Aufwand
    • Über materialized views ist eine Leistungsoptimierung möglich
    • Tabellen werden jedoch auf Pipeline-Ebene verwaltet, und Streaming-Tabellen haben eine Append-only-Struktur, weshalb bei der Architektur Sorgfalt nötig ist
    • Dass beim Löschen einer DLT-Pipeline auch Tabellen und Daten mit gelöscht werden, stellt ein operatives Risiko dar
  • JSON Crack

    • Eine VSCode-Erweiterung, die Textdaten wie JSON, YAML, TOML und XML als interaktive Graphen visualisiert
    • Anders als Mermaid oder D2 dient es als Visualisierungstool zur Datenexploration; mit Funktionen zum Ausblenden von Knoten und Branches ist es für die Erkundung von Datensätzen nützlich
    • Es gibt auch ein webbasiertes Tool, bei Online-Abhängigkeiten ist jedoch Vorsicht geboten
    • Die Anzahl der Knoten ist begrenzt; für größere Datensätze wird auf eine kommerzielle Version hingeführt
  • MailSlurp

    • Ein API-Dienst für die Automatisierung von E-Mail- und SMS-basierten Tests
    • Bietet Funktionen wie das Erzeugen temporärer Postfächer und Telefonnummern, E-Mail-Validierung, automatische Antworten und Weiterleitung
    • Über REST API und ein No-Code-Dashboard lässt sich auch die Vorbereitung manueller Tests einfach durchführen
    • Eignet sich für Produkte zum Kunden-Onboarding und für die Entwicklung von Test-Workflows
  • Metabase

    • Ein Open-Source-Analyse- und Business-Intelligence-Tool, mit dem sich aus verschiedenen Datenquellen Visualisierungen, Berichte und Dashboards erstellen lassen
    • Über das SDK können interaktive Dashboards in Webanwendungen eingebettet werden
    • Unterstützt sowohl relationale als auch NoSQL-Datenbanken und bietet eine Vielzahl offizieller sowie Community-Connectoren
    • Als leichtgewichtiges BI-Tool ist es für die Verwaltung von Dashboards und Berichten nützlich
  • NeMo Guardrails

    • Ein Open-Source-Toolkit von NVIDIA, mit dem sich Sicherheits-Guardrails auf LLM-basierte dialogorientierte Anwendungen anwenden lassen
    • Unterstützt Colang 2.0 und ergänzt verschiedene Integrationen wie AutoAlign und Patronus Lynx
    • Enthält NIM-Microservices für Content-Sicherheit, Topic-Steuerung und Prompt-Sicherheit
    • Auch Leistungsverbesserungen wie die Unterstützung für Streaming-LLM-Ausgaben wurden umgesetzt
    • Mit der Zunahme von Einsätzen in realen Services wurde es auf Trial hochgestuft
  • Nyx

    • Ein sprach- und plattformunabhängiges Tool zur Automatisierung semantischer Releases
    • Besonders gut für Trunk-based Development geeignet und unterstützt verschiedene Workflows wie Gitflow, OneFlow und GitHub Flow
    • Bietet automatische Changelog-Erstellung auf Basis von Conventional Commits
    • Bei Strategien mit langlebigen Branches ist weiterhin Vorsicht geboten
  • OpenRewrite

    • Ein Tool zur Automatisierung großflächiger Refactorings, nützlich für API-Versions-Upgrades oder serviceweite Updates auf Basis gemeinsamer Templates
    • Erweitert die Unterstützung über Java hinaus auf Sprachen wie JavaScript
    • Ist bei standardisierten Änderungen stabiler und effizienter als KI-Code-Assistenten
    • Bietet verschiedene Recipes (Transformationsregeln) und Plugins für Build-Tools, die alle als Open Source veröffentlicht werden
  • Plerion

    • Eine auf AWS ausgerichtete Cloud-Sicherheitsplattform, die Risikoerkennung und Priorisierung über Infrastruktur, Server und Anwendungen hinweg bietet
    • Unterstützt ähnlich wie Wiz dabei, sich auf das „wichtige 1 %“ zu konzentrieren
    • Erhöht die Sicherheitsvisibilität für Kunden und unterstreicht die Bedeutung proaktiver Sicherheitsüberwachung
  • Software-Engineering-Agenten (Software engineering agents)

    • Vollautonome Coding-Agenten sind weiterhin nicht praxistauglich, doch beaufsichtigte Agentenmodi innerhalb der IDE entwickeln sich rasant
    • Entwickler steuern die Umsetzung über Chat-Oberflächen, während die KI Änderungen über mehrere Dateien hinweg, Testausführung sowie die Behandlung von Lint- und Kompilierungsfehlern übernimmt
    • Sie werden als CHOP (Chat-Oriented Programming) oder Prompt-to-Code bezeichnet und übernehmen mehr Verantwortung als klassische Autocomplete-Hilfen
    • Cursor, Cline und Windsurf sind hier führend, und die Kombination mit Modellen der Claude-Sonnet-Reihe zeigt besonders gute Ergebnisse
    • Der Produktivitätsgewinn ist besonders groß, wenn der Problemumfang klein gehalten wird und in strukturierten Codebasen gearbeitet wird
    • Beim Einsatz auf Produktionscode sollten Prüfverfahren wie Pair Programming parallel eingesetzt werden
  • Tuple

    • Ein Tool für Remote Pair Programming, das als Alternative zu Screenhero von Slack gestartet ist
    • Unterstützt inzwischen auch Windows, bietet stärkere Privatsphäre-Einstellungen und die Möglichkeit, bestimmte App-Fenster auszublenden
    • Durch UI-Verbesserungen ist nun auch die Zusammenarbeit an Inhalten außerhalb der IDE möglich
    • Da die Gegenstelle aus der Ferne auf den gesamten Desktop zugreifen kann, bestehen Sicherheitsbedenken → vor der Nutzung werden Privatsphäre-Einstellungen und Team-Schulungen empfohlen
    • Dank intuitiver UX und geringer Latenz ist es als Tool für Remote Pairing praxistauglich
  • Turborepo

    • Ein Tool zur Build-Optimierung für große JavaScript/TypeScript-Monorepos, das durch Abhängigkeitsanalyse, Caching und parallele Ausführung die Build-Geschwindigkeit erhöht
    • Anders als Nx erlaubt es projektbezogene package.json-Dateien und damit vorübergehend mehrere Versionen von Abhängigkeiten
    • Das kann beim Umstieg von mehreren Repositories auf ein Monorepo nützlich sein
    • Die Konfiguration ist einfach, und auch in großen Projekten zeigt es stabile Leistung

Assess (weitere Prüfung nötig)

  • AnythingLLM

    • Eine Open-Source-Desktop-Anwendung zur Interaktion mit großen Dokumenten oder Inhalten, die sich mit verschiedenen LLMs und Vektor-Datenbanken integrieren lässt
    • Ist auch mit Open-Weight-Modellen auf Basis von Ollama kompatibel, und Embedding-Modelle können pluginbasiert konfiguriert werden
    • Neben RAG lassen sich auch verschiedene Skills als Agenten konfigurieren, um benutzerdefinierte Workflows auszuführen
    • Verwaltet Dokumente und Gesprächsverläufe pro Workspace und kann inzwischen auch als Multi-User-Web-App bereitgestellt werden
    • Wird auch als lokales Tool für persönliche Assistenten nützlich eingesetzt
  • Gemma Scope

    • Ein Tool zur mechanistischen Interpretierbarkeit, das helfen soll, die internen Abläufe von LLMs zu verstehen, und offene Modelle der Gemma2-Familie analysieren kann
    • Hilft dabei, Ursachen für Halluzinationen, Bias und anomale Ausgaben zu verstehen und zu debuggen
    • Seine Bedeutung wächst nicht nur für Forschende, sondern auch, weil das Training eigener Modelle für Unternehmen zunehmend eine realistische Option wird
  • Hurl

    • Ein Tool, mit dem sich Sequenzen von HTTP-Anfragen in einfachen Textdateien definieren und ausführen lassen; nützlich für Automatisierung und Tests
    • Bietet Funktionen wie die Prüfung von Statuscodes, Response-Headern und -Bodies sowie Datenextraktion und Variabilisierung
    • Kann Berichte im HTML- und JSON-Format erzeugen, und Testdefinitionen lassen sich im Code-Repository mitführen
    • Geeignet, wenn ein leichteres und einfacheres API-Test-Tool als GUI-Werkzeuge wie Postman oder Bruno benötigt wird
  • Jujutsu

    • Ein verteiltes Versionsverwaltungssystem, das Git als Backend nutzt und dabei einen eigenen Workflow sowie eine verbesserte Benutzerfreundlichkeit bietet
    • Kompatibel mit Git-Servern und -Diensten und bietet einfacheres, intuitiveres Branching und bessere Konfliktlösung
    • Richtet sich sowohl an Einsteiger als auch an fortgeschrittene Nutzer und zeichnet sich durch eine intuitive, leistungsstarke UX aus
    • Besonders die hervorragende Konfliktlösung wird sehr positiv bewertet
  • kubenetmon

    • Ein von ClickHouse als Open Source veröffentlichtes Tool zur Überwachung des Kubernetes-Netzwerkverkehrs
    • Ermöglicht detaillierte Messungen von Datenübertragungsvolumen und -kosten in Multi-Cloud-Umgebungen
    • Wenn in Kubernetes-basierter Infrastruktur unerwartete Kosten für Datenübertragung zum Problem werden, ist ein Einsatz erwägenswert
  • Mergiraf

    • Ein Git-Merge-Driver, der Merge-Konflikte auf Basis des Syntaxbaums (AST) von Code auflöst
    • Besonders effektiv bei komplexen Merge-Konflikten, die durch lange Änderungshistorien oder AI-generierten Code entstehen
    • Arbeitet präziser als der standardmäßige zeilenbasierte Merge-Ansatz von Git und kann auch für Auto-Merge und cherry-pick eingesetzt werden
    • Kann für Teams nützlich sein, die komplexe Git-Workflows wie lange Feature-Branches verwenden
  • ModernBERT

    • Eine Next-Generation-NLP-Modellreihe auf Basis eines Encoder-only-Transformers als Nachfolger von BERT
    • Überwindet mit Alternating Attention die Begrenzung der Kontextlänge und verbessert Genauigkeit und Performance gegenüber klassischem BERT
    • Sollte vorrangig in Betracht gezogen werden, wenn statt eines universellen generativen Modells ein auf NLP spezialisiertes Modell benötigt wird
  • OpenRouter

    • Eine Plattform, die verschiedene LLM-Anbieter über eine einzige API bündelt und so Experimente sowie Kostenoptimierung unterstützt
    • Kann Anfragen an unterschiedliche Modelle wie Claude, OpenAI und Mistral weiterleiten und bietet auch Funktionen zum Umgehen von API-Rate-Limits
    • Da diese Struktur jedoch mit Preisaufschlägen verbunden ist, sollte sie nur erwogen werden, wenn ein Wechsel zwischen mehreren Modellen wirklich nötig ist
  • Redactive

    • Eine Enterprise-Plattform, die den sicheren Aufbau von RAG-basierten AI-Assistenten in regulierten Umgebungen unterstützt
    • Integriert sich unter anderem mit Confluence, erstellt dokumentbasierte Indizes und berücksichtigt Benutzerrechte in Echtzeit
    • Stellt sicher, dass nur für das Modell freigegebene Informationen offengelegt werden, und schafft ein ausgewogenes Verhältnis zwischen Sicherheit und Zugänglichkeit
  • System Initiative

    • Ein experimentelles DevOps-Tool, das sich von klassischen Infrastructure-as-Code-Ansätzen unterscheidet und kürzlich als Open Source veröffentlicht wurde (Apache 2.0)
    • Wird bereits in Produktivumgebungen genutzt, braucht aber noch Zeit, um auf Enterprise-Niveau zu skalieren
    • Einen Versuch wert, wenn man einen anderen Ansatz als bei etablierten DevOps-Tools kennenlernen möchte
  • TabPFN

    • Ein transformerbasiertes Klassifikationsmodell, das für kleine tabellarische Datensätze optimiert ist
    • Das vortrainierte Modell generalisiert auf Basis von Millionen synthetischer Datensätze
    • Liefert schnelle und präzise Ergebnisse ohne Hyperparameter-Tuning und ist robust gegenüber fehlenden Werten und Ausreißern
    • Für große Datensätze oder Regressionsprobleme ist es nicht geeignet
  • v0 (by Vercel)

    • Ein AI-Tool, das auf Basis von Screenshots, Figma-Designs und Prompts Frontend-Code generiert
    • Unterstützt verschiedene Frameworks wie React, Vue, Tailwind und shadcn; der generierte Code kann direkt deployt werden
    • Hat zwar Grenzen bei der vollständigen Umsetzung komplexer Apps, ist aber nützlich für frühe Prototypen oder als Ausgangspunkt für UI-Entwicklung
  • Windsurf

    • Ein von Codeium entwickelter AI-Coding-Assistent, der eine agentenbasierte Entwicklungsumgebung ähnlich wie Cursor und Cline bietet
    • Seine Ausführungsfähigkeiten werden durch Browser-DOM-Navigation, Konsolenzugriff und Websuche erweitert
    • Unterstützt verschiedene Modelle und bietet zudem starke Kontextfunktionen wie MCP und Dokumentreferenzen
  • YOLO (You Only Look Once)

    • Ein leistungsstarkes, leichtgewichtiges Modell für verschiedene Computer-Vision-Aufgaben wie Echtzeit-Bildklassifikation, Objekterkennung, Pose Estimation und Segmentierung
    • Die aktuelle Version YOLO11 verbessert Präzision und Verarbeitungseffizienz weiter und eignet sich dadurch auch für Edge Devices
    • Erinnert daran, dass für bestimmte Vision-Aufgaben klassische CV-Modelle besser geeignet sein können als LLMs

Sprachen und Frameworks (Languages and Frameworks)

Adopt (zur Einführung empfohlen)

  • OpenTelemetry

    • Etabliert sich schnell als Industriestandard für Observability
    • Mit der OTLP(OpenTelemetry Protocol)-Spezifikation lassen sich Trace-, Metrik- und Log-Daten in einem Standardformat verarbeiten
    • Reduziert Vendor Lock-in und integriert sich mit wichtigen Tools wie Datadog, New Relic und Grafana
    • Unterstützt gzip- und zstd-Komprimierung, was die Effizienz bei großen Datenübertragungen erhöht, und eignet sich gut für Microservice-Umgebungen
    • Durch den Ausbau von Log- und Profiling-Unterstützung wird Full-Stack-Observability noch einfacher
  • React Hook Form

    • Eine Alternative zu Formik, die standardmäßig uncontrolled Komponenten nutzt und dadurch sehr performant ist
    • Lässt sich leicht mit schemabasierten Validierungsbibliotheken wie Yup und Zod integrieren
    • Integriert sich auch gut in bestehende Codebases sowie externe Komponentenbibliotheken wie shadcn und AntD
    • Eine stabile und flexible Wahl für große Formulare oder formularzentrierte Anwendungen

Trial (zum Testen)

  • Effect

    • Eine funktionale Programmbibliothek für TypeScript, die die Implementierung asynchroner und synchroner Programme vereinfacht
    • Kann komplexe Logik wie State Management, Fehlerbehandlung und Concurrency mit Typsicherheit abbilden
    • Bietet bessere Komponierbarkeit und Testbarkeit als klassische Ansätze mit Promise, async/await und try/catch
    • Liefert Abstraktionen, die sich für den alltäglichen Entwicklungsalltag besser eignen als das zuvor genutzte fp-ts
  • Hasura GraphQL Engine

    • Bietet Echtzeit-GraphQL-APIs für verschiedene Datenquellen wie PostgreSQL, MongoDB und ClickHouse
    • Wird in Datenproduktprojekten effektiv für die serverseitige Ressourcenintegration und den schnellen Aufbau von APIs eingesetzt
    • Federated Query und integriertes Schema-Management sind leistungsfähig, erfordern aber Vorsicht
    • Die kürzlich hinzugefügte PromptQL-Funktion ermöglicht natürliche Datenabfragen mit Unterstützung von LLMs
  • LangGraph

    • Ein graphbasiertes Orchestrierungs-Framework für zustandsbehaftete Multi-Agent-Anwendungen auf LLM-Basis
    • Bietet im Vergleich zu LangChain eine niedrigere Kontrollebene über Knoten und Kanten und ermöglicht dadurch anpassbare Workflows
    • Überzeugt bei vorhersehbarem State Management, Debugging, Wartbarkeit und Skalierbarkeit
    • Hat zwar eine gewisse Lernkurve, ist aber in Bezug auf Leichtgewichtigkeit und Modularität sehr leistungsfähig
  • MarkItDown

    • Ein CLI-Tool zur Umwandlung von Dokumenten wie PDF, HTML, Word und PowerPoint in Markdown
    • Nutzt die strukturellen Eigenschaften von Markdown, um die Genauigkeit der Dokumentverarbeitung und das Kontextverständnis von LLMs zu verbessern
    • Als Vorverarbeitung in RAG-Systemen verbessert es die Klarheit von Retrieval-Antworten erheblich
    • Ein nützliches Tool zur Steigerung der Entwicklerproduktivität, das auch häufig für Dokumentation verwendet wird
  • Module Federation

    • Ermöglicht das Teilen von Modulen zwischen Micro Frontends und reduziert doppelte Abhängigkeiten
    • Seit Version 2.0 funktioniert es unabhängig von Webpack und unterstützt Rspack, Vite, React, Angular und mehr
    • Kann große Webanwendungen so strukturieren, dass unabhängige Teams sie jeweils getrennt entwickeln, deployen und skalieren können
  • Prisma ORM

    • Ein Open-Source-Datenbank-Toolkit für Node.js- und TypeScript-Anwendungen
    • Datenmodelle lassen sich ohne Dekoratoren oder Klassen mit einfachen Objekten definieren; Typsicherheit und Portabilität sind hoch
    • Bietet automatische Migrationsfunktionen und eine intuitive Query-API
    • Passt auch gut zu funktionalen Programmierparadigmen und ist für TypeScript-Entwicklungsumgebungen optimiert

Assess (näher prüfen)

  • .NET Aspire

    • Ein .NET-basiertes Tool, das die Orchestrierung verteilter Anwendungen in lokalen Entwicklungsumgebungen vereinfacht
    • Kann mehrere .NET-Projekte, Datenbanken und Docker-Container mit einem einzigen Befehl starten
    • Bietet lokale Observability-Tools wie Logging, Tracing und Metrik-Dashboards, was Debugging und Developer Experience verbessert
  • Android XR SDK

    • Ein speziell für XR-Headsets entwickeltes Android-Betriebssystem und SDK, das Google in Zusammenarbeit mit Samsung und Qualcomm entwickelt hat
    • Unterstützt die meisten Android-Apps mit minimalen Anpassungen und eignet sich für neu entwickelte Spatial-Computing-Apps
    • Befindet sich derzeit im Developer-Preview-Status und wird als Standard-SDK für die Entwicklung räumlicher Apps positioniert
  • Browser Use

    • Eine Open-Source-Python-Bibliothek, mit der LLM-basierte KI-Agenten einen Webbrowser steuern können
    • Basiert auf Playwright und ermöglicht Automatisierung wie Navigation, Eingaben und Textextraktion
    • Unterstützt die Steuerung mehrerer Tabs und Koordinationsaufgaben zwischen Web-Apps, was sie in Multi-Agent-Workflows nützlich macht
  • CrewAI

    • Eine Plattform für Agentenmanagement und -orchestrierung, mit der mehrere Agenten kombiniert werden können, um komplexe Aufgaben auszuführen
    • Neben der Python-Bibliothek ist über eine Enterprise-Version auch die Integration mit externen Systemen wie SharePoint und JIRA möglich
    • Wird auf reale Business-Aufgaben wie die Validierung von Promotion-Codes, die Untersuchung fehlgeschlagener Transaktionen und die Automatisierung des Kundensupports angewendet
    • Für alle, die sich für den Aufbau agentenbasierter Systeme interessieren, sehr erkundenswert
  • ElysiaJS

    • Ein typsicheres TypeScript-Web-Framework, das für die Bun-Runtime optimiert ist und die Entwicklung von RESTful- und OpenAPI-artigen APIs ermöglicht
    • Erzwingt im Gegensatz zu tRPC keine API-Struktur und bietet gleichzeitig hohe Performance und Typsicherheit
    • Eignet sich für den Aufbau von BFFs (Backend-for-Frontend) und zielt auf Performance auf dem Niveau von Java oder Go ab
  • FastGraphRAG

    • Eine High-Performance-GraphRAG-Implementierung, die über Personalized PageRank nur relevante Knoten durchsucht und so Genauigkeit und Performance verbessert
    • Bietet Visualisierungsunterstützung und inkrementelle Updates und eignet sich daher für große dynamische Datensätze
    • Eine GraphRAG-Lösung, die zugleich die Qualität von LLM-Antworten verbessert und Ressourcen spart
  • Gleam

    • Eine statisch typisierte funktionale Sprache auf Basis von Erlang/OTP, die Laufzeitfehler reduziert und die Wartbarkeit verbessert
    • Bewahrt eine moderne Syntax und die Kompatibilität mit dem BEAM-Ökosystem (Erlang, Elixir)
    • Geeignet für Systeme, die hohe Nebenläufigkeit, Stabilität und Skalierbarkeit erfordern, insbesondere für Teams, die gegenüber klassischem Erlang mehr Typsicherheit benötigen

Assess (nähere Prüfung erforderlich)

  • GoFr

    • Ein auf Golang basierendes Microservices-Framework, das Logging, Tracing, Metriken, Konfigurationsmanagement und Swagger-Dokumentation standardmäßig unterstützt
    • Enthält Anbindungen an verschiedene Datenbanken sowie Kafka- und NATS-basiertes Pub/Sub und Funktionen zur Planung von Cron-Jobs
    • Ein produktivitätsorientiertes Tool, das wiederkehrende Arbeiten reduziert und mehr Fokus auf die Implementierung der Business-Logik ermöglicht
  • Java Post-Quantum Cryptography

    • Kryptografietechnologie für das Zeitalter der Quantencomputer, die in JDK 24 über JEP 496/497 erstmals unterstützt wird
    • Implementiert gitterbasierte kryptografische Algorithmen (KEM, digitale Signaturen) und eignet sich zum Schutz von Daten, bei denen langfristige Sicherheit wichtig ist
    • Es gibt auch liboqs von Open Quantum Safe, doch die native Java-Implementierung wird als wichtiger Fortschritt bewertet
  • Presidio

    • Ein Datenschutz-SDK, das sensible Informationen in strukturierten und unstrukturierten Texten identifiziert und anonymisiert
    • Erkennt PII-Elemente (Kreditkartennummern, Namen, Orte usw.) regelbasiert, per Regex und mittels NER
    • Ist stark anpassbar, doch da keine perfekte Erkennung garantiert ist, ist bei der Interpretation der Ergebnisse Vorsicht geboten
  • PydanticAI

    • Ein Framework zum Aufbau von LLM- und agentenbasierten Anwendungen, entwickelt vom Team hinter Pydantic
    • Zielt auf minimale Komplexität ab und bietet strukturierte Ausgabe-Verarbeitung, Integration wichtiger Model-APIs und graphbasierte Workflows
    • Geeignet für Entwickler, die übermäßige Abstraktion vermeiden und eine praktische, schlanke Struktur bevorzugen
  • Swift for Resource-Constrained Applications

    • Seit Swift 6.0 wurde die Unterstützung für verschiedene Betriebssysteme ausgebaut, wodurch der Einsatz auch in ressourcenbeschränkten Umgebungen realistischer wird
    • Bietet mit starker Typsicherheit und ARC-basierter Speicherverwaltung ein ausgewogenes Verhältnis von Performance und Stabilität
    • Ist zugänglicher als Rust, erfüllt aber Sicherheitszertifizierungsstandards (wie MISRA) noch nicht ausreichend, was den Einsatz in Umgebungen mit hohen Sicherheitsanforderungen einschränkt
  • Tamagui

    • Eine UI-Bibliothek, die die gemeinsame Nutzung von Styles zwischen React Web und React Native optimiert
    • Bietet ein Design-System und einen optimierten Compiler; im Web wird als Atomic CSS gerendert, nativ mit hoisted Styles
    • Nützlich, wenn bei plattformübergreifender UI-Entwicklung konsistente Styles und Performance-Optimierung gewünscht sind
  • torchtune

    • Eine PyTorch-basierte Bibliothek für LLMs, die Post-Training, Fine-Tuning und Inferenz-Experimente unterstützt
    • Unterstützt verteiltes Training auf Basis von FSDP2 sowie Single- und Multi-GPU-Umgebungen
    • YAML-basierte Recipes ermöglichen intuitive Experimente ohne komplexe Konfiguration, und per CLI lassen sich Model-Downloads und Experimente bequem ausführen

Hold (eher zurückstellen)

  • Node overload
    • Die übermäßige Wahl von Node.js ist weiterhin ein Problem; oft wird es ohne ernsthafte Prüfung von Alternativen eingesetzt
    • Für IO-zentrierte Aufgaben ist es weiterhin effizient, für rechenintensive oder datenlastige Aufgaben jedoch nicht gut geeignet
    • Mit der jüngsten Zunahme datenorientierter Workloads werden die Grenzen von Node.js noch deutlicher sichtbar
    • Die Vorliebe für einen Single-Language-Stack ist nachvollziehbar, dennoch empfehlen wir weiterhin einen Polyglot-Ansatz
    • Da es inzwischen viele alternative Frameworks mit besseren APIs und höherer Performance gibt, sollte der Einsatz von Node.js sorgfältig geprüft werden