20 Punkte von ashbyash 2025-07-23 | Noch keine Kommentare. | Auf WhatsApp teilen

AI-Engineering-Stack

1. Die 3-Schichten-Struktur des AI-Engineering-Stacks: Alle AI-Services werden auf drei Kernschichten aufgebaut.

1.1 Anwendungsentwicklung (Application Development)

  • Durch die Nutzung von Foundation Models kann heute praktisch jeder schnell AI-Apps entwickeln.
  • Die Differenzierung von Services hängt von Prompt-Design, UI/UX für Nutzer und Evaluierungssystemen ab.
  • Da viele Teams ähnliche Modelle verwenden, werden nutzerfreundliche Interfaces und Tools zur Automatisierung der Evaluierung immer wichtiger.

1.2 Modellentwicklung (Model Development)

  • Spezialisierung auf Bereiche wie Fine-tuning, Inference Optimization und Dataset Engineering.
  • Einsatz und Anpassung großer Modelle sowie das Aufkommen verschiedenster Open-Source-LLMs und multimodaler Modelle.
  • Zuverlässigkeit und Qualität sind entscheidend (z. B. offene Antwortbewertung, Qualitätsmanagement für Labels).

1.3 Infrastruktur (Infrastructure)

  • Modellbereitstellung, Betrieb großer GPU-Cluster, Skalierung von Services, Monitoring und Störfallbehebung.
  • Das Innovationstempo in der Infrastruktur ist vergleichsweise langsamer, hat aber enormen Einfluss auf Performance- und Kostenmanagement.

2. AI Engineering vs. ML Engineering: grundlegende Veränderungen

2.1 Wie Modelle genutzt werden

  • Klassisches ML: eigenes Modelltraining (Machine Learning from scratch).
  • Moderne AI: Aufruf und Nutzung vortrainierter großer Modelle (using pre-trained models) ist der Standard.
  • Evaluierung wird tendenziell wichtiger als Modellentwicklung, insbesondere bei offenen Ergebnissen.

2.2 Veränderungen bei Ressourcen und Engineering-Skills

  • Fähigkeiten zum Betrieb von GPU-Clustern mit Hunderten bis Tausenden GPUs (Scalable GPU infrastructure).
  • Für die Produktisierung im Live-Betrieb sind das Management großer Datenmengen und eine hocheffiziente Ressourcennutzung erforderlich.

2.3 Innovation bei der Evaluierung

  • Bewertung von Kurzantworten (closed-ended) → gefragt ist heute die Fähigkeit, mit offenen Ergebnissen (open-ended output) umzugehen.
  • Die Entwicklung automatischer und halbautomatischer Evaluierungssysteme (Auto evaluation system) nimmt stark zu.

3. Modellanpassung: Prompt vs. Fine-tuning

3.1 Prompt-basiert (Prompt-based)

  • Änderung des Verhaltens durch Prompt Engineering und Kontextmanagement (ohne Veränderung der internen Modellparameter).
  • Benötigt wenig Daten. Schnelle Experimente, geringe Kosten.
  • Grenze: Bei hochkomplexen Aufgaben und steigender Komplexität sinkt die Leistung.

3.2 Fine-tuning

  • Direkte Veränderung der Modellgewichte, benötigt große Datenmengen und eignet sich für Anforderungen an hohe Performance.
  • Kosten und Zeitaufwand steigen, langfristig verbessern sich jedoch Servicequalität, Geschwindigkeit und Kosten zugleich.

4. Die Ausdifferenzierung von „Training“

  • Pre-training: initialer Aufbau großer Foundation Models, wird nur von einigen wenigen sehr großen Unternehmen oder Institutionen durchgeführt.
  • Fine-tuning: maßgeschneidertes Training auf Basis bestehender Modellgewichte für bestimmte Probleme oder Kundendaten.
  • Post-training: der Begriff wird unterschiedlich verwendet, umfasst in der Praxis jedoch sowohl Fine-tuning als auch kontinuierliche Updates.

5. Dataset Engineering: der Bedeutungswandel von Daten

  • Verschiebung hin zu überwiegend unstrukturierten Daten (Text, Bilder, multimodal usw.).
  • Höhere Schwierigkeit beim Labeling: Für unvorhersehbare offene Ergebnisse ist dringend Know-how nötig.
  • Der Kern der Service-Differenzierung verlagert sich auf Daten: Der Besitz hochwertiger Datensätze wird unmittelbar zur Wettbewerbsfähigkeit.
  • Auch der Umgang mit Datenqualität, Ethik und Datenschutz (Privacy/Ethics) gewinnt an Bedeutung.

6. Trends in der Entwicklung von AI-Anwendungen

  • Da viele Organisationen dasselbe Modell (Foundation Model) verwenden,
    • werden Prompt Engineering (Eingabedesign),
    • Produktinterfaces (UI/UX, Chatbots, Web-Erweiterungen usw.)
    • und das Design von Nutzer-Feedback-Loops zu zentralen Faktoren.
  • Die Umsetzung schlanker AI-Services auf Edge-Geräten und Mobilplattformen eröffnet neue Chancen.

Veränderung des Entwicklungsansatzes:

  • Früher: Daten-/Modellentwurf → spätere Produktisierung
  • Heute: schnelles Produkt-Prototyping → bei Bedarf Investitionen in Daten/Modelle (Product first, Model/Data later)

7. AI vs. Full-Stack-Engineering: die Auflösung der Grenzen

  • Die Rolle von Frontend- sowie Web- und Mobile-Full-Stack-Entwicklern wird größer.
    • Die Fähigkeit, AI mit Interfaces zu verbinden, wird selbst zur Wettbewerbsstärke.
  • Im Zeitalter von Foundation Models und Plugins lassen sich AI-Services leicht auch ohne komplexes Backend launchen.
  • Nutzungsmuster: schnelles Prototyping → Nutzerfeedback → iterative Verbesserung.

8. Fazit und Ausblick

  • AI Engineering steht in Kontinuität zum klassischen ML Engineering, verlangt jedoch zugleich ein beispielloses Maß an Skalierbarkeit und Innovation.
  • Foundation Models und das Open-Source-AI-Ökosystem stehen im Zentrum dieses Wandels.
  • Im Zeitalter der Informationsüberflutung wächst der Bedarf an klaren Frameworks und Best Practices.

[Hinweis und Zusammenfassung]

  • Originaltext: Chip Huyen, 『AI Engineering』

Noch keine Kommentare.

Noch keine Kommentare.