83 Punkte von GN⁺ 2025-12-17 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Das Problem der Abwanderung von Senior Engineers ist kein Problem des Informationsflusses, sondern eines der Incentive-Struktur im Management; auf Quartalsergebnisse optimierte Vergütungssysteme stehen in grundsätzlichem Konflikt mit der Mitarbeiterbindung, die langfristige Investitionen erfordert
  • Wenn ein Senior Engineer das Unternehmen verlässt, belaufen sich die Gesamtkosten auf 500.000 bis 1 Million US-Dollar; Recruiting-Kosten, Kosten durch vakante Stellen, Onboarding und der Verlust von fehlendem Wissen (tribal knowledge) verteilen sich auf verschiedene Budgets und bleiben dadurch unsichtbar
  • Im Fall eines Zahlungsabwicklungsunternehmens, das eine Warnung 14 Monate lang ignorierte, entstand am Black Friday ein Verlust von 3,47 Millionen US-Dollar, obwohl die ursprünglichen Behebungskosten nur 80.000 US-Dollar betragen hätten
  • Als Lösung zur Neuausrichtung der Anreize werden 6 strukturelle Eingriffe genannt (Abwanderungskosten-Buchhaltung, Incident-Tracking, Executive On-Call, Berücksichtigung der Bindungsquote in der Vergütung, Technical Advisory Board, gleichwertige Vergütung für die IC-Laufbahn)
  • Diese Eingriffe wirken nur dann, wenn das Management Retention als wirtschaftliches Problem erkennt und bereit ist, strukturelle Veränderungen zu akzeptieren; eine bloß formale Umsetzung kann sogar kontraproduktiv sein

Warum sich Verhalten trotz fließender Informationen nicht ändert

> "The constraint is not information flow. It is economics."

  • Dieser Artikel ist Teil 2 einer Serie über die Abwanderung von Engineers und knüpft an die Situation nach dem in Teil 1 behandelten Problem der Informationsasymmetrie an: Warum Ihre besten Engineers anderswo Vorstellungsgespräche führen
  • In Teil 1 wurde erklärt, warum Senior Engineers gehen; die zentrale Ursache war eine Struktur, in der Probleme das Management nicht erreichen, selbst wenn sie existieren
  • Dieser Artikel treibt diese Annahme jedoch einen Schritt weiter
    • Er behandelt, was passiert, wenn man den Informationsfluss tatsächlich verbessert
    • Das Ergebnis ist entgegen der Intuition, dass sich meistens gar nichts ändert
  • Organisationen führen verschiedene Mechanismen ein, um Probleme wahrzunehmen
    • Einführung von Skip-Level-1:1-Meetings
    • Betrieb anonymer Feedback-Kanäle
    • Durchführung von Retention-Umfragen mit externen Beratern
  • Daraufhin kommunizieren Engineers die Probleme sehr klar
    • Technical Debt untergräbt die Motivation
    • Expertise wird bei Architekturentscheidungen ignoriert
    • Die On-Call-Belastung ist auf einem nicht nachhaltigen Niveau
  • Das Management hört zu und nickt
    • Es erkennt die Probleme an
    • Es sagt, es werde die Prioritäten anpassen
  • Doch wenn das nächste Quartal beginnt, wiederholen sich die Entscheidungen genauso wie zuvor
    • Die Quartalsziele werden auf dieselbe Weise erreicht
    • Und diese Weise bedeutet, die eben angesprochenen Probleme erneut zu ignorieren
  • An diesem Punkt macht der Artikel den Kern klar
    • Das Problem ist nicht ein Mangel an Informationen
    • Das Problem ist die ökonomische Struktur, also das Design der Anreize

Das Kernproblem: die Incentive-Struktur von Führungskräften

  • Beispiel für die Entscheidungsrechnung, mit der ein VP of Engineering im Oktober konfrontiert ist
    • Noch 3 Monate bis zum Quartals-Performance-Review und 6 Monate bis zum Vesting der Aktien eines Engineers
  • Ein Senior Platform Engineer bittet um Folgendes
    • Er möchte das Authentifizierungssystem 6 Wochen lang refactoren
    • Technical Debt hat sich angesammelt, und die Struktur ist fragil geworden
    • Zwei Security Researcher haben bereits Warnsignale gemeldet
  • Der aktuelle Zustand ist jedoch mehrdeutig
    • Es gibt keinen tatsächlichen Ausfall, keine Kundenbeschwerden und keine Auswirkungen auf den Umsatz
    • Vorhanden ist nur die Warnung des Engineers, dass es zur Krise wird, wenn man es nicht jetzt behebt
  • Für den VP gibt es zwei Optionen
    • Option A: Refactoring genehmigen
      • Akzeptieren, dass die Feature-Entwicklung 6 Wochen lang langsamer wird
      • Es entsteht die Möglichkeit, die Quartals-OKRs zu verfehlen
      • Dem CEO muss erklärt werden, warum sich die Roadmap wegen „technischer Arbeit, die Kunden nicht sehen“ verzögert
      • Das vom Sales-Team bereits zugesagte Feature-Release-Timing könnte ins Wanken geraten
      • Dadurch drohen unmittelbare negative Auswirkungen auf den Jahresendbonus
      • Die Belohnung für diese Entscheidung kommt erst 12 bis 18 Monate später: Der Senior Engineer bleibt im Unternehmen, weil „technisches Urteilsvermögen respektiert wird
    • Option B: Features priorisieren
      • Technical Debt wird zwar als „wichtig“ anerkannt, aber auf „nächstes Quartal“ verschoben
      • Die geplante Roadmap wird wie vorgesehen ausgeliefert, die OKRs werden erreicht und der Bonus wird ausgezahlt
      • Der Senior Engineer bleibt vorerst. Seine Stock Options sind noch nicht gevestet
      • Wenn das Authentifizierungssystem später ausfällt, ist das ein Problem eines zukünftigen Quartals
      • Wenn der Engineer in 6 Monaten geht, geht man davon aus, ihn per Einstellung ersetzen zu können
  • In dieser Struktur gewinnt Option B immer – bis es am Ende scheitert
    • B gewinnt, bis während eines Produkt-Launches ein Ausfall eines Kernsystems auftritt, innerhalb von 18 Monaten fünf Senior Engineers gehen und der CFO zu fragen beginnt, warum jedes Jahr 1,4 Millionen US-Dollar für Nachbesetzungen ausgegeben werden
  • Der Grund ist eine grundlegende Fehlanpassung
    • Die Vergütungsstruktur von Führungskräften ist auf quartalsweise Leistung optimiert
    • Die Bindung von Engineers und der Abbau von Technical Debt erfordern jedoch langfristige Investitionen
    • Eine Verbesserung des Informationsflusses allein kann diese Lücke nicht schließen
    • Die Lösung ist eine Neugestaltung der ökonomischen Struktur selbst

Why the Math Favors Dysfunction - Wenn man es durchrechnet, ist Dysfunktion fast unvermeidlich

  • Versteckte Kosten wirken auf unsichtbare Weise und führen dazu, dass rationale Akteure irrational handeln

  • Wenn ein Senior Engineer mit einem Jahresgehalt von $200.000 geht, belaufen sich die tatsächlichen Gesamtkosten auf $500.000 bis über $1.000.000

    • Die meisten Führungskräfte halten diese Zahl zunächst für übertrieben, aber das ist sie nicht. Die Berechnung sieht wie folgt aus.
  • Direkte Ersatzkosten: $85.000-$100.000

    • Recruiting-Gebühren: Bei externen Recruitern fallen 20–25 % Gebühr an, bei einem Engineer mit $200.000 Gehalt also $40.000-$50.000
      • Bei internem Recruiting (Jobbörsen, Sourcing-Tools, Recruiter-Gehälter) liegen die Kosten bei $15.000-$20.000
    • Signing Bonus: In einem umkämpften Markt sind $20.000-$40.000 nötig, um Senior-Kandidat:innen zu gewinnen
      • Besonders dann unverzichtbar, wenn sie Anteile beim aktuellen Arbeitgeber zurücklassen, um zu wechseln
    • Umzugskosten: Inlandsumzug $10.000-$30.000, international entsprechend mehr
  • Vakanzkosten: $50.000-$100.000

    • Die Besetzung einer Senior-Engineer-Position dauert im Schnitt 3–6 Monate
    • Während der Vakanz bleibt die Arbeit dieser Person nicht einfach liegen, sondern es entstehen gleichzeitig zwei Kostenarten
      • Zum einen sinkt die Teamproduktivität durch Umverteilung der Arbeit, zum anderen entstehen Opportunitätskosten durch aufgegebene Arbeit
    • Kosten der Arbeitsumverteilung $25.000-$40.000:
      • Etwa 60 % der Aufgaben der ausgeschiedenen Person werden auf das verbleibende Team verteilt
      • Das ist keine freie Neuverteilung von Ressourcen, sondern führt zu Produktivitätsverlusten
      • Engineer:innen, deren Auslastung bereits am Limit ist, müssen nun Code Reviews in unbekannten Bereichen übernehmen, Fragen zu Systemen beantworten, die sie nicht selbst entwickelt haben, und Services warten, die sie nicht vollständig verstehen
      • Wenn 3 Engineer:innen jeweils 20 % zusätzliche Arbeit auffangen, bedeutet das nicht einfach 20 % mehr Arbeit, sondern insgesamt geringere Effizienz durch Kontextwechsel
      • Das verursacht während der Vakanz einen Produktivitätsverlust von 10–15 % pro Engineer
      • Berechnung der Kosten der Arbeitsumverteilung
        • Anzahl der Engineer:innen, die Arbeit auffangen × Produktivitätsrückgang × Vakanzdauer in Monaten × (durchschnittliches Jahresgehalt / 12)
        • In einem typischen Szenario: 3 Engineer:innen × 12 % Produktivitätsrückgang × 4 Monate × ($180.000 / 12) = $21.600
        • Wenn die ausgeschiedene Person in einem hoch spezialisierten Bereich wie Infrastruktur, Security oder Plattform gearbeitet hat, steigt der Betrag auf $30.000–$40.000
    • Kosten aufgegebener Arbeit $25.000-$60.000:
      • Die restlichen 40 % werden nicht umverteilt, sondern verschoben oder vollständig aufgegeben
      • Dazu gehören Plattformverbesserungen, Abbau technischer Schulden, Weiterentwicklung der Architektur, Dokumentation und Mentoring — Arbeiten, die nicht direkt mit Feature-Releases zusammenhängen, aber künftige Krisen verhindern, und die still aus der Roadmap verschwinden
      • Die unmittelbaren Kosten von aufgegebener Arbeit werden als Gehaltsgegenwert der nicht erledigten Arbeit berechnet
        • 40 % der Aufgaben der ausgeschiedenen Person werden während der Vakanz nicht erledigt
        • Die Formel lautet: 40 % × 4 Monate × ($200.000 / 12) = $26.667
      • Die tatsächlichen Kosten enden jedoch nicht sofort
        • Verschobene Arbeit erzeugt über die folgenden Quartale hinweg kumulierte Kosten
        • Zum Beispiel
          • Wird eine von einem Senior Infrastructure Engineer geplante Datenbankoptimierung verschoben,
            • verschlechtert sich die Query-Performance schrittweise
            • und schließlich wird eine Notfallreaktion nötig, die den ursprünglichen Arbeitsumfang deutlich übersteigt
          • Wenn die Architektur-Reviews dieser Person ausfallen,
            • werden technische Entscheidungen getroffen
            • obwohl die Expertise fehlt, die teure Fehler im Vorfeld hätte erkennen können
      • Die messbaren Kosten aufgegebener Arbeit sind
        • der Wert von „Arbeit, die ursprünglich hätte erledigt werden sollen, aber nicht erledigt wurde“
        • Eine konservative Formel lautet:
          • (Anteil aufgegebener Arbeit × Jahresgehalt / 12) × Anzahl der Vakanzmonate
          • (40 % × $200.000 / 12) × 4 Monate = $26.667
      • Der realistische Kostenbereich für aufgegebene Arbeit liegt bei $25.000–$60.000
        • Je nachdem, ob die aufgegebenen Aufgaben eher präventiv oder feature-orientiert waren
    • Gesamte Vakanzkosten (Combined Vacancy Cost): $50.000–$100.000
      • Das ergibt sich aus der Summe von $25.000–$40.000 für Arbeitsumverteilung und $25.000–$60.000 für aufgegebene Arbeit
      • Diese Zahl bildet nur die direkten und messbaren Auswirkungen einer 4-monatigen Vakanz ab
    • Die Berechnung selbst ist konservativ
  • Kosten für Onboarding und Einarbeitung: $100.000-$125.000

    • Produktivität eines neuen Senior Engineers: im 1. Monat etwa 25 %, in Monat 2–3 50 %, in Monat 4–5 75 %, volle Produktivität im 6. Monat
      • Monat 1: 75 % Produktivitätsverlust = ($200.000 / 12 Monate) × 0,75 = $12.500
      • Monat 2–3: 50 % Produktivitätsverlust = ($200.000 / 12 Monate) × 0,50 × 2 = $16.667
      • Monat 4–5: 25 % Produktivitätsverlust = ($200.000 / 12 Monate) × 0,25 × 2 = $8.333
      • Gesamte Produktivitätslücke in den ersten 6 Monaten: $37.500
    • Kosten der Onboarding-Kapazität: Ein neuer Senior Engineer beansprucht im 1. Monat 10–15 Stunden pro Woche und in Monat 2–3 5–8 Stunden pro Woche anderer Engineer-Zeit
      • Monat 1: 12 Stunden/Woche × 4 Wochen × $90/Stunde = $4.320
      • Monat 2–3: 6 Stunden/Woche × 8 Wochen × $90/Stunde = $4.320
      • Kosten der Onboarding-Kapazität bei $90/Stunde: $8.640
    • Damit entstehen in den ersten 6 Monaten $46.140 Verlust
    • Da die meisten Senior Engineers jedoch etwa 1 Jahr brauchen, um wieder das Niveau an Domänenwissen der vorherigen Person zu erreichen, sind $92.000-$125.000 realistisch
  • Verlust von implizitem Wissen (Tribal Knowledge): $100.000-$300.000

    • Am schwierigsten zu quantifizieren, zeigt sich aber in den folgenden Quartalen in Form von Fehlern
    • Was die ausgeschiedene Person wusste:
      • welche Teile der Codebasis fragil sind und besonders vorsichtig geändert werden müssen
      • welche Kund:innen spezielle Anforderungen haben und warum
      • welche Architekturentscheidungen bewusste Trade-offs sind und welche technische Schulden
      • welche 3 Zeilen Code in einem Service mit 10.000 Zeilen tatsächlich wichtig sind
      • warum eine bestimmte Datenbank-Query ineffizient aussieht, aber genau so geschrieben wurde (weil eine „offensichtliche“ Optimierung unter einer vor 3 Jahren entdeckten speziellen Bedingung zu Datenkorruption führte)
    • Fehler durch fehlenden Kontext: Ein neuer Engineer optimiert eine „langsame“ Query und unterbricht damit den zentralen Workflow der zwei wichtigsten Kund:innen des Unternehmens
      • 2 Tage für Problemanalyse ($4.615), 1 Woche für die korrekte Behebung ($7.692), dazu Wiederherstellung der Kundenbeziehung
      • Kosten eines einzelnen Vorfalls etwa $12.000-$15.000, im ersten Jahr 3–5 Mal pro ausgeschiedenem Senior Engineer
    • Verzögerte Entscheidungen: Eine Frage, die die ausgeschiedene Person in 30 Sekunden beantwortet hätte, erfordert jetzt 3 Stunden Code-Archäologie, Slack-History-Suche und Gespräche à la „Weiß jemand, warum wir das so gemacht haben?“
      • Bei 2 Vorkommnissen pro Woche über 6 Monate: $14.040
    • Verschobene oder aufgegebene Projekte: Nur die ausgeschiedene Person verstand das Authentifizierungssystem gut genug, um eine SSO-Integration sicher umzusetzen
      • Das Projekt verzögert sich um 6–9 Monate; wenn SSO für einen Enterprise-Vertrag über $500.000 erforderlich war, lassen sich die Kosten der Verzögerung messen
    • Eine konservative Schätzung für den Verlust dieses internen Wissens liegt in den 12 Monaten nach dem Austritt bei $100.000 bis $300.000
  • Gesamtkosten pro ausgeschiedenem Engineer

    • Direkter Ersatz: $85.000-$100.000
    • Vakanzkosten: $50.000-$100.000
    • Einarbeitung und Onboarding: $92.000-$125.000
    • Verlust internen Wissens: $100.000-$300.000
    • Konservative Gesamtsumme: $327.000-$625.000
    • Realistische Gesamtsumme inklusive Projektverzögerungen und Opportunitätskosten: $500.000-$1.000.000
  • Diese Kosten werden über das Gesamtbudget verteilt und im Rauschen verborgen: Einstellungskosten liegen im HR-Budget, Produktivitätsverluste werden nicht nachverfolgt, der Verlust internen Wissens erscheint nicht in Quartalsberichten

    • Das Aufschieben von Technical Debt und die Priorisierung von Features erzeugen sofortige und sichtbare Ergebnisse: Demos für das Vertriebsteam, Ankündigungen von Marketing-Launches, Berichte des CEO an den Vorstand usw.
    • Ökonomen bezeichnen dies als das Problem des „kochenden Froschs“:
      • Der Weggang einzelner Mitarbeitender wirkt verkraftbar, das Verschieben technischer Arbeit erscheint vernünftig, und quartalsweise Kompromisse wirken jeweils für sich genommen gerechtfertigt
      • Wenn das Muster offensichtlich wird (jährliche Fluktuationsrate bei Senior Engineers von 18 %, aufgelaufene Technical Debt, eine Kette von Systemausfällen), hat die Organisation Dysfunktion bereits als normal akzeptiert

Wie sieht Recovery aus?

  • 14 Monate vor dem Black-Friday-Desaster äußerte ein Senior Platform Engineer eines mittelgroßen Zahlungsabwicklers konkrete Bedenken
    • "Das Transaktionsverarbeitungssystem wird den erwarteten Holiday-Traffic nicht bewältigen."
    • Er legte einen detaillierten Vorschlag für Datenbank-Sharding und Queue-Optimierung vor: 6 Wochen Engineering-Zeit, geschätzte Infrastrukturkosten von 80.000 $
  • Vom VP of Product wurde das Thema nach hinten priorisiert:
    • Zwei andere Feature-Releases wurden als wichtiger eingestuft
    • Im Quartalsreview wurde zwar die "Fähigkeit, potenzielle Probleme frühzeitig zu erkennen" gelobt, der Architekturvorschlag blieb jedoch in Jira liegen
  • Vier Monate später wechselte der Engineer mit 15 % Gehaltserhöhung zu einem Wettbewerber; nach 3 Monaten Suche und 47.000 $ Recruiting-Kosten wurde Ersatz eingestellt, der weitere 5 Monate bis zur vollen Produktivität brauchte
  • In der Zwischenzeit gingen zwei weitere Senior Engineers: einer aus Frustration über technische Schulden, einer nahm extern eine Principal-Engineer-Rolle an, die es intern nicht gab
  • Die ursprüngliche Warnung wurde erst 9 Monate später im Architekturreview erneut aufgegriffen
    • Zu diesem Zeitpunkt war das organisatorische Gedächtnis über Kontext und Lösungsweg des Vorschlags bereits verloren
    • Einem Junior Engineer wurde die Aufgabe übertragen, "Alternativen zu recherchieren"
  • Am Black Friday begann das Desaster um 9:47 Uhr mit einem starken Anstieg der Transaktionen
    • Ab 10:23 Uhr begann die Datenbank, Schreibanfragen abzulehnen
    • Der Engpass lag genau an der Stelle, die 14 Monate zuvor benannt worden war, und durch den Ausfall konnten Transaktionen im Wert von 2,5 Mio. $ nicht verarbeitet werden
    • Die Recovery dauerte 5 Stunden
      • Für die Notfall-Skalierung der Infrastruktur fielen 180.000 $ an, und drei Engineers arbeiteten den gesamten Feiertag über an dauerhaften Architekturänderungen
    • Am 3. Dezember wurde unter Leitung des CTO ein Postmortem mit einem neuen Abschnitt an das Management übergeben
      • Der Abschnitt "Previously Raised Concerns" dokumentierte die ursprüngliche Warnung des Engineers, die Entscheidung zur Depriorisierung und die anschließende personelle Fluktuation
      • Der CFO rechnete die Gesamtkosten nach
    • Kosten der Engineer-Fluktuation (3 Senior Engineers): messbare Kosten von 235.000 $ pro Person
      • Recruiting 47.000 $ + Signing Bonus 30.000 $ + Vakanzkosten 83.000 $ (durchschnittlich 4 Monate) + Onboarding und Ramp-up 75.000 $
      • Insgesamt 705.000 $
    • Kosten des Verlusts von tribal knowledge: 2,2 Mio. $
      • Das Verständnis für Datenbankstruktur, Failure Modes und frühere Lösungen war aus der Organisation verschwunden
      • Das Problem musste neu entdeckt, die Lösung erneut untersucht und unter Notfallbedingungen implementiert werden
      • Diese Wissenslücke verwandelte eine geplante Migration in eine Krisenreaktion
      • Untersuchungskosten, Fehlversuche, eilige Vendor-Einsätze und Kosten für die Betreuung von Händlern summierten sich
    • Kosten fehlgeschlagener Transaktionen:
      • Fehlgeschlagene Zahlungsabwicklung im Wert von 2,5 Mio. $
      • Bei einer Gebührenrate von 2,9 % betrug der direkte Umsatzverlust zwar nur 72.500 $, vertraglich bestand jedoch die Pflicht, alle Transaktionen abzuwickeln
      • Daher entstanden 180.000 $ an SLA-Vertragsstrafen sowie 45.000 $ für Händler-Support und Churn-Prävention
    • Notfall-Infrastrukturkosten: 180.000 $
      • Dringende Datenbank-Skalierung (zusätzliche Read Replicas, aufgerüstete Instanzen, Kosten für beschleunigten Vendor-Support)
      • Re-Konfiguration des Load Balancers und CDN-Optimierung, damit der 14 Monate zuvor erwartete Traffic bewältigt werden konnte
    • Recovery- und Folgekosten: 87.000 $
      • 3 Senior Engineers arbeiteten am Feiertagswochenende 72 Stunden zum 2,5-fachen Überstundensatz: 51.923 $
      • 2 Wochen Nacharbeit des größeren Engineering-Teams: 38.462 $
    • Gesamtkosten des Vorfalls: 3,47 Mio. $
    • Ursprünglich vorgeschlagene Präventionskosten: 80.000 $ (einschließlich 6 Wochen Engineering-Zeit eines Senior Engineers und Infrastrukturkosten)
    • Auf der ersten Seite des Postmortems stand 3,47 Mio. $ vs 80.000 $, und diese Zahl veränderte die Richtung des Gesprächs
  • Der CEO ordnete als Reaktion auf Fragen des Boards eine Retention-Analyse an
    • Die jährliche Fluktuationsrate bei Senior Engineers lag bei 34 % (mehr als doppelt so hoch wie der Branchendurchschnitt profitabler Unternehmen)
    • In Exit-Interviews, die zuvor ohne Management-Review abgelegt worden waren, zeigte sich ein konsistentes Muster
      • Talentierte Engineers gingen, wenn technische Bedenken zwar anerkannt, aber nicht umgesetzt wurden
    • Vier Verbesserungsmaßnahmen in 18 Monaten umgesetzt:
      • Der CFO begann, in Quartalsberichten Fluktuationskosten neben den Customer Acquisition Costs nachzuverfolgen — plötzlich tauchten die durchschnittlichen Fluktuationskosten von 235.000 $ in denselben Dokumenten auf wie Marketing-Ausgabenentscheidungen
      • Alle Führungskräfte nahmen an einer vierteljährlichen On-Call-Rotation teil — der VP of Product, der die Datenbankarbeit depriorisiert hatte, erhielt in seiner ersten Woche einen 23-seitigen Bericht, davon 19 Punkte zu technischen Schulden, die in den vorangegangenen 6 Monaten benannt worden waren
      • Der Compensation Committee fügte der variablen Vergütung von Executives einen Retention-Faktor hinzu: 90 % jährliche Bindung von Senior Engineers machten 25 % der Bonusberechnung aus
      • Einführung von Staff- und Principal-IC-Karrierepfaden, deren Vergütung mit Director- und VP-Level übereinstimmt
  • 18 Monate später war die jährliche Fluktuationsrate bei Senior Engineers in diesem Zahlungsunternehmen auf 9 % gesunken
  • Noch wichtiger war jedoch die Veränderung im Architekturreview-Prozess:
    • Vorschläge zu technischen Schulden enthalten nun berechnete Ausfallkosten
    • Executives fragen inzwischen routinemäßig: "Wenn wir das verschieben, wie hoch ist dann das Risiko, dass Engineers abwandern?"
  • Der Platform Engineer, der ursprünglich die Datenbank-Bedenken geäußert hatte, kehrte als Principal Engineer zurück
    • Mit 40 % höherem Gehalt als bei seinem Weggang — gezielt eingestellt, um die Infrastruktur-Skalierung zu leiten
  • Die Rückkehr dieses Engineers symbolisiert zusammen mit der durch Zahlen belegten Veränderung, dass sich die wirtschaftliche Kalkulation der Organisation tatsächlich verändert hat

Sechs Interventionen, die tatsächlich funktioniert haben

  • Strukturelle Eingriffe, die Anreize neu ausrichten, also keine Informationssammlung oder Empathieübungen, sondern ein wirtschaftliches Redesign

  • Hierarchie der Einflussnahme

    • Die 6 Eingriffe können belastend wirken, aber Umsetzungsschwierigkeit und Zeit bis zur Wertschöpfung sind nicht identisch; die Reihenfolge ist wichtig
    • Der schnellste Weg zu Ergebnissen: Eingriffe, die nur minimale Zustimmung in der Organisation erfordern
      • Cost-of-Attrition Accounting (#1): erfordert nur die Zustimmung des CFO und Zeit eines Finanzanalysten
      • Nachverfolgung von Vorfällen aufgrund ignorierter Warnungen (#2): erfordert nur Änderungen am SRE-Prozess. Kein Budget und keine Umstrukturierung nötig; systematische Dokumentation in Postmortems reicht aus
      • Beide können innerhalb von 30 Tagen starten und liefern quantifizierte Belege für schwierigere Auseinandersetzungen
    • Mittelfristige Eingriffe: erfordern kulturellen Wandel, aber keine Umstrukturierung der Vergütung
      • On-Call-Rotation für das Management (#3): funktioniert, wenn eine Führungskraft die Folgen verschobener Infrastrukturverbesserungen direkt erlebt; dann setzt sich die Richtlinie von selbst durch
      • Technischer Beirat mit echter Entscheidungsbefugnis (#5): entfaltet Wirkung, wenn die Geschäftsleitung wirklich akzeptiert, dass ihre Entscheidungen aufgehoben werden können; als kleiner Pilotversuch scheitert das innerhalb weniger Quartale
      • Umsetzungszeit 3–6 Monate: weil nicht nur einfache Richtlinienänderungen, sondern auch Vertrauensaufbau nötig sind
    • Strukturelle Eingriffe: erfordern die Zustimmung des Aufsichtsgremiums oder des Vergütungsausschusses, dauern 6–12 Monate, liefern aber die tiefgreifendste Veränderung
      • Einbezug von Retention-Kennzahlen in das Vergütungssystem (#4): Wenn Executive-Boni von der Bindung erfahrener Engineers abhängen, wird technische Schuld über Nacht strategisch wichtig
      • Gleichwertigkeit des IC-Tracks sichern (#6): Wenn Staff Engineers ohne Teamverantwortung ein Gehalt auf Senior-Führungsebene erhalten, wird der Erhalt technischer Expertise strukturell möglich
    • Minimal praktikabler Eingriff: Kombination aus zwei Elementen verschiedener Ebenen
      • Cost-of-Attrition Accounting (schneller Erfolg) + Retention-Kennzahlen in der Vergütung (strukturelle Veränderung)
      • Das Erste baut den Business Case auf, das Zweite macht Handeln für das Management rational
    • Unternehmen in der Krise: schnelle Erfolge sofort umsetzen + strukturelle Veränderungen parallel entwerfen
    • Unternehmen mit frühen Warnsignalen: mit Messung beginnen (Kostenrechnung, Incident-Tracking) + tiefere Eingriffe mit den Ergebnisdaten rechtfertigen
  • 1. Cost-of-Attrition Accounting

    • Das Unsichtbare sichtbar machen: die Gesamtkosten jedes Abgangs eines Senior Engineers berechnen
      • durchschnittliche Recruiting-Kosten 35.000 $
      • bis zur vollen Produktivität etwa 6 Monate (50 % des Gehalts eines Senior Engineers)
      • Projektverzögerungen durch Wissensverlust
      • Opportunitätskosten von Architekturentscheidungen, die nur dieser Engineer verstand
    • Diese Zahl monatlich verfolgen und in dasselbe Executive-Dashboard wie CAC und Umsatzkennzahlen aufnehmen
    • Ein Finanzdienstleister verfolgte die quartalsweisen Fluktuationskosten und stellte fest:
      • Q1: Abgang von 2 Senior Engineers, 400.000 $
      • Q3: prognostizierte Jahreskosten 900.000 $
      • Als der CFO dies zusammen mit dem jährlichen Engineering-Budget von 3 Mio. $ präsentierte,
      • wechselte die Frage des CEO von „Warum sind sie gegangen?“ zu „Wie viel brauchen wir, um das zu verhindern?“
      • In der Folge wurden 400.000 $ in den Abbau technischer Schulden und in Vergütungsanpassungen investiert
        die Fluktuationsrate bei Senior Engineers sank um 43 %, und die Investition hatte sich nach nur zwei Quartalen vollständig amortisiert
  • 2. Vorfälle nachverfolgen, die durch ignorierte Warnungen entstanden sind

    • Das Postmortem-Template anpassen und den Pflichtabschnitt „Prior Warnings“ hinzufügen
    • Verantwortliche dazu verpflichten, in Jira, Slack, Architektur-Review-Notizen und E-Mails nach früheren Warnungen zu diesem Ausfallmodus zu suchen
    • Zu dokumentierende Punkte: Zeitpunkt der Warnung, wer sie geäußert hat, vorgeschlagene Maßnahme, Grund für die Herabstufung der Priorität
    • Vorfallkosten berechnen: Umsatzauswirkungen der Downtime, Belastung des Kundensupports, für die Wiederherstellung aufgewendete Engineering-Zeit
    • Nachdem ein Healthtech-Unternehmen diesen Ansatz eingeführt hatte,
      • stellte es innerhalb von 6 Monaten fest, dass 70 % der Produktionsvorfälle im Voraus vorhergesagt worden waren
      • Engineers hatten Bedenken geäußert, aber das Management hatte die Priorität der Problemlösung zugunsten der Feature-Entwicklung herabgesetzt
      • Gesamtkosten über ein Jahr: 1,8 Mio. $ für vermeidbare Vorfälle
      • Als das Management bestätigte, dass bei 14 von 16 größeren Ausfällen die technischen Warnungen korrekt gewesen waren, erkannte es den Ernst des Musters
      • Als die Prognosen nachweislich durchgängig zutrafen, änderte sich das Verhalten
  • 3. On-Call-Rotation für Führungskräfte

    • Alle Executives (einschließlich Product, VP und Director) übernehmen einmal pro Quartal eine Woche On-Call
    • Eskalationsrichtlinie:
      • Wenn der On-Call-Engineer entscheidet, dass ein Alarm mit einem zuvor niedrig priorisierten Fix oder verschobener technischer Arbeit zusammenhängt
      • wird direkt an die verantwortliche Person eskaliert, die diese Entscheidung getroffen hat, unabhängig von Uhrzeit oder Wochentag
    • Das schafft ein Erfahrungslernen, das stärker ist als jedes Dashboard
    • Beispiel: Ein VP of Product erlebte 17 Pager-Einsätze in 5 Tagen wegen desselben Problems mit dem Datenbank-Connection-Pool, das Engineers 7 Monate zuvor als „nice to have“-Fix markiert hatten
      • Das Problem war als P3 eingestuft, und der VP hatte stattdessen drei Feature-Releases priorisiert
      • Nach fünf 3-Uhr-morgens-Einsätzen in Folge wurde es zu P0 hochgestuft und innerhalb von 8 Tagen behoben
      • Später räumte der VP ein: „Ich dachte, die Engineers übertreiben mit ihrer Alert Fatigue. Taten sie nicht.“
  • 4. Retention-Kennzahlen in die Executive-Vergütung einfließen lassen

    • Die Struktur so ändern, dass 25 % der variablen Vergütung des Managements von der Bindungsquote erfahrener Engineers abhängen
    • Definition von „Senior“: mindestens 2 Jahre Betriebszugehörigkeit, Performance-Review über den Erwartungen oder Verantwortung für kritische Systeme
    • Zielsetzung: 90 % jährliche Bindung bei Senior Engineers
      • Bei Verfehlung des Ziels wird der Bonus proportional gekürzt
      • Bei Übererfüllung wird der Bonus mit einem Multiplikator ausgezahlt
    • Beispiel: Ein Series-B-SaaS-Unternehmen führte diese Struktur 2021 ein
      • jährliche Fluktuation bei Senior Engineers 28 %
      • anfänglicher Widerstand des Managements: „Wir können nicht kontrollieren, dass jemand ein besseres Angebot bekommt“
      • Antwort des CEO: „Dann geben wir zu, dass wir außerhalb des Gehalts nicht wettbewerbsfähig sind. Verbessert das oder akzeptiert die Auswirkungen auf die Vergütung.“
      • Innerhalb eines Jahres sank die Fluktuationsrate auf 11 %
      • In Exit-Interviews verschob sich das Muster: Abgehende Engineers nannten nicht mehr dysfunktionsbedingte Abgänge (ignorierte technische Bedenken, fehlendes Wachstum, toxische Kultur), sondern opportunitätsbedingte Abgänge (Principal-Beförderung in einem größeren Unternehmen, Startup-Gründung, Umzug)
      • Als das Management nun Verantwortung für Mitarbeiterbindung trug, wurde das Erreichen der Bonusziele zum einfachsten Teil
  • 5. Technischer Beirat (TAB) mit echter Autorität

    • Der Beirat besteht aus 5 Senior Engineers, die von der Engineering-Organisation gewählt und nicht vom Management ernannt werden
    • Vierteljährliche Meetings mit den C-Levels
    • Eine Befugnis: einmal pro Quartal eine Managemententscheidung ablehnen
    • Anforderung: Bei einer Ablehnung ist ein schriftlicher Gegenvorschlag mit technischer Begründung, erwarteten Kosten und Risikoanalyse Pflicht
      • Das Management kann das Veto nur mit CEO-Zustimmung und dokumentierter Begründung aufheben
    • Beispiel: Ein Blockchain-Infrastrukturunternehmen richtete Anfang 2020 einen TAB ein
      • in 2 Jahren wurde das Vetorecht 2-mal ausgeübt
      • erstes Veto: Die Entscheidung zum Aufbau eines proprietären Konsens-Frameworks wurde blockiert; stattdessen wurde die Erweiterung eines bestehenden Open-Source-Protokolls vorgeschlagen. Geschätzt 18 Monate Entwicklungszeit gespart
      • zweites Veto: Verhinderte den Rollout einer Datenbankmigration ohne umfassende Rollback-Tests. Eine Analyse nach der Implementierung schätzte, dass der TAB einen Datenkorruptionsvorfall in Höhe von 2 Mio. $ verhindert hatte
      • Die eigentliche Wirkung war subtiler: Vor der Finalisierung technischer Entscheidungen begann das Management zu fragen: „Würde der TAB das genehmigen?“
      • Schon die Drohung eines Vetos veränderte die Qualität von Vorschlägen, bevor sie den TAB überhaupt erreichten
      • Engineers berichteten, dass technisches Urteilsvermögen für Managemententscheidungen endlich wichtig geworden sei
  • 6. IC-Track mit Vergütungsparität

  • Den Karrierepfad für ICs klar definieren: Staff Engineer, Principal Engineer, Distinguished Engineer

    • Die Vergütungsbänder müssen jeweils dem Niveau von Director, VP und SVP entsprechen
  • Beförderungskriterien: eher technischer Einfluss, Ownership für die Architektur und Hebelwirkung, die die Effektivität anderer Engineers steigert, statt Teamgröße oder Berichtslinien

  • Beispiel: Ein Fintech-Unternehmen verlor innerhalb von 6 Monaten 3 Engineers auf Staff-Niveau

  • Im Exit-Interview dasselbe Muster: „Ohne Manager zu werden, ist eine Vergütung auf L7-Niveau nicht erreichbar. Ich möchte nicht managen und Entwickler bleiben.“

    • Das Unternehmen führt eine IC-Laufbahn mit gleichwertiger Vergütung ein
    • Innerhalb eines Jahres: Zwei Engineers, die zuvor Vorstellungsgespräche führten, wurden zu Principals befördert, drei Senior ICs wurden von Wettbewerbern ohne vergleichbaren Karrierepfad eingestellt, die Abwanderung von Senior-Techkräften sank um 62 %
    • Noch wichtiger: Die im Unternehmen verbliebenen Engineers verhinderten schätzungsweise Architekturfehler im Wert von 3 Millionen US-Dollar
      • Dabei ging es um Entscheidungen, denen Junior- oder Mid-Level-Engineers wegen fehlender Fachkompetenz oder Autorität nicht widersprechen konnten

Umsetzungswege (Implementation Paths)

  • Der Zeitplan für die Umsetzung hängt vom Schweregrad der Lage der Organisation ab
  • Unternehmen in der Krise (Abwanderungsrate von Seniors >20 %, kürzlich schwerwiegender Ausfall)

    • Woche 1–2: Tatsächliche Fluktuationskosten für 12 Monate berechnen (einschließlich Recruiting-Kosten, Einarbeitungszeit bis zur Produktivität, Projektverzögerungen und Verlust von Wissenslücken), Muster aus Exit-Interviews analysieren, Production-Incidents früher ignorierten Warnungen zuordnen
    • Woche 3–4: Ergebnisse CFO und CEO präsentieren, Muster aufzeigen (technische Bedenken werden geäußert → Priorität wird gesenkt → Engineers gehen → Incident oder Kosten entstehen), Gesamtschaden quantifizieren, sofortige Eingriffe vorschlagen
    • Woche 5–8: Management-On-Call-Rotation starten (schnellster Kulturwandel), Verfolgung der Fluktuationskosten beginnen (Business Case für kontinuierliche Veränderung aufbauen), mit 3 Engineers einen TAB-Piloten aufsetzen, monatliches Tracking der Fluktuationskosten im Executive-Dashboard starten
    • Woche 9–12: Dem Board Änderungen an der Vergütungsstruktur vorlegen, Management-Boni an Retention koppeln, IC-Karrierepfad öffentlich ankündigen, transparent kommunizieren, was sich warum geändert hat
  • Unternehmen mit frühen Warnsignalen (Abwanderungsrate 12–18 %, Engineers äußern Bedenken in 1:1s)

    • Monat 1–2: Tracking der Fluktuationskosten und Aufbau des wirtschaftlichen Business Case starten, Engineers zu Retention-Risiken und dazu befragen, was sie zum Bleiben bewegen würde, die 3 am häufigsten genannten Bedenken identifizieren
    • Monat 3–4: Piloten für Resource-Executive und Management-On-Call-Rotation starten, TAB-Pilot beginnen, beides nutzen, um technische Schulden und organisatorische Reibung sichtbar zu machen, Kosten aufgeschobener Arbeit dokumentieren
    • Monat 5–6: Dauerhafte Änderungen an der Vergütungsstruktur einführen, TAB-Befugnisse formalisieren, Kriterien und Vergütungsbänder für den IC-Karrierepfad veröffentlichen, die Bindung von Senior Engineers als explizites Management-Ziel festlegen

Wenn das nicht wirkt

  • Diese Eingriffe scheitern in 3 Szenarien vorhersehbar; das nicht anzuerkennen verschwendet nur Zeit
  • 1. Ein Geschäftsmodell, das Abwanderung von Anfang an einkalkuliert

    • Beratungsfirmen und Vertragsdienstleister rechnen mit einer jährlichen Fluktuation von 20–40 %
    • Das Geschäftsmodell preist die Kosten des Personalaustauschs ein, und die Abrechnungssätze basieren auf der Annahme, dass organisationsinternes Fachwissen begrenzt ist
    • Für Produktunternehmen entwickelte Retention-Strategien sind dort bedeutungslos, wo natürliche Abwanderung durch Client-Rotation gefördert wird und der Partner-Track bewusst Up-or-out-Druck erzeugt
    • Ähnlich können frühe Startups vor Product-Market-Fit Engineer-Abgänge erleben, die kein Zeichen gescheiterter Retention, sondern notwendiger Pivots sind
      • Wenn ein Unternehmen alle 6 Monate die Richtung grundlegend ändert, bedeutet geringe Retention keine systemische Dysfunktion, sondern eine angemessene Neuzuordnung von Talenten
  • 2. Wenn nur so getan wird, als würde man umsetzen (Implementation Theater)

    • Formalistische Eingriffe führen zu schlechteren Ergebnissen als gar keine Eingriffe
    • Ein TAB ohne echtes Vetorecht wird zu einem Ablassventil, das die Bedenken von Engineers nur zerstreut
      • Wenn Zeit in Vorschläge investiert wird, die systematisch ignoriert werden, wächst nur der Frust
    • Eine Executive-On-Call-Rotation, die nicht mit der Beseitigung der Grundursachen verknüpft ist, erzeugt verantwortungsloses Schaufenster-Mitgefühl
      • Ein VP, der für Probleme alarmiert wird, die er weder priorisieren noch lösen kann, lernt nur, dass Engineers häufig klagen
    • Fluktuationskostenrechnung, die zwar berechnet, aber nie in Executive-Dashboards oder Vergütungsdiskussionen auftaucht, bleibt eine theoretische Debatte
    • Halb umgesetzte Eingriffe zeigen, dass die Führung nur Interesse an strukturellem Wandel vortäuscht, ohne echten Willen dazu
  • 3. Fehlende kulturelle Voraussetzungen

    • Diese Eingriffe erfordern kulturelle Voraussetzungen, die in vielen Organisationen fehlen: Die Führung muss echte Verhaltensänderung statt Reputationsmanagement wollen
    • Wenn das Management Engineer-Retention nicht als wirtschaftliches, sondern als PR-Problem sieht, setzt es nur die sichtbarsten Eingriffe um (Advisory Councils, Listening Tours) und vermeidet die teuren Dinge (Vergütungsumbau, echtes Vetorecht)
    • Diagnosetest: Vorschlagen, 25 % der variablen Vergütung des Managements an die Retention von Senior Engineers zu koppeln
      • Wenn die Führung sofort erklärt, warum das bei uns nicht geht, dann haben Sie die Antwort gefunden
        • Sie wollen eine Lösung ohne persönliche Kosten
    • Ein Unternehmen, das nicht bereit ist, Engineers Vetorechte zu geben, Management-Gehälter an Retention zu koppeln und Fluktuationskosten in quartalsweise Finanzreviews aufzunehmen, ist nicht bereit für strukturellen Wandel
    • Es begnügt sich damit, Bedenken anzuerkennen, „weitere Forschung“ zu empfehlen und Beratungsberichte Staub ansetzen zu lassen, während Senior Engineers weiter gehen
    • Eingriffe funktionieren, wenn die Führung erkennt, dass jährliche Fluktuationskosten von 1,4 Millionen Dollar höher sind als die Maßnahmen, die nötig wären, um sie zu verhindern
      • Ohne diese Einsicht kann keine noch so große Zahl an Advisory Councils die wirtschaftliche Ausrichtung ersetzen

Neue wirtschaftliche Rechnung

  • Ein vom Autor geführtes Blockchain-Infrastrukturunternehmen wuchs in 3 Jahren von 10 auf 187 Engineers und hielt dabei
    • die jährliche Abwanderungsrate von Senior Engineers im Schnitt bei 6 %, weit unter den üblichen 35–40 % in Hypergrowth-Unternehmen
  • Die Ursache dieses Erfolgs lag nicht in Benefits oder kulturellen Maßnahmen, sondern in der Neugestaltung der Incentive-Struktur
    • Mittleres Management wurde dafür belohnt, technische Risiken früh sichtbar zu machen, statt den Eindruck zu erzeugen, alles sei unter Kontrolle
    • Postmortems verlangten die Dokumentation früherer Warnungen; ignorierte Warnungen wurden Teil der Leistungsbewertung derjenigen, die sie herunterpriorisiert hatten
    • Die technische Führung hatte Vetorechte bei Architekturentscheidungen. Wir haben davon zweimal Gebrauch gemacht, aber schon die Möglichkeit eines Vetos verbesserte die Qualität von Vorschlägen insgesamt
    • Ein IC-Karrierepfad existierte seit der Gründung; die ranghöchsten Nicht-Manager verdienten mehr als die meisten Directors
  • Systemkosten: rund 400.000 $ pro Jahr für Vergütungsanpassungen, Governance-Overhead und die Priorisierung technischer Schulden, die manche Features verzögerte
  • Einsparungen:
    • 2,1 Millionen Dollar vermiedene Fluktuationskosten (Anwendung des Branchenstandards von 35 % Fluktuation auf die Zahl der Senior Engineers)
    • zusätzlich nicht exakt messbare, aber erhebliche Einsparungen durch Architekturentscheidungen, die keine Incidents in Millionenhöhe auslösten, weil Senior Engineers ein Stopprecht hatten

Die unbequeme Wahrheit

  • Die meisten Unternehmen setzen solche Eingriffe erst um, wenn eine Zwangssituation eingetreten ist
  • Der Auslöser ist meist katastrophal: ein Production-Incident mit Kosten in Millionenhöhe, massive Abgänge, die ein Kernteam lähmen, oder ein Wettbewerber, der die Hälfte Ihrer wichtigsten Engineers abwirbt, indem er genau das bietet, was Sie abgelehnt haben — Respekt für technisches Urteilsvermögen
  • Dann geht es nicht mehr um Prävention, sondern nur noch um Schadensbegrenzung
    • Erholung ist teuer. Die besten Engineers, die die nächste Krise hätten verhindern können, sind bereits weg
    • Ihre Nachfolger sind talentiert, haben aber zu wenig Organisationswissen, um zu wissen, wovor sie warnen müssen, und beschleunigen so den Teufelskreis
  • Die Frage ist nicht, ob diese Eingriffe wirken; die Belege sind eindeutig
    • Unternehmen, die die Incentives des Managements an Mitarbeiterbindung ausrichten, Engineers echte Autorität geben und Fluktuation als wirtschaftliches Problem behandeln, schneiden bei Retention, Incident-Rate und langfristiger technischer Gesundheit durchgängig besser ab
  • Wenn erfahrene Engineers gehen und die üblichen Lösungen nicht wirken, liegt das Problem möglicherweise nicht an der Kommunikation, sondern an den ökonomischen Rahmenbedingungen

Noch keine Kommentare.

Noch keine Kommentare.