Warum es beunruhigend ist, dass Copilot in Excel steckt
(simonwillison.net)- Die TikTok-Nutzerin Ada James(@belligerentbarbies) äußert ihre Sorge über die Einführung eines AI Copilot in Excel
- Excel wird als „das Monster, das unsere Wirtschaft antreibt“ beschrieben, und „Brenda“ erscheint als diejenige, die dieses Monster gezähmt hat
- Brenda wird als eine göttinnenhafte Figur von Excel beschrieben, die es in jeder Finanzabteilung von Unternehmen gibt
- Es wird die symbolische Formulierung verwendet: „Eine vom Himmel herabgestiegene Excel-Göttin küsste Brenda auf die Stirn“
- Es erscheint die überzeichnete Metapher, dass der Kapitalismus dank Brendas Einsatz funktioniert
- Als Brendas erstellter Finanzbericht von ihrem Vorgesetzten geändert werden soll, nutzt dieser Copilot, weil er glaubt, die AI sei klüger als Brenda
- Doch die AI geht falsch mit Excel um und ruiniert den Bericht, und der Vorgesetzte erkennt den Fehler nicht
- Der Grund ist, dass der Vorgesetzte Excel nicht versteht und die AI halluziniert
„Wer erzeugt keine Halluzinationen? Brenda“
1 Kommentare
Hacker-News-Meinungen
Es ist interessant, dass es zwei gegensätzliche Narrative zur Nutzung von Technologie gibt.
Das eine lautet: „Menschen wie Brenda machen Fehler, also brauchen wir Automatisierung“, das andere: „Brenda ist zuverlässig, aber AI macht viele Fehler.“
Tatsächlich widersprechen sich diese beiden Aussagen nicht. Wir setzen Automatisierung nur bei verständlichen Aufgaben, zuverlässiger Ausführung, beobachtbaren Abläufen und langweiliger Routinearbeit ein.
Das Problem entsteht, wenn AI diese Bedingungen nicht erfüllt. Vor allem die Autonomie von AI löst Angst aus. Dahinter steckt das Unbehagen: „Ich weiß nicht, warum dieses Ergebnis herausgekommen ist.“
Deshalb vertrauen Menschen weiterhin eher eng begrenzter AI oder AI mit Schutzmechanismen.
Traditioneller Code liefert bei gleicher Eingabe immer die gleiche Ausgabe, AI dagegen jedes Mal etwas anderes.
Das Problem ist die undurchsichtige Intransparenz, weil man nicht verstehen kann, warum AI so gehandelt hat.
Wenn Brenda einen Fehler macht, kann man nach der Ursache fragen und sie beheben, bei AI ist das schwierig.
Ich mag AI auch, kenne aber ihre Grenzen genau.
Generative AI dagegen ist unvorhersehbar.
Nach Vorhersagbarkeit geordnet wäre die Reihenfolge: Quick Sort > Brenda > Gen AI.
Die erzeugten Token spiegeln keinen menschlichen Denkprozess wider.
Die vom Modell erzeugten „Schlussfolgerungsschritte“ zeigen keinen realen internen Zustand, und das Ergebnis ändert sich je nach unsichtbaren Verzerrungen.
AI ist schwer zu validieren, und der Gegenwert im Verhältnis zu den Kosten ist unklar.
Am Ende ist die entscheidende Frage, ob die Kombination „Brenda + AI“ besser ist oder Brenda allein.
Der aktuelle Stand von AI ist immer noch: „In ein paar Jahren wird es vielleicht nützlich.“
Auch in unserer Organisation wurden Copilot und AI im Microsoft Stack zwangsweise eingeführt.
Die meisten Funktionen waren deaktiviert oder nutzlos. Letztlich ist das nur Marketing zur Kurspflege der Aktie.
Außerdem hat das Unternehmen AI-Bots zur Aufzeichnung von Meetings verboten. Der Grund sind Sicherheitsrisiken.
VS-Code-Autovervollständigung oder Fehlerinterpretation sind gut, aber alles in ein Chat-Interface zu pressen, gefällt mir nicht.
Lieber sollte zuerst die Qualität der Spracherkennung verbessert werden.
Früher gab es bei der Firma eines Freundes ein Perl-Skript, das jeden Tag Finanzdaten in die DB committe.
Ohne dieses Skript hätte die Firma kein Geld verdienen können. Es gab genau eine Person, die das Admin-Passwort kannte.
So gut Copilot auch sein mag, dieses Passwort kennt es nicht.
Wahrscheinlich läuft es noch heute auf Linux von 2008.
Es war ein Zitat aus einem TikTok-Video.
Die MP4 wurde mit yt-dlp heruntergeladen und mit MacWhisper transkribiert.
Ich habe auch LLMs in Excel ausprobiert, und bei echten Daten geraten sie sofort durcheinander.
Demos zeigen immer saubere Finanzberichte oder Lehrbuchbeispiele.
Reale Unternehmensdaten sind völlig anders. In Excel ist das fast nutzlos.
Die Brendas, die ich kenne, machen nicht einfach nur Tabellenkalkulation.
Tatsächlich übernehmen sie komplexe Aufgaben wie Abstimmung mit dem Operations-Team, Analyse der Auswirkungen von Entscheidungen und Behandlung von Ausnahmen.
Copilot versteht diesen Kontext überhaupt nicht. Wenn man nach einer „Ausgabenabrechnungs-Vorlage“ fragt, liefert es ein Sheet mit #REF-Fehlern.
Es ist besser, selbst Verbesserungsvorschläge zu machen. Man kann zum Beispiel einen Link zu einer gemeinsam genutzten Arbeitsmappe erstellen, damit alle diesen verwenden.
Wenn er aber nicht konsequent aktualisiert wird, entsteht schnell wieder Chaos.
Immer wenn sich Prozesse ändern, ist Abstimmung nötig, sodass man am Ende wieder bei manueller Arbeit landet.
Das Problem „Ich habe Angst, dass AI alles kaputtmacht“ ließe sich durch Git-integrierte Excel-Versionierung abmildern.
Wenn man von Copilot erzeugte Formeln oder VBA-Änderungen auf Commit-Ebene nachverfolgt, sieht man klar, was passiert ist.
Brenda ist langsamer geworden, aber gerade deshalb weiß sie, wie man das gesamte System am Laufen hält.
Brenda verliert ihren Job, und jemand in einem anderen Land bekommt eine neue Stelle.
Auch wenn man AI nutzt, ist man nicht von Verantwortung befreit.
Man braucht genug Fachwissen, um die Ergebnisse von AI überprüfen zu können.
Man kann Zeit sparen, aber wegen des Validierungsprozesses oft weniger, als man denkt.
Ich mag Excel ebenfalls, aber komplexe verschachtelte Formeln finde ich immer noch schwierig.
Ich habe Modelle wie ChatGPT oder duck.ai ausprobiert, aber sie liefern oft völlig falsche Formeln.
Erst nach mehreren Korrekturaufforderungen funktioniert es halbwegs.
Dass LLMs Erklärungen auf Englisch geben, ist zwar gut, aber insgesamt bedeutete es vor allem Zeitverschwendung und Frust.
Anfangs glaubte ich, dass es Excel leichter machen würde, aber inzwischen bin ich überzeugt: Davon sind wir noch weit entfernt.