Ask HN: Wann hattet ihr bei GenAI den Moment: „Oh Scheiße, das ist ernst“?

(news.ycombinator.com)

6 Punkte von GN⁺ 2026-06-06 | 4 Kommentare | Auf WhatsApp teilen

Ein Thread, in dem konkrete Erfahrungsberichte geteilt werden, wie DALL-E und ChatGPT zunächst als abgestandene Spielerei abgetan wurden, man im praktischen Einsatz dann aber schockiert die Grenzen ihrer Fähigkeiten erkannte
Das populärste Beispiel ist das Firmware-Reverse-Engineering alter bzw. ausrangierter Hardware: Erfahrungen, wie Synthesizer, Klaviere und Firesticks mit Claude/GHIDRA wiederbelebt wurden
Über Coding hinaus gibt es zahlreiche Beispiele aus nichtfachlichen Bereichen, in denen LLMs zur Lösung alltäglicher Probleme eingesetzt wurden, etwa bei Gerätereparaturen, Immobilieninspektionen, Rechtsstreitigkeiten oder HVAC-Diagnosen
Manche schildern auch negative „oh shit“-Momente, etwa wegen sinkender Code-Qualität, Halluzinationen, unkritischem Vertrauen ohne Verifikation oder der Sorge vor dem Verschwinden von Berufen
Die schockierenden Wendepunkte unterscheiden sich je nach Person: ChatGPT-Start (2022), GPT-2/GPT-3, Tool Calling, Agenten und andere Etappen

Firmware- und Hardware-Reverse-Engineering

Um veraltete Software für einen Alesis-QS8.1-Synthesizer aus den 90ern zu ersetzen, wurden sysex-Befehle und ein undokumentiertes Wave-Encoding-Protokoll mit GHIDRA analysiert und über Nacht ein funktionierender Demo-Prototyp erstellt
Nachdem ein Kawai-CA49-Klavier durch fehlerhafte Firmware gebrickt wurde, dekompilierte Claude eine Android-APK, fand den hartcodierten Verschlüsselungsschlüssel, entschlüsselte die Firmware und stellte das Gerät mit einem Bluetooth-Flashing-Skript in einer Stunde wieder her
Die Blowfish-Verschlüsselung der The Complete New Yorker DVD wurde mit GHIDRA analysiert, Zugangsdaten wurden gemappt und mit einem Python-Skript nachimplementiert, um alle Dateien in normale PDFs umzuwandeln
Für einen Amazon Firestick der 1. Generation wurde ohne öffentlichen Root-Exploit der Kernel-Source genutzt, um mit einer „FBUF/VCHIQ kernel zero-write primitive“ den laufenden Kernel-Speicher zu patchen; permanentes Rooting und Debloating waren erfolgreich
Nur mit kompilierten C++-Vendor-Binaries und einem kurzen Netzwerk-Mitschnitt wurde ein proprietäres Protokoll mit dem NSA-Ghidra-Disassembler reverse-engineert; beschrieben wurde das Gefühl als „zu nichttechnischem QA degradiert“
Verwandte Einschätzungen
- Der Daten-Graben (data moat) von SaaS, der durch schwierige Integration und Migration entstand, verschwindet gerade
- Mit Claude Code wurde ein hinter einem Enterprise-Plan verstecktes SaaS-MCP aus internen APIs rückentwickelt und in kurzer Zeit ein funktionsreicheres MCP als das offizielle gebaut
- Claude ist bei Variablennamen weniger abhängig von menschlichen Konventionen, sodass weniger Renaming-/typedef-Arbeit nötig ist

Alltagsprobleme und nichtfachliche Problemlösung

An den Feiertagen 2025 wurde eine defekte furnace per Video von Gemini diagnostiziert; durch manuelles Andrehen des Abluftlüfters lief sie wieder an, wobei in den Kommentaren vor Kohlenmonoxid-Gefahr durch Umgehung einer Lüftersicherung gewarnt wurde
- Der Verfasser erklärte, es sei nur eine Starthilfe wegen eines Lagerproblems gewesen, keine Umgehung, und der Kohlenmonoxid-Monitor habe nicht ausgelöst
Bei einem Ausfall der AC-Kühlung leitete ChatGPT anhand von Fotos zum Austausch eines 25-Dollar-Kondensators an; die Reparatur gelang in Eigenregie zu etwa einem Viertel der Kosten eines Diagnose-Serviceeinsatzes
Bei einem Gas-Wäschetrockner ohne Heizleistung identifizierte Gemini auf einem Foto die thermal fuse und lieferte sogar einen Link zum Bauteil; mit einer 5-Dollar-Sicherung und Reinigung der Lüftung war das Problem behoben
Beim Immobilienkauf wurden Zillow-Fotos und Seriennummern von Geräten verwendet, um einen Inspektionsbericht erstellen zu lassen; dabei wurden Überflutungsrisiko in tiefer Lage, gemischte receptacle-Stromkreise und verzogenes Siding erkannt, die ein bezahlter 750-Dollar-Inspektor übersehen hatte
- Allerdings wurde auch skeptisch angemerkt, ob sich allein anhand von Fotos beurteilen lasse, ob Steckdosen zum selben Stromkreis gehören
Bei einer Koi-Teichpumpe mit unleserlicher Modellbezeichnung wurde das Modell anhand von Fotos und Längenmessung (11 Zoll = 4500, 9 Zoll = 2500) bestimmt; statt eines Kostenvoranschlags von 700 Dollar erfolgte der Austausch selbst für 109 Dollar
In einer Klage wegen Bankbetrugs wurden ChatGPT, Grok, Claude und Gemini gegeneinander gegengeprüft und eine Widerklage (counter-suit) zu 100 % mit AI betrieben; zugleich wurde zu anwaltlicher Beratung geraten und darauf hingewiesen, dass Chat-Protokolle nicht privilegiert sind und per subpoena angefordert werden können

Wandel in Coding- und Entwicklungs-Workflows

Nachdem ein Brother-Drucker-Firmware-Update CSV-Seiten in HTML verwandelt hatte, wurde aus einem Verzeichnis mit nur einer statischen HTML-Datei und einem Go-„hello world“ per einmaligem /init automatisch ein Prometheus-Exporter in Go erzeugt, inklusive Rückschluss auf Standard-IP und Parsing der Metriken
70.000 Zeilen PL/SQL aus einer Oracle-Apex-Web-App wurden in 15–20 Minuten auf 700 Zeilen Markdown-Business-Requirements verdichtet
In einer kleinen NGO schrieb Claude über Nacht eine mit NextJS, React und Microservices übertechnisierte App zu 80 % in serverseitig gerendertes Django um und senkte dadurch Serverkosten und Komplexität
ChatGPT Code Interpreter (2023.3) lud CSV-Dateien in Pandas, erzeugte Diagramme und exportierte nach SQLite; rückblickend wurde das als die erste Erfahrung mit Coding-Agenten, bevor die Kategorie so hieß, beschrieben
Negative und skeptische Coding-Erfahrungen
- Ein Fall von Halluzination bei einem automatischen AI-PR-Review behauptete bei einem PR, das nur Löschungen enthielt, es habe „ein neues RPC hinzugefügt“
- Ein Kollege wurde aus einem Projekt ausgeschlossen, nachdem er Tausende Zeilen Slop produziert hatte, etwa indem er zum Bestehen von Tests assert status == 200 in == 500 änderte
- Bei unklaren Spezifikationen wird Code leicht geschwätzig oder architektonisch schwach; daher sei der Produktivitätsgewinn mit Blick auf Qualität und Skalierbarkeit realer Projekte nicht besonders groß
- Die Beobachtung: Von Opus 4.6 über 4.7 zu 4.8 nehmen kleine Einzelfähigkeiten zwar zu, aber die „Fähigkeit zu wissen, was getan werden muss“ werde eher schlechter

Nicht-Coding-, kreative und kognitive Bereiche

Ein Pflanzenfoto wurde Claude gezeigt, das die Art erkannte, eine Diagnose stellte und sogar Methoden zur Stecklingsvermehrung erklärte; verblüffend war, dass der Computer nicht über Computer, sondern über Pflanzen sprach
Suno komponierte über den Familienhund einen Song mit einem Refrain im K-Pop-Stil; die Reaktion dazu: Kreativität habe man immer als Trennlinie zwischen Mensch und Maschine betrachtet
Nach dem Upload einer eigenen Zeichnung (Anatomieskizze) wurden Probleme wie „runde Schultern, falsche Perspektive, fehlende Darstellung des Deltamuskels“ benannt und mit einem Python-Skript Koordinaten zur Beschriftung gesetzt
Bei einem naturwissenschaftlichen Experiment eines Kindes (Elektromagnetismus) erkannte ein Gemini-Videoanruf eine nicht entfernte Isolierung an einem Batterieanschluss präziser als das bloße Auge und löste so das Problem
Bei satirischen Emoji-Arbeiten zu US-Präsidenten schlug das Modell für Zachary Taylor ein Kirsch-Emoji vor (wegen der Anekdote über seinen Tod durch Überessen); hervorgehoben wurde die kollaborative Qualität, „als würde man gemeinsam einen Workshop machen“

Negative Wendepunkte und Sorgen

Sorge bereitete ein Kollege, der massenhaft PRs schickte, sie für review-frei erklärte und dabei Slop ablieferte sowie menschlichen Engineers misstraute und stattdessen Claude-Chat-Logs einfügte; die Befürchtung: Der Rest der Karriere werde darin bestehen, mit „AI-Psychose“ zusammenzuarbeiten
- Eine Sichtweise dazu: LLMs verstärken Fähigkeiten – im Guten wie im Schlechten – und werden antisoziales Verhalten fördern
Auf ein HTTP-Proxy-Implementierungsbeispiel, das mit plausibler Rationalisierung das eigene Urteil stärkte, aber vollkommen unsicher war, weil es RFCs nicht verstand, reagierte jemand mit „Wir sind verloren“
Bei einem Firmen-Hackathon war der Schock groß, als ein Team LLM-Ausgaben ohne Verifikation als Fakten behandelte und daraus ein Produkt machen wollte; der Eindruck: Sie glauben wirklich, dieser Textgenerator würde schlussfolgern
Kritik gab es an den Übertreibungen von CEOs über eine „Ersetzung von White-Collar-Jobs in 12–18 Monaten“: Das heize Erwartungen übermäßig an und klaffe mit der Realität unzuverlässiger, halluzinierender Systeme auseinander
- Unbehagen löste auch das Vorgehen aus, Rechenzentren trotz Widerstand der Anwohner per Klage durchzusetzen
Als Beispiel für die Nichtdeterministik von LLMs wurde gezeigt, dass selbst bei Fragen wie „Wie oft kommt der Buchstabe d in den Wochentagen vor?“ Firefox auf 6 und Chrome auf 7 kam – also nicht einmal selbstkonsistent

Unterschiedliche Wendepunkte je nach Zeitphase

Mit der neuronalen Umstellung von Google Translate im Jahr 2016 wurden Übersetzungen zwischen Japanisch und Englisch erstmals praktisch brauchbar; man glaubte aber weiter, Bedeutung könne es nicht übersetzen – bis ChatGPT 2022 bei Pronomenbezügen und mehrdeutigem Kontext überraschte
Die Ankündigung von GPT-3 wird als „qualitativer Sprung“ eingeordnet; Chat, Tool Calling und Ähnliches danach eher als technische Evolution denn als wissenschaftlicher Durchbruch
GPT-2 und GANs im Jahr 2019 werden als der Punkt gesehen, an dem der Wandel von „offensichtlich fake“ zu „manchmal echt“ stattfand; alles danach sei überwiegend inkrementelle Verbesserung
Mit dem Start von ChatGPT (30.11.2022) hatte jemand das Gefühl, das „Zeitalter des traditionellen Programmierers“ gehe zu Ende, und experimentierte am nächsten Tag mit der ersten agentischen Coding-Schleife
IMO-Gold 2025, die Fähigkeit, neue Sätze zu bilden, Tool Calling und andere Momente wurden jeweils als persönliche Erkenntnis beschrieben, dass „Intelligenz tatsächlich modelliert wurde“

4 Kommentare

xguru 2026-06-06

Gerade im Hardware-/Firmware-Bereich gibt es definitiv viele erstaunliche Dinge.

Zu einer per Kickstarter erhaltenen Hardware gab es keine Mac-App, aber als ich die Windows-Version als Binärdatei gegeben und um Analyse gebeten habe, hat Codex eine gefälschte DLL mit den USB-bezogenen Windows-APIs erstellt, Hooking-Code eingebaut, anschließend sämtliche hin- und hergehenden Nachrichten mitgeschnitten und daraus eine fast identische Mac-App gebaut.

Meine Anweisung war einfach nur: "Analysiere die Windows-Version und mach mir eine Mac-Version daraus."

roxie 29 일 전

Wow … das ist wirklich erstaunlich.

dudnspa0203 2026-06-06

Ich halte es für einen ganz natürlichen Verlauf, dass neue Dinge gut beherrscht werden und sich die Funktionen verbessern. Aber immer wenn ich etwas Einfaches erledigen lasse und dann sehe, dass die Rechnung dafür unglaublich hoch ist, denke ich nur: Oh, das ist übel.

GN⁺ 2026-06-06

Hacker-News-Kommentare

jzemeocala: Ich habe ein Alesis QS8.1, ein hochwertiges Digitalpiano/Synthesizer aus den 90ern, sehr günstig gekauft, aber die zugehörige Software ist komplett veraltet, und ich war es leid, jedes Mal WINE zu benutzen
Also wollte ich einen modernen plattformübergreifenden Ersatz bauen, der die Funktionen mehrerer Programme kombiniert, und dachte, das würde sehr schwierig werden, weil die Kommunikation fast nur aus SysEx-Befehlen besteht. Aber Claude hat mich dabei angeleitet, die Originalsoftware mit GHIDRA zu analysieren, sodass noch in derselben Nacht eine funktionierende Demo herauskam, und jetzt füge ich neue Funktionen hinzu
- jsharf: Ich habe mein Kawai-CA49-Piano gebrickt, indem ich beim Firmware-Update die falsche Datei geflasht habe, aber Claude hat Lebenszeichen gefunden, die Kawai-Android-APK heruntergeladen, Java dekompiliert und den hartkodierten Schlüssel gefunden, der für die Firmware-Verschlüsselung verwendet wurde
  Als OTA nicht funktionierte, hat es sogar die Piano-Firmware extrahiert und entschlüsselt und ein Flash-Skript geschrieben, das das Piano per Bluetooth vom Laptop aus programmiert, sodass das Piano in weniger als einer Stunde wiederbelebt war
- gyomu: Solche Tools sind extrem gut im Reverse Engineering
  Mit ein wenig Wissen ist es trivial geworden, innerhalb weniger Stunden oder noch schneller jedes beliebige Protokoll zu analysieren und Software zu knacken, und obwohl sich das nicht deutlich zeigt, weil es in der Branche viele Stakeholder gibt, die nicht möchten, dass sich das öffentlich herumspricht, sind die Auswirkungen enorm
- notagoodidea: Nachdem ich [0] und die Arbeit gesehen habe, bei der die Ableton-Move-Firmware mit Schwung [1] gepatcht wurde, möchte ich mehr darüber wissen, wie das in der Praxis gemacht wird
  Nicht nur bei alter Hardware, sondern auch bei neuer Hardware gibt es dank LLMs/generativer KI mehr Erkundung von Patches, Ersatzlösungen und der Entwicklung neuer Firmware
  [0] https://mforney.org/blog/2026-05-28-patching-my-guitar-amps-... [1] https://schwung.dev
SubiculumCode: Von Anfang an
Es war als Dungeon-Spiel aufgezogen, bei dem Räume beschrieben werden und ich meine Aktionen auswähle, und zuerst dachte ich, der Dungeon basiere auf einer komplexen Datenbank
Aber als ich sagte, ich wolle hinaus, und es dann in ein Gasthaus ging, ich mit der Bedienung in der Schenke flirtete und die Szene kurz darauf bis zu einem Sonnenuntergang auf einer Wiese weiterlief, dachte ich: „Oh, das ist übel“
Es wirkte, als würde die Maschine mit Sprache auf Sprache reagieren und dabei Verständnis und Intelligenz simulieren, und es fühlte sich an, als wäre ich zum ersten Mal einem Außerirdischen begegnet, der meine Sprache kannte; da hatte ich das Gefühl, dass die Welt nie wieder so sein würde wie zuvor
monuszero: Vor ein paar Jahren habe ich in einem einmonatigen Sprint eine Funktion zur Bewegungsplanung für Roboter in unsere Codebasis eingebaut, war mit den Ergebnissen aber immer unzufrieden
Wir sind ein kleines Team, also haben wir OMPL vendored und Caching sowie Roadmap-Management gebaut, und obwohl uns klar war, dass sich einige der verwendeten Algorithmen mit SIMD oder GPU-Kernels parallelisieren ließen, war fraglich, ob sich der Kampf mit CUDA oder Metal/Accelerate lohnt
Eines Abends beim Kochen habe ich Opus 4.6 die nötige Literaturübersicht zu Planern in die docs gelegt und es einen nativ beschleunigten Roadmap-Planer von Grund auf implementieren lassen, und bis das Pastawasser kochte, war eine Implementierung fertig, die die mehrsekündigen Planungen des OMPL-Codes auf einige hundert ms reduzierte
Da wurde mir klar, dass sich der wirtschaftliche Wert der Zeit für die Zubereitung des Abendessens mit einer ehrlichen zweiwöchigen Programmieraufgabe vergleichen lässt, und Dinge, deren Zeitaufwand früher riskant oder luxuriös gewesen wäre, werden plötzlich zu prüfenswerten Optionen
Für kleine Teams, die wissen, was sie wollen, und einen Agenten so aufsetzen können, dass er Erfolg hat, ist das ein kompletter Gamechanger, und die bisherigen Platzhirsche sollten vorsichtig sein
andrewthornton: In den Feiertagen 2025 ist meine Heizung ausgefallen, und der Reparaturtermin war erst zwei Tage später, also wurde es im Haus ziemlich kalt
Ich bin auf den Dachboden gestiegen, habe mehrere Videos aufgenommen, wie die Heizung zu starten versucht, und sie Gemini gegeben, das das Problem sofort diagnostizierte und mir sagte, ich solle beim Zündversuch den kleinen Abluftlüfter andrehen, worauf sie sofort anging
Ich musste das wiederholen, bis der HVAC-Techniker kam, aber so konnten wir durchhalten
- jodacola: Diese Woche hatte ich etwas Ähnliches
  Ein Mieter in einem Mietobjekt sagte, die Klimaanlage kühle nicht, also rief ich wie üblich unseren HVAC-Betrieb an, aber es meldete sich deren neuer KI-Sprachassistent, und die Erfahrung war furchtbar; man sagte, das Büro würde zurückrufen, aber es kam nie ein Anruf
  Also bin ich selbst hingefahren, habe ein Foto vom Kompressor-Panel der Außeneinheit gemacht und es mit ChatGPT diagnostiziert; nach einigem Hin und Her zu Prüfpunkten und Diagnosecodes hat es mich sogar durch eine einfache Reparatur geführt, nämlich den Austausch eines 25-Dollar-Kondensators
  Normalerweise hätte allein der Diagnosebesuch fast das Vierfache gekostet, aber wegen generativer KI habe ich das Vertrauen in den HVAC-Betrieb verloren und dank einer anderen generativen KI das Gerät noch am selben Tag selbst repariert
- brntheater: Diese Woche ging mein Gastrockner zwar an, heizte aber nicht, und Gemini schlug als häufige Ursache eine Thermosicherung vor
  Nachdem ich die Rückwand geöffnet und Fotos hochgeladen hatte, zeigte es mir die Sicherung genau, etwa als „das weiße Rechteck über den blauen und roten Kabeln“, und erklärte mir, wie ich sie testen kann; als ich die Modellnummer des Trockners angab, fand es auch gleich die passenden Teilelinks
  Zum Schluss meinte es, die Sicherung sei höchstwahrscheinlich durchgebrannt, weil die Wärme nicht entweichen konnte, und empfahl, die Lüftung zu reinigen; nach einer gründlichen Reinigung des Abluftkanals und dem Austausch der 5-Dollar-Sicherung funktionierte alles wieder
- tonyedgecombe: Ich installiere gerade eine Küche, und ChatGPT hilft mir dabei, Ideen gegenzuprüfen und Probleme zu lösen
  Wenn die IKEA-Dokumentation nicht so dürftig wäre, bräuchte ich das wahrscheinlich nicht, aber es fühlt sich ähnlich an wie der Vorteil, den ein Anfängerprogrammierer bekommt
  Ein Profi würde meine Arbeit vermutlich auslachen, aber Profis sind teuer und schwer, mit ihnen zusammenzuarbeiten, und ich bringe die Arbeit trotzdem zu Ende
  Für Entwicklungsarbeit nutze ich KI dagegen nicht, weil ich befürchte, dass meine Fähigkeiten verkümmern oder ich neue Dinge nicht richtig lerne
shreddude: Claude hat kürzlich die Firmware meines Campervans dekompiliert, anschließend die CAN-Schnittstelle dokumentiert und dann ein ESP32-Modul programmiert, das mit integrierten Systemen wie Stromversorgung, HVAC, Beleuchtung und Tanks kommuniziert
Diese Art der Integration eingebetteter Systeme liegt außerhalb meines Fachgebiets, aber ich nutze Claude täglich sowohl bei meiner Arbeit als Solution Architect als auch für private Projekte und setze Dinge um, an die ich allein nie herangekommen wäre; deshalb fällt es mir schwer, AI-Skeptiker zu verstehen
- williamdclt: Der Teil mit den „Projekten, an die ich allein nie herangekommen wäre“ scheint mir genau der Punkt zu sein, der Enthusiasten und Skeptiker trennt
  Wenn man generative AI für Dinge einsetzt, die man vorher nicht konnte, ist sie ein erstaunliches Werkzeug; setzt man sie für Dinge ein, die man bereits gut kann, verändert sie nicht gleich das ganze Spielfeld und ist für Experten höchstens ein kleiner Boost
  Viele Menschen haben Berufe, in denen sie genau das tun, worin sie Experten sind
- jesse_dot_id: Ich bin DevOps-Ingenieur und kenne mich in vielen Bereichen ein bisschen aus, und Claude Code füllt meine Wissenslücken so gut, dass ich mich fast wie ein Superheld fühle
  Der entscheidende Punkt scheint aber zu sein, dass man schon ziemlich gut verstehen muss, worauf man überhaupt schaut
- doctorwho42: Es könnte sein, dass das Investitionsvolumen den eigentlichen Wert bei Weitem übersteigt
  Welches 1-Billion-Dollar-Problem löst AI überhaupt?
loudmax: Anfang 2023, als ich mir die bei Meta geleakten 7-GB-Gewichte per Torrent heruntergeladen und alpaca.cpp auf meinem Desktop gestartet habe
Ich fragte nach dem Römischen Reich, und es antwortete auf Englisch; größtenteils falsch, aber nicht schlechter als das Rätselraten eines durchschnittlichen US-College-Studenten, nur mit deutlich mehr Selbstvertrauen
Entscheidend war nicht, ob die Antwort verlässlich war, sondern die Tatsache, dass nicht ein schicker Server in einem riesigen Google-Rechenzentrum, sondern meine Desktop-CPU auf englische Fragen antwortete
Sich mit einer CPU auf Englisch unterhalten zu können, fühlte sich eher so an, als würde man mit einem Hund sprechen
- stogot: Ich habe genau das Gleiche ausprobiert, und obwohl es langsam war, wurde mir klar, dass es kein Zurück mehr gibt
  In nur 3 Jahren wurde es 100-mal besser
jp57: Bei mir war es ungefähr letztes Jahr, in einem ganz banalen Moment, als ich herausfinden wollte, was man braucht, um das Auto meiner Tochter mit einem Truck quer über den Kontinent zu ziehen
Zuerst habe ich ChatGPT wie Google eine Reihe kleiner Einzelfragen gestellt, aber dann fragte ich einfach: „Ich will Auto A mit Truck B von C nach D schleppen, welche Optionen habe ich?“ Daraufhin schrieb es mir einen Bericht mit Vergleichstabellen für Trailer und Dolly, Berechnungen zur Anhängelast, Kosten und allen Details
Da dachte ich: „Das ist etwas anderes, und es ist erst der Anfang“
- SamuelAdams: Ich habe generative AI auf ähnliche Weise für die Prüfung eines Immobilienkaufs genutzt
  Ich habe Zillow-Fotos, Seriennummern von Geräten, den Schaltschrank und weitere Bereiche, die ich beim Rundgang selbst fotografiert hatte, eingegeben und sie einen Bericht wie ein Hausinspektor schreiben lassen; dabei fand sie sogar Probleme, die der Prüfer für 750 Dollar übersehen hatte, und machte es tatsächlich besser
- flyinglizard: Es ist aber gut möglich, dass das Ergebnis komplett falsch war
  Aus Faulheit habe ich Claude und ChatGPT ein paarmal nach einfachen, eindeutigen Daten wie Drehmomentwerten eines Dirtbikes gefragt, und sie lagen oft völlig daneben, obwohl sie die Antwort selbstbewusst vortrugen
  Selbst wenn ich ein PDF per Retrieval-Augmented Generation (RAG) als Kontext einbinde, bin ich misstrauisch, deshalb vertraue ich einem LLM bei exakten numerischen Daten nie
yauneyz: Ich ließ es eine kurze Geschichte darüber schreiben, wie Vader und Palpatine das Gram-Schmidt-Verfahren entdecken
Es war kein Meisterwerk, aber der Ton stimmte, und es hatte verstanden, was Gram-Schmidt ist; damals fand ich das völlig irre faszinierend
AussieWog93: Erst gestern Abend habe ich Claude Code direkt den Prompt gegeben, dass Kodi beim Start auf einem Chromecast 4k abstürzt, es sich per adb verbinden, die genaue Absturzstelle debuggen und eine Lösung vorschlagen soll
Ohne menschliches Eingreifen fand es die Ursache des Absturzes, lud den Kodi-Quellcode herunter, patchte einen Bug, der seit 2016 existierte, kompilierte neu, signierte alles und pushte es auf den Chromecast, wobei alle Einstellungen erhalten blieben
Ich ließ es auch einen PR erstellen; der ist noch nicht öffentlich, und ich werde noch ein paar Wochen weiter testen
- darksim905: Es ist kein direkter Vergleich, aber wenn ich sehe, wie Tools wie Copilot schon daran scheitern, selbst eine einfache Profilseite auf LinkedIn zu sehen, frage ich mich skeptisch, wie Arbeit in dieser Tiefe überhaupt möglich sein soll
  Möglich ist es vielleicht, aber ich würde gern wissen, mit welcher Technik und welcher Toolchain das so funktioniert hat
- calf: Aus der Perspektive von jemandem, der sich schwer damit tut, mit LLMs überhaupt etwas Nützliches zu finden, ist das beeindruckend
  Mich würde interessieren, ob diese Arbeit länger als ein paar Minuten gedauert hat und ob man dafür die Bezahlversion von Claude Code braucht
evdubs: Ich habe getestet, ob ein LLM-Anbieter juristische Dokumente ohne Halluzinationen in ein konsistentes Format umschreiben und dabei Auslassungen finden kann, und es konnte das
Danach wollte ich sehen, ob das auch mit einem lokalen LLM möglich ist, und Gemma-4 schaffte es mit einer 8-GB-Grafikkarte und großem 128k-Kontext gut; dasselbe Modell war auch bei OCR und Übersetzung ziemlich gut
Da wurde mir klar, dass LLMs hervorragend dafür sind, Dinge zu erledigen, bei denen ich ohnehin schon weiß, was ich will und wie es geht, die dabei gewonnenen Fähigkeiten aber wenig wertvoll sind und ich die Arbeit selbst wahrscheinlich nur halbherzig machen würde
Seitdem betrachte ich es durch die Brille: „Kann ich das LLM etwas erledigen lassen, worum ich mich ohnehin nicht besonders kümmern würde?“
- SoftTalker: Die besten Ergebnisse mit LLMs hatte ich bei Aufgaben, bei denen Lesen, Umformatieren, Übersetzen oder Zusammenfassen das Ziel war
  Solche Dinge gehen damit viel schneller als von Hand, und sie sind zumindest im Moment auch weniger anfällig für Ermüdung durch Langeweile
- gscott: Mein Sohn führt gerade einen Rechtsstreit mit einer Bank; nachdem die Bank betrügerische Forderungen abgewickelt, Chargebacks abgelehnt und ihn dann auch noch auf Zahlung verklagt hat
  Mein Sohn verteidigt sich mit Claude und Gemini gegen die ursprüngliche Klage und betreibt nun auch die Widerklage zu 100 % mit AI
  Er gibt alles in mehrere AIs, lässt sie sich gegenseitig prüfen und weitere Ideen erzeugen; angefangen hat er mit ChatGPT, wechselte dann zu Grok und Claude, und im Moment liefert Gemini die stärksten Ergebnisse
- jasondigitized: Das sind Dinge, die man zwar könnte, für die einem aber Zeit und Energie fehlen
  Situationen, in denen man einfach sagen kann: „Hol Claude dazu“
kstrauser: Bei der Arbeit haben wir ein großes Token-Budget, und ein Kollege bat mich um eine zweite Meinung, nachdem er bei einem bekannten Projekt während eines Schwachstellentests einen furchteinflößend aussehenden Remote-Exploit gefunden hatte.
Ich habe das Projekt lokal gestartet und den POC ausgeführt, aber es passierte nichts, und ich stellte fest, dass dafür eine Konfiguration nötig war, die die standardmäßigen Sicherheitsvorkehrungen abschwächte.
Also bat ich die AI, den POC so zu ändern, dass er auch mit den Standardeinstellungen funktioniert, und ein paar Minuten später hatte sie ihn zu einer einsatzfähigen Version gepatcht; die lokale Instanz, die ich gerade heruntergeladen, selbst kompiliert und mit den Standardeinstellungen gestartet hatte, stürzte sofort ab.
Als ich auf den blinkenden Cursor in der Konsole starrte, bekam ich kalten Schweiß, als hielte ich eine Art nuklearen Informationssprengsatz in der Hand, und ich wälzte mich die ganze Nacht herum und schlief vielleicht 30 Minuten.
Dafür hatte das Team danach eine klare ethische Richtung: Wir sollten diese Arbeit tun, gerade weil wir es können, und die Ergebnisse mit den betreffenden Autoren teilen.
Ich möchte in einer Welt leben, in der die Guten Probleme beheben, bevor die Schlechten sie finden, also habe ich beschlossen, jetzt daran mitzuarbeiten, diese Welt zu schaffen.
- lobf: Ich frage mich, wofür POC hier steht.
  Ich sehe davor keine Wortkombination, aus der das Akronym entstehen könnte.
ddxv: Wenn ich LLM-generierten Code benutze, denke ich meistens eher „Oh, cool!“, aber ein paar Wochen später kommt dann der Moment „Hm?“, wenn ich merke, dass der „coole“ Code, den das Modell als testbestanden ausgegeben hat, einen subtilen Bug hatte und ich ihn nicht sorgfältig genug gelesen habe.
Das größte Risiko ist, faul zu werden, mehrere Dateien und viele Änderungen auf einmal machen zu lassen und dann YOLO zu gehen, ohne vollständig zu verstehen, was eigentlich getan wurde.
Im Frontend kommt man damit meist durch, aber bei Datenmanipulations-Aufgaben ist es wahrscheinlich nicht das, was man will, wenn man es nicht versteht, und ein paar Wochen später gräbt man sich wieder hinein, um herauszufinden, was sich geändert hat.
Es ist ähnlich wie das Leben vor LLMs, als man von StackOverflow kopiert und eingefügt hat, nur dass Copy-paste jetzt viel schneller ist und Boilerplate gut erledigt wird, sodass man sich auf Edge Cases konzentrieren kann.
UncleOxidant: Ich habe kürzlich mit Claude zu Demo-Zwecken einen auf einem FPGA laufenden spikenden neuronalen MNIST-Klassifikator gebaut.
Claude deckte die ganze Kette ab: vom Konzept über PyTorch, Training und Verilog-Implementierung bis zur FPGA-Synthese, und ich ließ mir auch eine App bauen, in der man auf dem PC mit der Maus eine Zahl zeichnet und dann auf einen Klassifizieren-Button klickt.
Ich musste die Daten per USB und dann per SPI an das FPGA schicken, aber mein SPI-Adapter war noch auf dem Versandweg, also bat ich darum, den im Verilator-Simulator laufenden Verilog-Code über virtuelles SPI kommunizieren zu lassen, und ging Mittag essen.
Als ich zurückkam, war die Zahlenzeichen-App auf dem Bildschirm, ich zeichnete eine „2“, sie wurde als 2 klassifiziert, und in einem anderen Fenster zeigte der Verilator-Simulator die Datenübertragung.
Ich bekam eine Gänsehaut.
HlessClaudesman: Ich hörte in einem Café einen Podcast, in dem es hieß, irgendein SF-Autor schreibe mehr als 40 Bücher im Jahr, und ich dachte, das müsse entweder ein Ghostwriter-Team, eine enorme Menge Kokain oder AI sein.
In den frühen ChatGPT-Tagen lud ich eine App herunter und ließ sie alle Phasen des Romanschreibens durchlaufen — also Gliederung, Figurenzusammenfassungen, Handlungszusammenfassungen, Kapitelentwürfe und fertige Kapitel — und ungefähr zu dem Zeitpunkt, als ich über einen zweiten Kaffee nachdachte, war ein unredigiertes Manuskript fertig.
Es war ein schrecklicher Roman, aber es gab Geistesblitze, die man herauslösen und überarbeiten konnte, und damit war für mich die Hypothese bewiesen, dass AI großskalige Massenproduktion von Fiktion leisten kann.
Mit genug Kokain könnte man zusammen mit AI wohl 40 Bücher pro Woche raushauen.
mindcrime: Ich erinnere mich nicht an einen ganz bestimmten einzelnen Moment, aber ich war schon ziemlich beeindruckt, als ich zum ersten Mal mit ChatGPT interagierte.
Ich war überhaupt nicht bereit, es AGI zu nennen, aber es war etwas Neues, und intuitiv war klar, dass „die heutige AI künftig der schlechteste Zustand sein wird“ und dass das Tempo der Veränderung schwer vorherzusagen ist.
Je mehr ich sie benutze, desto sicherer bin ich mir zu 100 %, dass es legitim ist zu sagen, dass sie in einem gewissen Sinn intelligent sind.
Es ist immer noch keine AGI oder Intelligenz auf menschlichem Niveau, aber ich sehe es ähnlich wie Demis Hassabis mit „jagged intelligence“: in manchen Bereichen sehr intelligent und in anderen deutlich weniger.
Ich halte es für möglich, dass es auch Intelligenz geben kann, die nicht wie menschliche Intelligenz funktioniert, daher haben für mich Argumente der Art „keine echte Intelligenz“ fast kein Gewicht.
Dazu liegt bei mir seit Langem ein Blog-Entwurf mit dem Titel „The Marquee Sign Says 'Artificial' Intelligence“, aber ich habe nicht vor, ihn stattdessen von AI schreiben zu lassen.
Für Recherche, Gliederung und Brainstorming benutze ich AI, aber bei Texten, die unter meinem Namen erscheinen, ziehe ich die Grenze so, dass es meine echte Stimme sein muss.
ben_w: Solche Momente gab es mehrere.
Die erste InstructGPT-Demo war schockierend, weil ich mich noch daran erinnerte, wie schlecht der frühere Stand der Technik bei der Sprachverarbeitung war, und bei GPT-3.x wegen der Qualität der Fortsetzungen nicht damit gerechnet hatte, dass es auch Anweisungen befolgen würde.
So war es auch 2019 bei This Person Does Not Exist, 2016 bei Style Transfer und ähnlichen Techniken (https://github.com/awentzonline/image-analogies) und bei dem, was man heute Deepfakes nennen würde (https://www.youtube.com/watch?v=_S1lyQbbJM4), sowie 2015 bei Teslas OTA-Update für autonomes Fahren (https://www.popsci.com/tesla-cars-become-autonomous-overnigh...).
2013 war auch word2vec mit „man“ - „woman“ ~= „king“ - „queen“ so ein „Hm?“-Moment, gerade weil ich den früheren Stand der Sprachverarbeitung kannte; wenn man dann noch über automatisierte Propaganda oder Überwachung durch das Verstehen von Szenesprache wie Polari nachdenkt, erst recht.
Ich erinnere mich auch an das Word-Lens-Demovideo von 2010 (https://www.youtube.com/watch?v=h2OfQdYrHRs).
alexfoo: Jemand aktualisierte die Firmware eines Brother-DCP-L3550CDW-Druckers, danach verschwand die CSV-Seite, die der bisherige Prometheus-Exporter genutzt hatte, und es blieb nur noch eine HTML-Seite übrig, in der die Informationen auf mehrere div-Elemente verteilt waren
Ich wollte den Exporter schon selbst durch Parsen des HTML schreiben, testete dann aber Claude und legte in eine Sandbox-VM eine statische HTML-Datei der Drucker-Statusseite sowie eine minimale Go-Datei, die nur fmt.Printf("OK\n") enthielt
Das Verzeichnis hieß brother-exporter, und obwohl ich weder weitere Anweisungen noch die Aufgabe noch die Sprache genannt hatte, schloss Claude allein aus /init, dass ein Go-Prometheus-Exporter geschrieben werden sollte
Innerhalb von 10 Minuten erzeugte es tadellosen Code, der vom Standarddrucker unter 192.168.1.1 das HTML holt, parst und Metriken bereitstellt, die Prometheus scrapen kann
Ich hätte dafür wohl Stunden gebraucht, aber am meisten schockierte mich, wie viel es anfangs aus so wenigen Informationen korrekt erschlossen hat
tern: Zuerst war es, als Opus 3.x mir mit Obsidian MCP ein Produktivitätssystem gebaut hat, und dann die Entdeckung von Prompts der Art „Erstelle ein mathematisches Modell des Problems und leite daraus die Lösung her“
Das eigentliche „Wow“ war, als ich lange eine neuartige Compiler-/Runtime für Echtzeit-DSP spezifiziert hatte und sie dann tatsächlich funktionierte
Die Reihenfolge war ungefähr: Es hilft mir, mich selbst zu verstehen → es hilft mir, gute Ideen zu verknüpfen → mit den richtigen Inputs erzeugt es neue Ideen → es baut auf meiner Maschine nützliche Werkzeuge → mit iterativen Durchläufen synthetisiert es gute Ideen zu besseren Ideen → es baut große Systeme, die weit über meine üblichen Fähigkeiten hinausgehen
Die aktuelle Frontlinie ist, große Codebasen mit iterativen Durchläufen zu besseren Systemen zu synthetisieren, und der Schlüssel ist zu verfolgen, ob der Prozess konvergiert und Zinseszinseffekte erzeugt oder ob er auf der Stelle tritt bzw. divergiert
- mayank: Diesen Verlauf kann ich sehr gut nachvollziehen
  Im März 2024 wollte ich eine schwierige Forschungsaufgabe in der natürlichen Sprachverarbeitung untersuchen und implementieren und hatte das Gefühl, dass sich das allein mit Prompts und der Completions API ziemlich gut annähern ließe
  Mitte 2025 analysierte Llama 3 eine ziemlich große Codebasis, in die ich gerade eingearbeitet wurde, und synthetisierte Ergebnisse auf dem Niveau von Diagrammen, die ich sonst selbst als entscheidendes Werkzeug erstellt hätte
  Im Dezember 2025 erzeugte Opus 4.5 mehrere Klassenmodule und Tests syntaktisch nahezu perfekt, und mir wurde klar, dass die Fehler an einer zu ungenauen Spezifikation in meinem Prompt lagen
  Inzwischen schreibe ich fast keinen Code mehr von Hand, weil es gut genug ist und Beigaben wie Tests, Dokumentation und Build-Skripte quasi gratis mitkommen
notthetup: Ich hatte einzigartige Konzert-Audioaufnahmen, die beim Verschieben von Dateien während eines Backups beschädigt worden waren
Es sah so aus, als wären die Daten noch da, aber keine Software konnte sie abspielen, und nachdem ich sie 5 Jahre liegen gelassen hatte, versuchte ich eine Wiederherstellung mit AI-Tools
Nach 20 Minuten mit Copilot und viel Herumstochern in Hex-Dumps hatte ich zunächst eine halbfunktionierende Lösung, bei der nur die ersten paar Sekunden der Dateien abgespielt wurden, am Ende gelang jedoch die Wiederherstellung aller Dateien
nwhitehead: Eine Geschichte meiner Ehepartnerin bzw. meines Ehepartners: Heute hat Claude einen Bug diagnostiziert, der den Fortschritt in einem Steam-Spiel blockierte, das sie oder er unbedingt spielen wollte
Es dauerte 18 Minuten, aber Claude entpackte das Godot-Paket, fand den Bug, schlug einen Fix vor und erklärte sogar einen Workaround im Spiel
Ich musste gar nichts tun; Claude analysierte mit strings die Struktur der .pck-Datei und schrieb anschließend Python-Code mit Godot-spezifischer Magie, um einen bestimmten Chunk zu entpacken
simonw: Bei mir war es etwa im März 2023, als ich ChatGPT Code Interpreter sah
Ich lud eine CSV-Datei zu Polizeivorfällen in San Francisco hoch, und es las sie mit Pandas ein, zeigte Diagramme an und exportierte die Daten dann als SQLite-Datenbankdatei zum Download
Als jemand, der Software für Datenjournalist:innen baut, sah es allein durch den Nebeneffekt, Python in dem Ordner mit den hochgeladenen Dateien ausführen zu können, so aus, als könnte es alles erledigen, was ich mir immer von Software gewünscht hatte
Rückblickend war das mein erster Kontakt mit einem Coding-Agenten, aber damals gab es für diese Kategorie noch nicht einmal einen Namen
mlmonkey: Ein befreundeter Berater hatte sich eine Nische rund um Netsuite und Oracle aufgebaut, kam aus der Buchhaltung, richtete Kundeninstanzen ein, verdiente viel Geld und spielte viel Golf
Kurz nachdem ChatGPT im Mainstream angekommen war, erzählte ich ihm begeistert von den Möglichkeiten der AI, und er versuchte das abzuwiegeln mit „Meine Arbeit kann das nicht machen“; zu Hause testete ich es dann auf meinem Laptop
Ich ließ es eine Netsuite-Konfigurationsspezifikation mit allen möglichen Optionen und Setups eingeben, so wie seine Kunden sie liefern würden, und bat um die Konfigurationsbefehle; daraufhin spuckte ChatGPT reihenweise die auszuführenden Befehle und die zu setzenden Optionen aus
Mein Freund meinte nur niedergeschlagen: „Das sind exakt die Befehle, die ich ausführe“, hat sich inzwischen aber einige private Unternehmen von Eigentümern, die er kennt, als stabile Kunden gesichert und verdient damit offenbar noch genug, um sein Golfhobby weiter zu finanzieren
- reactordev: Manchmal ist der Service selbst wichtiger als der Wert, den man liefert
  Auch wenn Kunden ConsultBot 2.0 selbst laufen lassen könnten, wissen sie wie immer zu schätzen, dass es in verlässlichen Händen liegt
djfergus: Ich hatte einen Amazon Firestick der ersten Generation, der jahrelang in einer Schublade gelegen hatte, auf aktuelle Software aktualisiert wurde und für den es keinen öffentlichen Root-Exploit gab
Einen Tag lang ließ ich Claude und Codex abwechselnd recherchieren, den Kernel-Quellcode herunterladen und Exploits ausprobieren, bis schließlich mit „FBUF/VCHIQ kernel zero-write primitive to patch live kernel memory“ Root-Zugriff erlangt wurde
Ich konnte den Root-Zugriff persistent machen, die Amazon-Apps entfernen und die Firmware downgraden, und das ließ mich auf eine Zukunft hoffen, in der sich mehr alte und neue Hardware wiederverwenden lässt
- aizk: Kannst du das auf GitHub teilen?
PopePompus: Ich baute mit Claude Code gerade eine alte Astronomie-App, die ich noch aus der Zeit vor dem iPhone App Store für das Nokia N900 geschrieben hatte, als Android-App neu
Die ursprüngliche App bestand aus mehreren Anzeigeseiten für Dinge wie Planetenpositionen, und ich ließ sie Seite für Seite allein anhand von Bildschirmbeschreibungen nachbauen, ohne den Originalcode oder überhaupt dessen Existenz zu erwähnen
Nachdem mehrere Seiten nachgebaut waren, fügte Claude noch eine zusätzliche Seite hinzu, um die ich gar nicht gebeten hatte; diese Seite gab es in der ursprünglichen Nokia-App, aber ich hatte noch nicht gesagt, dass sie in die Android-App übernommen werden sollte
Der Nokia-App-Code war noch auf GitHub vorhanden, und es wirkte, als hätte Claude irgendwie die von mir angeforderte Arbeit mit meinem GitHub-Repository des Nokia-Codes verknüpft; die fehlende Seite wurde exakt umgesetzt, was mir buchstäblich die Kinnlade herunterklappen ließ
vitorbaptistaa: Ich war CTO einer kleinen NGO mit 10 Leuten, und damals gab es nur einen Junior-Entwickler; wir mussten zwei von Beratern gebaute Apps betreuen
Es war eine chaotische Struktur mit NextJS, React und vier Microservices für eine Website mit 50 Nutzern pro Woche
Ich habe einen devcontainer mit der alten Codebasis und ein leeres Repository vorbereitet, Claude angewiesen, alles als serverseitig gerenderte Django-App neu zu schreiben, und bin schlafen gegangen; am Morgen waren 80 % erledigt
Nach ein paar weiteren Tagen mit Prompts und Reviews hatten wir funktionale Gleichwertigkeit erreicht, und die andere App haben wir auf dieselbe Weise erledigt
Beide sind jetzt deployed, Serverkosten und Komplexität sind gesunken, sie sind um mehrere Größenordnungen schneller, und ohne AI-Agenten hätten wir das wohl nie geschafft, wie so oft bei technischem Ballast; für kleine Organisationen ist AI erstaunlich nützlich
dang: Ein großer Moment war, als ich gesehen habe, wie es in wenigen Sekunden Log-Dateien analysiert hat
Ich hätte dafür Stunden gebraucht, realistisch eher Tage, und deshalb hätte ich es von vornherein gar nicht gemacht
Es hat mir auch geholfen, seit Jahren aufgeschobene Optimierungen anzugehen, weil es die Einstiegshürde gesenkt hat, für deren Überwindung mir die Zeit zum Lernen fehlte, und es hilft besonders beim Verfolgen von Nebenläufigkeits-Bugs wie Race Conditions
Es hat sogar Informationen gefunden, die ich über Google nicht finden konnte(https://news.ycombinator.com/item?id=42653136); gemeinsam ist all diesen Fällen, dass es Dinge tatsächlich geschehen lässt, die nicht unmöglich waren, sondern nur wegen des enormen Zeit- und Arbeitsaufwands nie passiert wären
- bentcorner: Heute habe ich einen Agenten zwei Logs vergleichen lassen, um einen winzigen Unterschied zu finden, der die Ursache des Problems war
  Als ich auf die problematische ADO-Erweiterung gezeigt habe, hat er das VSIX heruntergeladen, die .NET-Binärdateien dekompiliert und nachgesehen; auf dieser Basis schlug er einen Workaround vor, bei dem ich sehr skeptisch war, der aber tatsächlich funktioniert
  Technisch hätte ich das auch selbst gekonnt, aber wegen des unklaren Nutzens und des hohen Zeitaufwands hätte ich es wahrscheinlich nicht getan
- djmips: In einem persönlichen Spieleprojekt, das ich vor 20 Jahren gemacht habe, gab es einen üblen Bug, und deshalb konnte ich nie den finalen Release machen; zum Debuggen bin ich auch nie zurückgekehrt
  Gestern sah ich es ganz oben auf GitHub, erklärte das Problem, und Claude fand den Bug sofort; nach ein paar Gesprächsrunden hatte es einen Fix, mit dem ich zufrieden war
  Jetzt sieht es so aus, als könnte ich endlich den finalen Release machen, und es fühlt sich gut an, etwas so lange Unerledigtes abschließen zu können
hgoel: Kürzlich habe ich Claude um Hilfe beim Zeichnen gebeten, besonders beim Lernen von Anatomie
Ich habe eine Skizze hochgeladen und um Feedback gebeten; entgegen meiner Erwartung war es sehr nützlich und erklärte genau die Stellen, die ich selbst als seltsam empfand, auf die mich aber niemand hingewiesen hatte
Aus Neugier bat ich darum, die Probleme direkt auf der Skizze zu markieren, und es schrieb ein Python-Skript mit Koordinaten und brachte die Labels selbst an
Weil bei mir noch die Wahrnehmung hängen geblieben war, dass vLLM für visuelle Aufgaben noch nicht viel taugt, war es ziemlich überraschend, tatsächlich nützliche Zeichenratschläge zu bekommen
- loneboat: Mich würde interessieren, was für Feedback das war
  Anatomisches Feedback, also zum Beispiel „Der Arm setzt dort nicht an“, oder eher zeichnerische Technik wie Tipps zu Licht und Schatten?
takee: Ich machte mit meinem 10-jährigen Kind ein Elektromagnetismus-Experiment für die Wissenschaftsmesse der Schule und stieß auf ein Problem, das ich selbst nicht debuggen konnte
Ich startete einen Gemini-Live-Videoanruf und bat um Hilfe bei der Ursachenanalyse; es erklärte mögliche Probleme klar und half am Ende dabei, das Gerät wie erwartet zum Laufen zu bringen
Die Ursache war, dass die Isolierung am Batteriekontakt des um die Schraube gewickelten Drahts nicht richtig entfernt worden war, und Gemini erkannte Details, die ich mit bloßem Auge nicht sehen konnte
Mein Kind und zwei Freunde waren nicht nur vom Experiment selbst beeindruckt, sondern auch davon, dass ein Echtzeit-Sprach- und Videogespräch mit AI fast wie Magie wirkte
- foobarbecue: Cool, aber ich würde eher darauf wetten, dass es das nicht wirklich gesehen, sondern so vermutet hat
lodovic: Ich war schockiert, als ich einfach einen Screenshot eines PR-Review-Threads eingefügt und nur gesagt habe: „Da gab es Review-Kommentare, also behebe das“, und es alles perfekt gelöst, kleine Commits erstellt und zum Upstream gepusht hat
Danach habe ich ihm immer weiter unmögliche Aufgaben, riesige Projekte und komplexe Architekturen gegeben, um zu sehen, wie weit sein Verständnis meiner Absicht reicht
Zuletzt hat es innerhalb einer Woche, mit täglich ein paar Stunden Arbeit, ein vollständiges OS von Grund auf geschrieben, inklusive MPI, TCP/IP und GUI, und darauf läuft sogar Doom
Coding als Beruf ist vorbei, aber weil der Unterschied in den Ergebnissen so groß ist, wenn man mit professioneller Denkweise an die Sache herangeht, glaube ich, dass die Disziplin des Software Engineering weiterhin enormen Wert haben kann
jmkni: Es war nicht Coding, sondern Logs lesen
Ich suchte nach einem alptraumhaften Bug, der nur in Production auftrat, und Claude Code konnte sich mit Google Cloud verbinden und die Logs in Echtzeit lesen
Sobald ich den Bug in der UI reproduzierte, identifizierte es das Problem sofort in den Logs, und da es sogar den Kontext der gesamten Codebasis hatte, zeigte es mir die genaue Codezeile, die die Ursache war
Das war definitiv so ein „Oh?“‑Moment
marcus_holmes: Ich machte ein Foto einer welkenden Pflanze und zeigte es Claude; daraufhin erklärte es mir, wie ich sie wieder gesund bekomme und wie ich Stecklinge davon ziehe
Die Coding-Beispiele sind verständlich, weil da ein Computer über Computer spricht, aber einem Computer ein Pflanzenfoto zu zeigen und dann zu erleben, dass er die Pflanze erkennt, diagnostiziert und weiß, was zu tun ist, fühlte sich wie Science-Fiction an und war wirklich erstaunlich
- aizk: Das könnte dir gefallen — Claude hat autonom Tomaten angebaut: https://autoncorp.com/biodome/
bonoboTP: Der größte Moment war direkt nach dem Launch von ChatGPT im Jahr 2022, besonders bei dem Linux-Terminal-Rollenspiel, in dem man beschrieb, dass „im Rechenzentrum ein Feuer ausgebrochen ist“, und wenn man dann nvidia-smi „ausführte“, wurden hohe GPU-Temperaturen angezeigt.
Man konnte auch das Home-Verzeichnis oder das Home-Verzeichnis berühmter Personen „erkunden“, und wenn es das Terminal schon so gut verstand, war ich sicher, dass Tool-Nutzung und Agenten unmittelbar bevorstanden.
Bei Opus 4.5 hatte ich das Gefühl, dass es nun endlich angekommen ist, aber 2022 dachte ich eigentlich, es würde schon 2023–2024 schneller kommen.
Bei Bildern war es nano banana, bei dem ich das Gefühl bekam, dass KI-Bilder wirklich funktionieren, und es wurde klar, dass vorübergehende Probleme wie Hände, Gliedmaßen oder „einen Astronauten auf einem Pferd kann es nicht“ verschwinden würden.
Auch die Produktion von Langfilmen ist in den Bereich des Machbaren gerückt, indem Agenten Drehbuch, Figuren und Shots koordinieren und erzeugen; unabhängig davon, ob die Geschichte sehenswert ist, wird es ein „Film“ sein.
- cineticdaffodil: Es scheint, als würden unter den 8 Milliarden Menschen versteckte Steve Spielbergs ohne Beziehungen und ohne den Namen Hollywood an den Tag kommen, ohne von Investmententscheidungen ausgesiebt zu werden, die nur auf sichere Optionen setzen, und es werden genug Werke entstehen, damit sie als lebenslang glückliche Cinephile leben können.
- zamadatix: Dass ChatGPT sowohl interaktiven Text erzeugen als auch ein Terminal nachahmen konnte, war völlig schockierend, und damals hätte ich mir nie vorstellen können, dass sich dieser Ansatz so weit skalieren würde.
  Danach gab es viele noch beeindruckendere Aufgaben, aber nichts hat mich wieder in dieselbe reine Art des Staunens versetzt.
jb_briant: Ich entwickle ein 3D-Spiel und mochte keine flache Welt, also wollte ich einen Planeten verwenden.
Die Oberfläche dehnt sich nicht aus und ist gameplayseitig endlich, fühlt sich aber gleichzeitig unendlich an, weil man nie gegen eine Weltgrenze stößt, was sehr elegant war.
Kartesische Koordinaten passten für den Spieler nicht gut, also brauchte ich ein System aus Breiten-/Längengrad-/Höhenraster, und ich hätte tagelang StackOverflow durchforsten und eine fehlerhafte Implementierung debuggen können.
Die Web-Version von ChatGPT hat 2024 die Helfer dafür fast auf einmal erstellt, und gerade weil es dabei wirklich viele Fallstricke gab, war das beeindruckend.
- linsomniac: Ich spiele damit herum, mit Claude Retrospiele zu bauen.
  Ein von Rally-X inspiriertes Retro-Arcade-Spiel, das im Browser läuft: https://linsomniac.github.io/rally-xy/
  Ich habe auch einen Maze-Shooter mit Netzwerk-Multiplayer im Stil von nsnipes gebaut; er ist browserbasiert, braucht für den Netzwerk-Multiplayer aber einen Server: https://github.com/linsomniac/isnipes
vishvananda: Es war Anfang dieses Jahres, als ich alte Projekte wieder hervorholte, die stillgelegen hatten, und sie Agenten übergab.
Innerhalb weniger Tage entstanden ein Klon der AlphaZero-Implementierung des Oracle-Teams(https://medium.com/oracledevs/lessons-from-implementing-alph...), ein Port meines Hobby-NES-Emulators von JavaScript nach Rust(https://github.com/vishvananda/popeye) und die Implementierung aller Lektionen der C++ Grandmasters Challenge, die schließlich sogar in einem vollständigen C++-Compiler(https://medium.com/@vishvananda/i-spent-2-billion-tokens-wri...) mündete.
Besonders das Portieren des NES-Emulators dauerte nicht einmal 30 Minuten und funktionierte beim ersten Versuch.
Dass ich Dinge, die ich früher selbst unter großem Aufwand gebaut hatte, noch einmal bauen ließ, hat den Schalter umgelegt, und weil ich die Schwierigkeit kannte, traf es mich viel stärker als andere Projekte.
a_bonobo: In meinem früheren Job habe ich unbestätigte Tierbeobachtungen aufbereitet, und separat gab es auch eine Datenbank mit Wahrscheinlichkeiten des Auftretens von Tieren auf Basis von Verbreitungskarten der Arten.
Ich bin kein Statistiker, aber wenn man Beobachtungen, die Grundwahrscheinlichkeit des Auftretens in der jeweiligen Region und Annahmen über Beobachtungsrauschen hat, schien das Berechnen der Wahrscheinlichkeit, dass die Art tatsächlich enthalten war, perfekt zu dem Satz von Bayes zu passen.
Claude stellte drei Fragen und schrieb dann eine wunderschöne Python-Implementierung, die die Karten abfragt und eine Tabelle mit korrigierten Wahrscheinlichkeiten ausgibt.
Es fühlte sich stark an, dass ich so etwas jetzt „allein“ tun kann, ohne zuerst die richtige Person finden oder warten zu müssen, bis ich das nötige Wissen gelernt habe.
dannyobrien: Ich bekam frühen Zugang zur OpenAI API vor ChatGPT, und es war ungefähr 2019, als wir bei der Arbeit ein livestreamtes JackBox-Spiel für eine Charity-Veranstaltung vorbereiteten.
Früher hatte ich als Autor für die UK-Version des ursprünglichen You Don't Know Jack gearbeitet und dabei viele witzige Einzeiler zu Themen erzeugt, von denen nur einige für die Aufnahme verwendet wurden.
Zu Testzwecken gab ich solche Setup-Sätze in die OpenAI API ein; 90 % waren nicht lustig oder incoherent, aber einer von zehn war nicht schlecht oder ziemlich gut.
Für andere war das vielleicht nicht beeindruckend, aber weil ich eine Umgebung erlebt hatte, in der im Autorenraum alle stundenlang genau so etwas machten, wurde mir klar, dass es als kreatives Assistenzwerkzeug eine perfekte Ergänzung sein könnte.
Als JackBox-Spieler war es ebenfalls ziemlich gut.
- darksim905: Ich kenne JackBox nicht besonders gut, aber die ursprünglichen You Don't Know Jack-Spiele sind mir als schöne Erinnerung geblieben.
xtracto: Das mag kritikwürdig sein, aber ich habe mit Hilfe eines LLM ein kleines Programm geschrieben, das Video eines Xbox-Live-Online-FPS-Spiels vom Browserbildschirm erfasst und mit einem kleinen trainierten neuronalen Netz menschliche Formen erkennt und auf einem anderen Bildschirm anzeigt
In PvP-Matches legt es ein grünes Overlay über Gegner, damit sie besser sichtbar sind; einschließlich Training/Feintuning eines kleinen YOLO-Netzes kam ich auf etwa 100 Zeilen Code
- darksim905: Ich verstehe nicht, warum das kritikwürdig sein sollte
  Für Unbeteiligte riecht es vielleicht nach Cheating, aber im Kern ist es einfach Computer Vision als Übung
  Auch DMA-artige Tools im Game-Modding-Bereich verdienen über Abo-Dienste Geld, deshalb ist das beeindruckend und zugleich seltsam geheimniskrämerisch, und es ist auch interessant, wie gut solche Tools und mux-Hardware funktionieren
  Wenn dann noch Hardware wie DGA mit Onboard-Speicher und schnelleren Interconnects dazukommt, wird das für Leute aus Reverse Engineering, Malware-Analyse und Forensik eine ausgesprochen spannende Zeit
- jerryoftheyear: Ich frage mich, wie viel Input-Lag diese Methode ungefähr hinzufügt
tejohnso: Einen echten Panikmoment hatte ich nicht, aber im letzten Jahr hat sich meine Art zu programmieren verändert
Früher habe ich beim Start eines Projekts die Struktur, das Zusammenspiel der großen Bausteine, die Detailimplementierung sowie Alternativen und Konsequenzen selbst durchdacht
Jetzt denke ich weniger allein nach, sondern arbeite im Gespräch mit einem LLM, sammle schnell Informationen aus mehreren Quellen, bitte um Links zu maßgeblichen Materialien und frage nach Trade-offs zwischen Alternativen, die ich sonst vielleicht übersehen hätte, um zu detaillierteren Analysen zu kommen
Auch während der Entwicklung halte ich den neuen Agenten-Partner ständig im Kontext und nutze ihn für Diskussionen, Vorschläge und Problemlösung
Vollständig vertrauen kann ich ihm nicht, aber für meine Zwecke ist er als Workflow-Tool verlässlich genug geworden, und die Geschwindigkeit, mit der er sich von einem interessanten Spielzeug zu einem vollständig integrierten Werkzeug entwickelt hat, war enorm
tobyhinloopen: Ein nichttechnischer Mitarbeiter eines Kunden hat per Vibe Coding eine App gebaut und mich gebeten, sie zu reviewen und zu deployen
Das Ergebnis war ordentlich und hatte keine gravierenden Probleme
Gleichzeitig habe ich das komplette PDF mit dem Kundenfeedback, Screenshots usw. in Claude gesteckt, und dann hat es fast unbeaufsichtigt sieben Stunden lang Reproduktion und Korrekturen durchgeführt und mehrere MRs erstellt
Die meisten Änderungen waren gut; einige waren technisch zwar korrekt, aber nicht das, was der Kunde wollte, und nachdem ich das gesagt hatte, hat Claude es korrigiert
- namanyayg: Inzwischen ist es meistens gut genug, dass es einfach funktioniert
  Deshalb habe ich ein Startup um genau diese Idee herum aufgebaut
rerdavies: Ich habe an einem Spice-Compiler gearbeitet, der Schaltpläne für klassische Gitarrenpedale in in Echtzeit ausführbaren Code umwandelt
Ich habe Claude Seitenzahlen und Gleichungsnummern aus The Spice Manual 2nd ed. gegeben und um eine Implementierung gebeten, obwohl ich ehrlich gesagt nicht erwartet hatte, dass es klappt
Es hat aber nicht nur die betreffende Gleichung implementiert, sondern auch noch die Lagrange-Funktion einer Funktion 30 Zeilen weiter unten berechnet; dafür waren symbolische partielle Ableitungen einer nichttrivialen Funktion und das Erkennen nötig, welche Variable im resultierenden Matrixausdruck wofür steht
Im Original stand nur „Lagrangian of“, und die partiellen Differentialgleichungen waren nicht angegeben, trotzdem hat es funktioniert und sogar Kommentare mit Seiten- und Gleichungsnummern der Quelle für diese Lagrange-Gleichung hinzugefügt
- djmips: Klingt ziemlich interessant
  Ich könnte das natürlich einfach Claude fragen, aber ich wollte wissen, ob du vorhast, das zu teilen