Neue Kommentare | GeekNews

click 25 일 전 | übergeordneter Kommentar | in: Claude Code: Seit dem Februar-Update bei komplexen Engineering-Aufgaben qualitativ auf unbrauchbares Niveau abgesackt (github.com/anthropics)

Ich habe das wohl nie so erlebt, vielleicht weil ich Claude Code zusammen mit Glm nutze.
Ich vermute, die Hauptursache liegt eher bei den Serverantworten von Anthropic.

kurthong 25 일 전 | übergeordneter Kommentar | in: Der Kult um Vibe Coding ist verrückt (bramcohen.com)

Man muss sogar die kleinsten Details micromanagen, um Code von halbwegs plausibler Qualität zu bekommen. Ich halte vollständige Autonomie für völlig unrealistisch, außer wenn es darum geht, echte Boilerplate-Code-Massenproduktion zu betreiben. Menschen, die von vollständiger Autonomie reden, sind meiner Meinung nach eines von zwei Dingen: Entweder sie verstehen nicht viel davon, oder sie sind Betrüger.

summerpicnic 25 일 전 | übergeordneter Kommentar | in: Der Kult um Vibe Coding ist verrückt (bramcohen.com)

Es wirkt eher wie eine Kritik nach dem Muster, bei dem man Vibe Coding kurzerhand mit „es wird ohnehin kein Code Review gemacht“ gleichsetzt und dann Gründe passend dazuerfindet.

Außerdem ergibt es keinen Sinn, dabei auch noch Claude Code heranzuziehen. Wenn man wirklich Engineering-Prinzipien auf dem Niveau von Linux-Maintenance anlegt, also bei Leuten, die auf genau diese Art von Qualität achten, geht man Fragen der Code-Qualität nicht so fragmentarisch an. Das ist größtenteils ein propagandistischer Ansatz, kein Ergebnis eigener Tests, sondern eher ein „man hört eben so etwas“.

Das ist ungefähr so, als würde man sagen, das Design von Samsung-Gebäuden sei nicht gut und deshalb sei Samsung noch weit davon entfernt, Sony einzuholen.

adieuxmonth 25 일 전 | übergeordneter Kommentar | in: Das Zeitalter der „Surveillance Wages“: Arbeitgeber berechnen mit persönlichen Daten das niedrigste Gehalt, das Bewerber akzeptieren (marketwatch.com)

Krass.

chanapple 25 일 전 | übergeordneter Kommentar | in: Claude Code: Seit dem Februar-Update bei komplexen Engineering-Aufgaben qualitativ auf unbrauchbares Niveau abgesackt (github.com/anthropics)

Das ist ein Problem, das seit Kurzem anhält, nachdem das 2x-Event beendet wurde. Auf Reddit und in einschlägigen Communities ist es weiterhin ein heiß diskutiertes Thema, daher ist es überraschend, dass es hier nicht als News erschienen ist.

sftblw 25 일 전 | übergeordneter Kommentar | in: Von Google veröffentlichte, für den On-Device-Betrieb von Gemma4 auf iOS optimierte App (apps.apple.com)

Auf der Modellseite von Hugging Face gibt es wohl auch eigene Benchmarks ...

https://huggingface.co/litert-community/gemma-4-E4B-it-litert-lm

sftblw 25 일 전 | übergeordneter Kommentar | in: Von Google veröffentlichte, für den On-Device-Betrieb von Gemma4 auf iOS optimierte App (apps.apple.com)

Google AI Edge Gallery - Open-Source-Galerie-App für vollständig offline nutzbare LLMs

Gibt es auch bei Google Play
https://play.google.com/store/apps/…

koreacglee 25 일 전 | übergeordneter Kommentar | in: Der Kult um Vibe Coding ist verrückt (bramcohen.com)

Während mit AI AGENT alles vollautomatisch gemacht wird und sogar Codegenerierung, Merge, Review und Validierung komplett autonom laufen sollen, sodass der Code quasi von selbst zusammengestellt wird und man sich überhaupt nicht mehr darum kümmern müsse und Entwickler nur noch gelegentlich eingreifen müssten, wenn sich die Agenten untereinander verheddern, wurde ständig eine Stimmung verbreitet, in der Entwickler, die das nicht so machen können, als abnorm hingestellt werden, weil sie dem Trend nicht folgen würden ... Wenn ich dann sehe, wie Leute, die sonst wohl nur endlos Boilerplate-Code und bloß fortlaufende einfache Muster schreiben und dafür ein hohes Gehalt kassieren, jetzt groß reden, dass man dank AI gar keinen Code mehr schreiben müsse, ist das einfach nur erbärmlich.

vndk2234 25 일 전 | übergeordneter Kommentar | in: Das Open-Source-Projekt, das in der Geschichte von GitHub am schnellsten 100.000 Stars erreicht hat (Sigrid Jin & Bellman) (youtube.com)

Wenn man bedenkt, dass auch LLMs einfach viele Informationen sammeln, kann ich verstehen, dass man das nicht als besonders „böse“ ansieht, aber ich weiß nicht, ob man damit wirklich so offen umgehen sollte.

shalome7 25 일 전 | übergeordneter Kommentar | in: Paperclip – Ein Unternehmen ohne menschliches Eingreifen aufbauen (paperclip.ing)

Nachdem ich das gesehen hatte, habe ich fleißig damit herumprobiert. Und darüber, warum es nicht funktioniert, konnte ich dann auch gleich einen Beitrag auf GeekNews veröffentlichen. Haha.
Es ist praktisch, dass es unter „Lesenswerte verwandte Beiträge auf GeekNews“ automatisch erkannt wird! :)
Warum funktioniert Multi-Agent-Orchestrierung oft nicht gut?

limhasic 25 일 전 | übergeordneter Kommentar | in: Wenn du unter Claude Blue leidest (kciter.so)

Hehe, was mache ich jetzt?

kimjoin2 25 일 전 | übergeordneter Kommentar | in: Das Zeitalter der „Surveillance Wages“: Arbeitgeber berechnen mit persönlichen Daten das niedrigste Gehalt, das Bewerber akzeptieren (marketwatch.com)

„Das niedrigste Jahresgehalt berechnen, das jemand akzeptieren würde“
Das ist ähnlich wie wenn sich die Läden in der Umgebung, die Aushilfen suchen, absprechen und eine Obergrenze für den Stundenlohn festlegen.

Durch den technischen Fortschritt ist es nur genauer und schneller geworden; wahrscheinlich wurde das schon längst gemacht.

pjs102793 25 일 전 | übergeordneter Kommentar | in: Wenn du unter Claude Blue leidest (kciter.so)

Eine gute Methode, kein FOMO zu verspüren, ist sich anzuschauen, was die FOMO-Auslöser mit AI tatsächlich gelöst haben.

Dem kann ich wirklich sehr zustimmen, haha

eternalart1004 25 일 전 | übergeordneter Kommentar | in: Seit Februar ist die Engineering-Fähigkeit des Claude-Opus-Modells massiv zurückgegangen: Zusammenfassung auf Deutsch (github.com/anthropics)

Im Folgenden einige zentrale Streitpunkte und Reaktionen aus den Kommentaren im Hacker-News-Thread:

Anthropic's Erklärung und die Entgegnungen der Nutzer

Offizielle Antwort: Ein Mitarbeiter des Claude-Code-Teams (bcherny) erklärte, die Ursache liege in der jüngsten Opus-4.6-Aktualisierung, bei der „Adaptive Thinking“ eingeführt, das Standard-Effort-Level auf mittel (85) gesenkt und der „Thinking“-Prozess des Modells in der UI ausgeblendet wurde. Als Abhilfe empfahl er, den Befehl /effort max zu verwenden oder Adaptive Thinking zu deaktivieren.

Entgegnungen der Nutzer: Viele Nutzer widersprachen und sagten, dass das Modell selbst bei erzwungenen Maximal-Einstellungen Probleme nicht mehr so tiefgehend wie früher löse und weiterhin Anweisungen ignoriere oder versuche, die Arbeit hastig abzuschließen.
Zentrale Symptome des Leistungsabfalls (aus Nutzersicht)

Übermäßige Nutzung der „einfachsten Lösung“: Es gab zahlreiche Beschwerden, dass Claude deutlich häufiger oberflächliche „Tricks“ (simplest fix) vorschlage, die Probleme nur schnell und grob überdecken, ohne die bestehende Code-Struktur oder die Testumgebung zu berücksichtigen.

Arbeitsvermeidung und Versuch eines vorzeitigen Abbruchs: Auffällig häufig wurde ein „faules“ Verhalten beobachtet, bei dem das Modell Nutzer dazu dränge, die Arbeit eigenmächtig zu unterbrechen, etwa mit Aussagen wie „Es ist spät, lass uns ausruhen“ oder „Wir haben heute zu viele Tokens verbraucht, lass uns morgen weitermachen“.

Ausgelassene Verifikation und Ignorieren bestehender Tests: Es wurde darauf hingewiesen, dass das Modell nach Änderungen die Validierung eigenständig auslasse oder bei fehlgeschlagenen Tests die Verantwortung von sich weise, indem es behaupte, es handele sich um ein bereits bestehendes Problem, das nichts mit den von ihm vorgenommenen Änderungen zu tun habe.

Ich habe es von GPT zusammenfassen lassen, und auch auf Hacker News ist die Hölle los: https://news.ycombinator.com/item?id=47660925

hmmhmmhm 25 일 전 | übergeordneter Kommentar | in: LLM-Wiki – Mit LLM ein persönliches Wissensarchiv aufbauen (gist.github.com/karpathy)

Ist das ein Bot? Eine außerirdische Intelligenz (???)

trpgfox 25 일 전 | übergeordneter Kommentar | in: LLM-Wiki – Mit LLM ein persönliches Wissensarchiv aufbauen (gist.github.com/karpathy)

Wow, selbst nachdem ich den Haupttext gelesen hatte, war ich noch ratlos, aber mit Verweis auf dieses Git-Repo sehe ich jetzt einen Weg. Vielen Dank!

dicebattle 25 일 전 | übergeordneter Kommentar | in: Ubuntu verlangt jetzt standardmäßig mehr RAM als Windows 11 (howtogeek.com)

Man müsste erst einmal darüber reden, ob 4 GB RAM bei Windows 11 überhaupt realistisch sind.....
Da wirkt die minimale RAM-Anforderung von Ubuntu fast transparenter.

caniel 25 일 전 | übergeordneter Kommentar | in: Der Kult um Vibe Coding ist verrückt (bramcohen.com)

dog食...

Weitere Kommentare laden