Neue Kommentare | GeekNews

kurthong 26 일 전 | übergeordneter Kommentar | in: Der eine Unterschied bei Menschen, die die Dinge, die sie wollen, wirklich umsetzen: die Fähigkeit zur Beurteilung von Selbstrelevanz (blog.archcalendar.com)

Es wirkt so, als laufe am Ende alles auf Analytics-Werbung hinaus. Klingt zwar plausibel, ist letztlich aber doch Werbung, und ich habe auch das Gefühl, dass der Betreiber von hada.io das etwas zu sehr sich selbst überlässt.

kurthong 26 일 전 | übergeordneter Kommentar | in: rtk – CLI-Proxy, der den LLM-Tokenverbrauch um 60–90 % senkt (github.com/rtk-ai)

Letztlich ist es ein Trade-off mit der Qualität, und ich frage mich auch, ob es am Ende nicht zu einer Struktur wird, bei der man mehr Tokens verbraucht, um die verlorene Qualität wiederherzustellen.

kurthong 26 일 전 | übergeordneter Kommentar | in: LLM-Wiki – Mit LLM ein persönliches Wissensarchiv aufbauen (gist.github.com/karpathy)

Da BM25 bei der Suche auf Koreanisch schwach ist, habe ich zusätzlich Guardrails eingebaut, die auch Koreanisch gut durchsuchen können.

kurthong 26 일 전 | übergeordneter Kommentar | in: LLM-Wiki – Mit LLM ein persönliches Wissensarchiv aufbauen (gist.github.com/karpathy)

Im großen Kontext geht es um das Durchsuchen vergangener Gespräche; wenn man nur die Frage der Strukturierung gut ordnet, scheint es eine gute Idee zu sein. Tatsächlich fand ich, dass es mir auch sehr bei der Organisation von Projekten geholfen hat.

kurthong 26 일 전 | übergeordneter Kommentar | in: LLM-Wiki – Mit LLM ein persönliches Wissensarchiv aufbauen (gist.github.com/karpathy)

Ich habe das auch umgesetzt. Wenn mehrere Hardware-Geräte im Einsatz sind, habe ich ein wenig ergänzt, damit sich der Obsidian-Vault mit einem GitHub-Backup verknüpfen lässt. Außerdem habe ich Parser für Codex und Gemini erstellt und hinzugefügt. https://github.com/hang-in/seCall

brainer 26 일 전 | übergeordneter Kommentar | in: Wenn du unter Claude Blue leidest (kciter.so)

Wenn man moderne LLMs als „Vorhersage des nächsten Worts“ abtut, dann ist auch AlphaGo nichts weiter als „Vorhersage des nächsten Zugs“.

Seit ChatGPT ist die Vorhersage des nächsten Worts zudem nur ein einfaches Pre-Training.

Im Kern ist es ein Modell, das ein Ziel erreicht.

unstabler 26 일 전 | übergeordneter Kommentar | in: AWS-Ingenieur berichtet, dass sich die PostgreSQL-Leistung unter Linux 7.0 halbiert – eine Behebung könnte nicht einfach sein (phoronix.com/news)

Soweit ich gehört habe, haben Kernel-Entwickler den PostgreSQL-Entwicklern wohl schon seit fast 10 bis 20 Jahren gesagt: „Spinlocks im Userland sind nicht empfehlenswert, vielleicht solltet ihr das noch einmal überdenken.“

https://x.com/kosaki55tea/status/2040458791536497035

edunga1 26 일 전 | übergeordneter Kommentar | in: Harness — Claude Code Agenten-Teams & Skill-Architekt-Plugin (github.com/revfactory)

Wenn man bereits das Claude Code Agent Team verwendet hat, gab es nichts besonders Neues.
Praktisch war jedoch, die Infrastruktur mit Agents oder Skills so aufzubauen, dass sich Teamkonfigurationsinformationen und Ähnliches auch in neuen Sitzungen weiterverwenden lassen.
Wenn man das Team manuell zusammengestellt hat, wiederholten sich boilerplateartige Dinge für das Team nämlich immer wieder.

Es gab allerdings ein Problem: Da die Umgebung sowohl Subagents als auch Agent Teams berücksichtigt, kommt es im Supervisor-Muster oft zu der seltsamen Situation, dass der Supervisor Aufgaben an einen Subagent delegiert, obwohl bereits ein Team erstellt wurde.

lastorder 26 일 전 | übergeordneter Kommentar | in: Google AI Edge Gallery – Open-Source-Galerie-App für vollständig offline nutzbare LLMs (github.com/google-ai-edge)

https://github.com/google-ai-edge/gallery/issues/437

Anscheinend ist die Exynos-Kompatibilität nicht besonders gut. Auf dem Galaxy Quantum 5 (A55) gibt es das Problem, dass es als Antwort endlos chinesische Schriftzeichen wiederholt.

jmg008 26 일 전 | übergeordneter Kommentar | in: Wenn du unter Claude Blue leidest (kciter.so)

Soweit ich weiß, sind mit Ausnahme einiger Modelle auf Basis von Diffusionsmodellen alle seit GPT veröffentlichten großen Sprachmodelle in einer Form aufgebaut, die das nächste Token vorhersagt. Falls es Modelle gibt, die auf andere Weise arbeiten, wäre ich dankbar, wenn Sie mich darauf hinweisen könnten.

vndk2234 26 일 전 | übergeordneter Kommentar | in: Warum es in der Schweiz 25-Gbps-Internet gibt und in den USA nicht (sschueller.github.io)

Ich wusste nicht einmal, dass es symmetrisches 25-Gigabit-LAN gibt. Ich dachte, selbst 10-Gigabit ist für Privathaushalte schon mehr als genug ...

ksundong 26 일 전 | übergeordneter Kommentar | in: rtk – CLI-Proxy, der den LLM-Tokenverbrauch um 60–90 % senkt (github.com/rtk-ai)

Ich habe es früher ausprobiert, aber wieder entfernt, weil Claude ständig noch mehr Tokens verbraucht hat, um Probleme zu lösen, die durch rtk verursacht wurden.
(Zum Beispiel erzeugt es bei einer JSON-Anfrage per curl ungültiges JSON, woraufhin jq einen Fehler ausgibt; dann debuggt Claude das, verbrennt dabei Tokens und am Ende holt es sich doch wieder die rohe curl-Anfrage und parst sie mit jq.)
Trotzdem halte ich die Grundidee für einen guten Ansatz, daher könnte es sich lohnen, es zu verwenden, sobald es stabiler geworden ist.

anyjava 26 일 전 | übergeordneter Kommentar | in: rtk – CLI-Proxy, der den LLM-Tokenverbrauch um 60–90 % senkt (github.com/rtk-ai)

Das fand ich an der Stelle auch schade!

Vor Kurzem gab es ein Update: Die vollständige Ausgabe wird jetzt in einer separaten Datei gespeichert, damit das LLM sie bei Bedarf lesen kann~

lastorder 26 일 전 | übergeordneter Kommentar | in: Open Beta von Gnuboard 7 auf Laravel-Basis veröffentlicht (sir.kr)

Die offizielle Website wurde bereits vor der Veröffentlichung von Gnuboard 7 überarbeitet.

cronex 26 일 전 | übergeordneter Kommentar | in: Der wahre Grund, warum Ihr Engineering-Team langsam ist: nicht die Menschen, sondern die Codebasis (piechowski.io)

Deshalb kommt es manchmal vor, dass es schneller ist, es neu zu schreiben.

geek12356 26 일 전 | übergeordneter Kommentar | in: OpenClaude, entstanden durch ein Claude-Code-Source-Leak — 200 Modelle wie GPT-4o, Gemini, Ollama usw. mit der Claude-Code-UI (github.com/Gitlawb)

Danke für Ihre Antwort!

moon5g 26 일 전 | übergeordneter Kommentar | in: rtk – CLI-Proxy, der den LLM-Tokenverbrauch um 60–90 % senkt (github.com/rtk-ai)

Ich bin mir nicht sicher, ob es wirklich etwas reduziert. Der Agent sagt mir ständig, ich solle den Befehl rtk ls.. verwenden, macht es dann aber selbst nicht.

kciter1 26 일 전 | übergeordneter Kommentar | in: Wenn du unter Claude Blue leidest (kciter.so)

Dann ist das neueste Modell also ein anderes? Falls etwas daran falsch ist, wäre ich dankbar, wenn Sie mich darauf hinweisen könnten — das würde nicht nur mir, sondern auch anderen helfen, haha.

nemorize 26 일 전 | übergeordneter Kommentar | in: EmDash – der geistige Nachfolger von WordPress, der Plugin-Sicherheitsprobleme löst (blog.cloudflare.com)

Es gibt auch Spam, bei dem Suchergebnis-URLs für nach Spam klingende Formulierungen als Backlinks in Beiträge anderer Blogs eingetragen werden;
letztlich muss man so etwas ohnehin alles manuell löschen...

brainer 26 일 전 | übergeordneter Kommentar | in: Wenn du unter Claude Blue leidest (kciter.so)

> Ein LLM ist ein Modell zur Vorhersage des nächsten Wortes, das „für eine gegebene Eingabe die passendste Ausgabe erzeugt“

Da ist wohl von GPT-3 die Rede.

Weitere Kommentare laden