1 Punkte von GN⁺ 2 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • Mit der Verbreitung von AI-Coding-Tools nimmt der Trend zu, dass einzelne Entwickler ihre eigenen Tools direkt selbst bauen. Dadurch entstehen in großer Zahl kleine, maßgeschneiderte Utilities, die man früher wegen des schlechten Verhältnisses von Aufwand zu Nutzen aufgegeben hätte
  • Besonders auffällig sind auf Hobbys und den Alltag spezialisierte Tools in Bereichen wie Musik- und Audioexperimente, Medienkonvertierung, Home-Automation und Gesundheits-Tracking; in vielen Fällen wurden kommerzielle Apps durch Eigenentwicklungen ersetzt
  • Wiederholt genannt werden Sandbox- und Orchestrierungs-Tools, um Coding-Agenten isoliert und parallel laufen zu lassen, sowie auf tmux/worktree basierende Development-Workflow-Tools
  • Enthalten ist auch eine Debatte über die Autorschaft beim Bauen, etwa der Einwand „Das hast nicht du gebaut, sondern die AI“, sowie die Gegenposition, dass Coding mit AI nicht automatisch Vibe Coding sei
  • In Bereichen, in denen heruntergeladene Apps wegen Werbung, Abos oder Funktionsbeschränkungen nur 80–90 % der Anforderungen erfüllt haben, setzt sich zunehmend die Sicht durch, dass es schneller ist, personalisierte Software zu bauen, die exakt zum eigenen Bedarf passt
  • Aufeinanderprallen die Positionen, dass es auch Können braucht, um aus AI eine wirklich brauchbare App herauszuholen, und die Gegenmeinung, dass der Einsatz von LLMs keine besondere Fertigkeit erfordere und in wenigen Tagen erlernbar sei

Vom Wandel, den Entwickler spüren

  • Es wächst die Einsicht, dass man das über die ganze Karriere aufgebaute „Kostengefühl“ neu erlernen (unlearning) muss; Arbeiten, die man früher wegen des Zeitaufwands vermieden hätte, sind das heute nicht mehr
  • Wer weiterhin hohe Ansprüche an Qualität, Performance und Wartbarkeit hat, codet teils noch von Hand; daneben gibt es die vorsichtige Position, dass sich die Grenzen von LLMs wie Hardwaregrenzen anfühlen
  • Erwartet wird eine Zukunft, in der „Consumer-Software sofort und on demand erstellt wird“ und personalisierte Software zum Alltag wird
  • Zugleich wird eine ausgewogene Sicht formuliert: Manche Beispiele könnten am Ende nur dem Niveau von „Was wurde mit dem Drucker gedruckt?“ entsprechen, und der Wert solcher maßgeschneiderten Tools realisiert sich erst mit zuverlässigen, deterministischen Basis-Tools

1 Kommentare

 
GN⁺ 2 시간 전
Hacker-News-Kommentare
  • ddahlen: Ich beschäftige mich mit der Orbitaldynamik von Asteroiden, Kometen und Staub und habe deshalb ein präzises Visualisierungstool gebaut, das die Bewegungen aller bekannten Asteroiden im Sonnensystem zeigt.
    Wenn man auf einen bestimmten Asteroiden klickt, zeigt es eine hochpräzise Bahn, die zu den JPL-Orbitberechnungen passt, und berücksichtigt die gesamte Physik, das Mehrkörperproblem, Relativität und nicht kugelförmige Planeten. Nicht besonders mobilfreundlich: https://dahlend.github.io/ketev/

  • yungbeto: Ich baue zum Spaß viele Audio-Experimente. Kann ziemlich CPU-hungrig sein.
    https://www.noisetable.xyz/ ist eine Sammlung probabilistischer Audiokanäle mit einer Oberfläche im VCR-Stil, und https://concrete95.net/ ist eine Musique-concrète-Web-App, die wie Windows 95 aussieht. Sie holt zufällige Audios von freesound.org, loopt kurze Abschnitte und erlaubt es, Synth-Pads oder melodische Synth-Loops darüberzulegen, was sich gut für Hintergrund-Ambience eignet. https://windso.me ist ein samplebasierter Step-Sequencer, bei dem man die Samples nicht direkt auswählen kann; macht Spaß, braucht aber noch einiges an Feinschliff.

    • BrokenCogs: Wenn man noisetable.xyz in Firefox öffnet, erscheint eine Sicherheitswarnung.
    • kokkis: Ich habe mir https://concrete95.net/ angesehen, und es ist wirklich großartig.
  • michaelbuckbee: Das Lustigste ist ein kostenloses Utility namens Moniker, das Dateinamen anhand ihres Inhalts kontextgerecht umbenennt. Es nutzt ein lokales AI-Modell, und die Domain ist auch gut gewählt: https://finalfinalreallyfinaluntitleddocumentv3.com/
    Am nützlichsten ist HutchDB, ein MCP-Service, den man aus AI-Chats oder Agenten aufrufen kann, um Daten zu speichern. Wenn man „save that to Hutch“ sagt, erschließt es Schema und Felder, erstellt Web-Views wie Kanban, Timeline, Grid und Calendar und erlaubt auch das Teilen der Ergebnisse. Ich nutze es für Zeiterfassung, Agent-Mensch-Übergaben und zum Vergleich von Marketingaktivitäten mit Abonnentenzahlen: https://hutchdb.com

    • Mystery-Machine: Ich frage mich, woher du weißt, dass „Leute es für verschiedene Zwecke nutzen“. In der Datenschutzerklärung steht, dass AI-Agenten API-Schlüssel an Hutch weitergeben könnten, und dann könnten die Betreiber des Dienstes sie wohl lesen, was mir Sorgen macht.
      Außerdem frage ich mich, wie das auf Vercel gehostet kostenlos sein kann. Falls es auch nur ein bisschen viral geht, brauche ich die Sicherheit, dass es nicht wegen der Kosten eingestellt wird oder plötzlich auf 500 Dollar pro Monat umschwenkt. Nach der Anmeldung wird man von https://hutchdb.com/ auf https://hutchdb.com/dashboard weitergeleitet, und ich kann auch die Seiten für Datenschutzerklärung und Nutzungsbedingungen nicht sehen.
  • Jordan-117: Gemini hat mir enorm geholfen, von Windows auf Linux umzusteigen.
    Ich bin zwar einigermaßen versiert, aber beim Wechsel auf ein neues Betriebssystem tauchten viele zufällige Fragen und seltsame Edge Cases auf, und allein hätte mir wohl Selbstvertrauen, Geduld und Zeit gefehlt. Es war großartig, sofort Antworten auf konkrete Probleme zu bekommen, ohne bewertet zu werden oder auf eine Antwort warten zu müssen. Auch beim Wechsel von Chrome zurück zu Firefox war Gemini nützlich, um Alternativen für häufig genutzte Erweiterungen zu finden oder sie selbst zu bauen, falls es keine gab. Ich entwickle außerdem mit Gemini und Claude ein Custom-Plugin für Quod Libet, das Metadaten und synchronisierte Liedtexte herunterlädt, eine Sidebar mit hervorgehobenen Liedtexten während der Wiedergabe anzeigt und einen Button zum Markieren von Lieblingsstellen eines Songs bietet. Als Nächstes möchte ich eine Liedtextsuche für die gesamte Bibliothek bauen.

    • sufficientsoup: Ähnlich bei mir beim Umstieg auf Arch Linux. Kein Tool an sich, aber es war extrem praktisch, das Arch Wiki zu haben und sagen zu können: „Meine Hardware ist X und mein Anwendungsfall ist Y, filter mir die irrelevanten 90 % heraus.“
    • ozim: „Es beantwortet mein konkretes Problem sofort und urteilt nicht“ ist die Kernfunktion. Selbst wenn AGI nie kommt, haben wir damit zumindest „etwas, das stattdessen für dich sucht“.
      Im eigenen Fachgebiet muss man keine Zeit damit verschwenden, Einsteiger-Ballast zu lesen, und in fremden Fachgebieten bekommt man keine RTFM- oder LMGTFY-Antworten, nur weil man Anfängerfragen stellt.
    • joe_the_user: ChatGPT hat mir bei unzähligen kleinen technischen Problemen geholfen und fühlt sich inzwischen nahezu unverzichtbar an.
      Es scheint eine Kombination daraus zu sein, dass Google immer schlechter wird und Alltagsprobleme so komplex geworden sind, dass man sie nur noch mit Skripten oder Ähnlichem lösen kann. Kürzlich ging es bei mir auch um die Suche nach „günstigen Campingplätzen in der Nähe des Pacific Crest Trail, die gerade geöffnet sind“.
  • ingvay7: Ich übe abends schnelle Gitarrenläufe, habe aber wegen meines stressigen Jobs kaum Zeit, im Amp-Simulator den richtigen Ton einzustellen. Deshalb habe ich ein Tool gebaut, bei dem man etwa „Brian May Solo Bohemian Rhapsody“ promptet, dann füllt ein LLM einen JSON-Vertrag aus, ein Skript erzeugt XML, und das wird direkt in das Plugin geladen.
    In zwei Minuten fühlt es sich fast so an, als würde ich 1985 in Wembley spielen. Wenn man das Muster verallgemeinert, kann das LLM Presets finden, per Datei-Upload noch präziser abstimmen, und der Code validiert dann alles, bevor es ins Plugin geladen wird. Ich nutze diesen Vertrags-/Adapter-Ansatz auch für Terraform, Game-Engine-Presets und CI-Pipelines: https://vishsubramanian.me/lm-guitar-tone-generator-polychro...

    • BrokenCogs: Cool. Ich denke über etwas Ähnliches nach und frage mich, warum du Polychrome DSP statt etwas wie Neural DSP gewählt hast.
    • sailfast: Der Kern des Prompts scheint Wissen darüber zu sein, wie der Ton ursprünglich erzeugt wurde. So etwas wie ein System-Prompt für die 80er, bei dem echtes Tonwissen nötig ist und die Feinanpassung dann dem LLM überlassen wird.
      Als Gitarrenanfänger ist das einschüchternd, aber auch ein spannender Rabbit Hole. Es wäre interessant, „Experten“-Prompts für verschiedene Vorbilder und Genres zu haben.
  • netcoyote: Ich habe ein paar Tools für den Eigenbedarf gebaut.
    sandvault https://www.codeofhonor.com/projects/sandvault/ führt Agenten in einem separaten macOS-Benutzerkonto aus und härtet das Ganze mit sandbox-exec ab. Es unterstützt auch Headless-Browsing und den iOS Simulator innerhalb der Sandbox. clodpod https://www.codeofhonor.com/projects/clodpod/ führt Agenten in einer macOS-VM aus. git-multi-hook https://www.codeofhonor.com/projects/git-multi-hook/ ist ein Dispatcher, der das Problem löst, dass pro Git-Hook-Ereignis nur ein Skript erlaubt ist. TubeGate https://www.codeofhonor.com/projects/tubegate/ ist eine Chrome-Erweiterung, die YouTube-Videos anhand von Schlüsselwörtern blockiert, und push10k https://www.codeofhonor.com/projects/push10k/ ist eine iOS-App zum Verfolgen des Fortschritts auf 10.000 Liegestütze. Mein Blog wurde mit Zola, Sveltia CMS, Cloudflare Pages/Workers und GitHub Actions per AI-Coding erstellt https://www.codeofhonor.com

    • ElFitz: Wenn es stimmt, dass du an Guild Wars, Starcraft, Warcraft und Diablo gearbeitet hast, ist das ein wirklich beeindruckender Werdegang.
    • bdickason: Ich habe gestern beim Lesen über die Entstehung von Warcraft und Starcraft den Blog entdeckt. Ich baue kleine Spiele und Tools zur Erstellung von 3D-Umgebungen, und die alten Geschichten inspirieren mich sehr.
    • somberi: Dank Push10K habe ich jetzt eine Serie von 160 Tagen und 13.135 Liegestütze erreicht. Angefangen hat es nach einem Völlerei-Gefühl nach dem Weihnachtsabendessen, und es war eine der besten Entscheidungen überhaupt.
  • Balgair: Etwas dumm, aber ich habe einen Scraper gebaut, der alle Nachrichten einsammelt, kriegsbezogene News findet, sie zusammenfasst und dann mit dem Star-Wars-Opening-Crawl und Musik präsentiert.

    • userbinator: Wenn du das auf YouTube stellst, findest du vielleicht ein Publikum.
    • properbrew: Ich frage mich, ob man das auch abonnieren kann.
  • Rantenki: Ich habe in Rust von Hand eine GUI für einen Stiftplotter samt G-code-Sender gebaut. Ganz auf die harte Tour, und ich bin auch der einzige Nutzer.
    Manchmal ist der Prozess selbst wichtig, und das Nachdenken auch. Ich verstehe die existenzielle Angst, dass AI Jobs wegnimmt und Menschen aus dem kreativen Prozess verdrängt, aber man kann auch einfach Code für die eigene Zufriedenheit schreiben https://github.com/armyofevilrobots/bap-egui

    • efortis: Das wird wohl eines meiner nächsten Projekte zum Experimentieren mit der Web Serial API. Mein alter Ioline-Plotter gibt immer noch nicht auf. Ich würde gern wissen, wo man am besten mit der Umwandlung von SVG in G-code anfängt.
    • duckerduck: Ich entwerfe und baue gerade selbst einen Stiftplotter und war überrascht, wie wenig gute Software es dafür gibt. Ich werde es ausprobieren.
    • nha1: Ich wollte schon fragen, was ein Stiftplotter ist, aber ein druckerähnliches Gerät, das mit einem echten Stift zeichnet, ist ziemlich cool.
  • wizenheimer: Ich habe ein QA-Harness für Claude Code veröffentlicht. Statt selbst durch Bildschirmabläufe zu klicken, liest es Code-Diffs, findet betroffene UI-Flows und testet sie in einem echten Browser.
    Nach jedem Lauf gibt es eine Bildschirmaufnahme, Konsolen-Logs, Netzwerkanfragen, HAR und einen Playwright-Trace, sodass man genau sehen kann, was der Agent gemacht hat https://github.com/wizenheimer/canary
    Ich habe versucht, es als Show HN einzureichen, aber aus irgendeinem Grund wurde es geflaggt.

    • pred_: Ein schneller Blick aufs Profil zeigt, dass die meisten Einreichungen Show HN sind. HN begrenzt, dass nur ein Teil der Einreichungen Show HN sein darf, daher kann es ab einem gewissen Punkt automatisch geflaggt werden.
    • schmookeeg: Das wirkt wie eine deutlich konsistentere Version von dem, was ich mir selbst Stück für Stück gebaut habe. Ich werde es mal laufen lassen.
  • DonaldFisk: Das Dartmouth Summer Research Project on Artificial Intelligence war 1956, und AI selbst reicht mindestens bis zu Robotern wie Elmer und Elsie von William Grey Walter aus dem Jahr 1948 zurück; damals nannte man das Kybernetik.
    Seit den 1980ern habe ich immer mal wieder symbolische AI gemacht, aber hier ist wahrscheinlich eher von LLMs die Rede. LLMs habe ich selbst nicht benutzt, und in letzter Zeit habe ich zu Lernzwecken ein mehrschichtiges künstliches neuronales Netz in C implementiert. Früher habe ich versucht, mit einem in Lisp gebauten Sprachspektrogramm, das über Unix-Pipes verbunden war, mit einer versteckten Schicht Phoneme zu erkennen; bei reinen Vokalen funktionierte das recht gut, aber sobald ich Laute wie l, r, s und z hinzufügte, wurde die Leistung schlechter. Im C-Code scheinen keine Bugs zu sein, aber ich weiß nicht, wie man ein ANN einfach gut trainiert. Ich habe den Trainingssatz vergrößert, Schichten hinzugefügt und die Zahl der Neuronen in den versteckten Schichten verändert, aber allgemeine Debugging-Techniken greifen hier nicht gut.

    • kingkongjaffa: Dass du sie selbst nicht ausprobiert hast, ist angesichts deines Hintergrunds überraschend — ich frage mich, warum dich das nicht neugierig gemacht hat.
    • changadera: Ehrlich gesagt ist es schon beeindruckend, LLMs nie selbst benutzt zu haben.
  • linsomniac: Hat das Workstation-Betriebssystem mit NixOS und Claude Code neu entworfen, mit großem Erfolg
    Gefallen ihm an NixOS: die reproduzierbare, auf einem git-Repository basierende Konfiguration und dass man bei Fehlern in die vorherige Konfiguration booten kann, aber das manuelle Lernen und Umsetzen ist aufwendig. Hat etwa 2 Jahre damit herumprobiert, kam aber nie zu einer vollständigen Workstation-Konfiguration; da ein Upgrade von Ubuntu 22.04 anstand, wurde NixOS vor dem Sprung auf 26.04 ernsthaft ausprobiert. Dieses Mal wurde alles mit Claude Code konfiguriert, seit einer Woche im Einsatz, und es fehlt nichts. Erst auf einem alten Laptop installiert und dann die aktuelle Workstation neu aufgesetzt – ein schrittweises Vorgehen; die Einrichtung der zweiten Maschine war dank NixOS trivial. Wenn die Hardware jetzt ausfällt, reicht es, /etc/nixos zu holen und neu zu bauen. Außerdem wurde mit Claude Code eine etwa 700 Zeilen lange neovim.nix erstellt, die statt LunarVim/AstroVim nur die gewünschten Funktionen enthält, inklusive LSP und TreeSitter

    • karl_gluck: Würde NixOS gern auf einem alten ThinkPad ausprobieren. Mit Claude ist er schon recht vertraut und fragt sich, ob es reicht, einfach draufloszufragen und loszulegen, oder ob es Tipps für den Einstieg gibt
  • rockmeamedee: https://github.com/amedeedaboville/mish ist ein mosh-Klon mit QUIC als Transport-Layer
    Er kann sowohl unzuverlässige Datagramme wie UDP als auch zuverlässige Streams wie TCP nutzen und hat daher einen Scrollback-Buffer. Dank QUIC lässt sich auch die Verschlüsselung darüber abwickeln, sodass man sich nicht darauf verlassen muss, dass ein LLM selbst Kryptografie korrekt implementiert. Für das Terminal wird alacritty verwendet, und dank russh, einer SSH-Implementierung in Rust, funktioniert es auch in Umgebungen ohne installiertes SSH, zum Beispiel unter Windows, was das bestehende mosh nicht unterstützte. Claude hat End-to-End-Tests, eine FoundationDB-artige Netzwerksimulation, tokio-Tests zur Reihenfolge asynchroner Threads, 12 Fuzzing-Ziele und eine leichte Protokoll-Modellprüfung vor und zurück durchlaufen lassen und bei jeder Fuzzing-Runde Bugs gefunden. Abgesehen von den üblichen Fällen vom Typ „Es könnte Bugs geben, aber die Korrektheit ist bewiesen“ wirkt es mindestens so vertrauenswürdig wie das Original, vielleicht sogar mehr

    • hackernudes: Denkt schon seit Jahren über so etwas nach. Wird es sich anschauen
  • stonlyb: Workhorse ist ein Bündel aus CLI-Skripten und -Tools, das alte Laptops in headless SSH-Rechen- und Speicherknoten verwandelt, sodass die Hauptmaschine Arbeit dorthin auslagern kann
    Die Hauptkomponente ist onpro, ein Router-Skript, das die Boxen prüft, Befehle remote ausführt und automatisch lokal einspringt, wenn ein Gerät schläft oder vom Strom getrennt ist. Der PreToolUse-Hook in der AI-Coding-Konfiguration fängt schwere Befehle wie Builds, Tests, ffmpeg, OCR und große pandas-Jobs ab und lässt sie auf dem workhorse statt auf dem MacBook Air laufen. Der Agent entscheidet, was er ausführen will, und eine deterministische Schicht stellt sicher, dass schwere Aufgaben auf der richtigen Maschine landen. Soll nach etwas mehr Testen geteilt werden. https://motate.app/ war ein Versuch, mathematisches Schreiben zu erleichtern, weil beim Auffrischen von Linearer Algebra gleichzeitig ein Neugeborenes gehalten werden musste; jetzt wird darüber nachgedacht, wie es sich breiter für wissenschaftliches und mathematisches Schreiben sowie Lehre nutzbar machen lässt

  • xlii: Es gibt mehrere, aber auf einige ist er besonders stolz
    https://github.com/exlee/pikchr_pl ist eine DiagramIDE im Amiga-WorkBench-Stil, mit der sich Pikchr-Diagramme über TCL, Prolog, Pikchr und neuerdings mruby skripten lassen. https://svg.axk.sh ist ein halbmanueller SVG-Fitter, um KI-generierte pseudo-vektorisierte Bilder leicht zu vektorisieren. https://github.com/exlee/rik ist ein AI-Harness, das einen Texteditor als UI nutzt und ihn jedes Mal zum Lachen bringt, wenn er es benutzt. Es hat eine eingebaute Persönlichkeit und macht schräge Kommentare, ist ansonsten aber ein sehr eingeschränkter Agent. Kein Vibe Coding, aber AI hilft enorm dabei, große Reibungspunkte zu überwinden, etwa wenn man einen SVG-Fitting-Algorithmus nicht noch einmal neu entwickeln will

    • rpdillon: Wollte eigentlich zu einem pikchr-in-wasm-IDE-Experiment zurückkehren. Hatte nur einen PoC gebaut, noch vor AI Coding, aber nach dem Blick auf DiagramIDE könnte er stattdessen einfach das benutzen. Dieser Thread macht HN zu einer Art App Store der Lieblings-Apps
  • melvinroest: Hat eine Sprachmemo-App gebaut, ähnlich den Sprachmemos von Apple
    Jetzt werden Sprachmemos in iCloud hochgeladen, Claude Code wandelt sie in strukturierte Notizen um, und die App zeigt diese Notizen ebenfalls an. Das funktioniert so, dass man bei einem einstündigen Spaziergang frei vor sich hin spricht und Claude alles ordnet. Es gefällt ihm, dass schon bloßes lautes Denken strukturiert wird. Wurde per Vibe Coding gebaut und nähert sich inklusive Tests 20.000 Zeilen. Funktioniert ziemlich gut, hat aber Bugs, daher braucht es noch etwas echte Engineering-Arbeit; die UX funktioniert gut

    • prometheus76: Hat vor Kurzem etwas Ähnliches angefangen: beim Gehen sprechen. Nimmt mit einem leichten Gamer-Headset mit Mikrofon in einer normalen Aufnahme-App auf und transkribiert es zu Hause mit einer lokalen whisper-Instanz. Legt Transkript und Aufnahme in eine Datenbank, um alles zu durchsuchen oder eine AI nach interessanten Mustern in den Gedanken suchen zu lassen
    • derwiki: Klingt gut. Fragt sich nur, warum man nicht einfach den Advanced Voice Mode von ChatGPT oder Claude benutzt
    • camillomiller: Das ist im Grunde das gesamte Geschäftsmodell von Plaud
  • vtbassmatt: Wie sich herausstellte, sind die meisten Dinge Hobby-Tools rund ums Spielen.
    Ein Kochbuch zum Speichern der Lieblingsrezepte der Familie, um sich irgendwann von Pinterest zu lösen https://github.com/vtbassmatt/Cookbook, eine Datenextraktions-Pipeline und Suchmaschine für das Kartenspiel Mood Swings https://moodswingsdata.github.io und https://moodswingsdata.github.io/feelings, eine App, um mit Freunden wiederholt gemeinsam einen Magic: the Gathering Cube zu bauen https://github.com/vtbassmatt/popcorn-cube, eine Custom-Wiki-Engine für ein Lieblings-Podcast-Universum https://github.com/vtbassmatt/totalus-wikium, und einen systemd-Log-Viewer fürs Web https://github.com/vtbassmatt/djournal

    • kigiri: https://github.com/vtbassmatt/djournal scheint kein öffentliches Repository zu sein. Ich nutze https://github.com/ralsina/grafito, bin damit aber nicht ganz zufrieden.
    • jvvw: Bei mir geht es auch um Spiele, in meinem Fall geoguessr. Dank AI lassen sich Tools leicht bauen, die ohne AI die aufgewendete Zeit nicht wert gewesen wären.
    • Schlagbohrer: Zum Speichern von Rezepten ist Mealie gut, und ich musste nicht einmal selbst dafür coden.
  • aleqs: Ich habe ein allgemeines Repository-Linting-Tool gebaut https://alint.org/ https://github.com/asamarts/alint
    Ursprünglich sollte es mehrere Skripte für Repository-Hygiene und Strukturvalidierung ersetzen, die ich beim Ansehen schlampiger AI-Änderungen nach und nach hinzugefügt hatte. Danach habe ich mir verschiedene Open-Source-Repositories angesehen und geprüft, welche Validierungen dort per Skript gemacht werden, und das dann als allgemeine, erweiterbare Regeltypen in das Tool übernommen. Man kann Repository-Struktur, Hygiene und andere Regeln deklarativ definieren, und es ist sehr schnell, daher gut für pre-commit- und CI-Workflows https://alint.org/benchmarks/

  • shibel: Bei Tailscale funktioniert ein FQDN, der auf eine geteilte Maschine in einer Domain zeigt, nur für die Personen, mit denen diese Maschine geteilt wurde https://www.youtube.com/watch?v=Vt4PDUXB_fg
    Wenn Nutzer aber nicht wissen müssen sollen, welchen App-Port sie verwenden müssen, muss man in der Tailscale-ACL den Zugriff auf Port 443/80 dieses Hosts erlauben. Dann ist immich.familydomain.com für die Familie bequem, aber serveradmin.familydomain.com auf demselben Host ist aus Netzwerksicht ebenfalls erreichbar. Ich habe ungefähr im Januar ein paar Stunden mit Claude verbracht und ein kleines Go-Authentifizierungs-Gateway geschrieben, das sowohl die öffentliche Tailscale-API als auch localapi abfragt und Caddy je nach tatsächlich erlaubten Ports des anfragenden Nutzers antworten lässt. Jetzt kann ich verschiedenen Personen unterschiedliche Apps und Subdomains freigeben, ohne die Zugriffskontrolle zu verlieren, nur mit der Tailscale-Policy-Datei. Ich habe nichts wie Authentik verwendet, weil die Nutzer ohnehin schon bei Tailscale angemeldet sind, und ich es nicht für nötig hielt, eine weitere große App zu installieren und zu konfigurieren, die dasselbe tut und die Leute zweimal authentifizieren lässt.

    • sfifs: Cloudflare Zero Trust war für diesen Zweck großartig und funktioniert auch im Free-Tier gut. Mein Domain-Registrar ist ebenfalls Cloudflare.
    • dizhn: Pangolin wäre dafür wahrscheinlich direkter passend gewesen als Authentik. Inzwischen ist sogar ein eingebauter idP dabei, aber man kann auch Authentik verwenden. Netbird ist ebenfalls einen Blick wert: ein Mesh wie Tailscale, aber mit Proxy-Unterstützung für Apps, die man teilen will, unabhängig davon, ob Authentifizierung vorhanden ist.
    • abeyer: Wenn authentik auch ein OIDC-Provider ist, könnte man es dann nicht auch für die Tailscale-Authentifizierung verwenden?
  • Serenacula: Ich habe ein Skript, das einen Eingabe-Prompt annimmt, ein neues Skript erzeugt und dann weitere Skills ausführt, um Bugs schrittweise zu prüfen und zu beseitigen.
    Damit habe ich auch ein anderes Skript gebaut, das alle Custom-Skripte auflistet und nachverfolgt. Außerdem gibt es ein Tool, das lokale Skripte lädt und CLI-Befehle auf die Umgebung eines bestimmten Ordners eingrenzt. Insgesamt baue und nutze ich einfach alles, von dem ich denke, dass es sich automatisieren lässt. Ich wollte darüber irgendwann einmal einen Blogpost schreiben, und erst vor Kurzem hatte ich wirklich das Gefühl, dass sich die Welt der personalisierten Software tatsächlich verändert hat.

  • neonglow: Ich habe eine Browser-Erweiterung gebaut, die automatisch abgespielte animierte Bilder wie GIFs standardmäßig anhält.
    Es hat mich schon immer genervt, dass Browser animierte Bilder automatisch abspielen, und es gibt immer noch keine eingebaute Steuerung dafür. Die Erweiterung zeigt das erste Frame an und fügt dem Bild einen Play-/Pause-Button hinzu. Es begann als persönliches Utility, aber ich habe es inzwischen in die Firefox- und Chrome-Erweiterungsstores gestellt. Ein kleines Projekt, das ein tägliches Ärgernis löst. Firefox: https://addons.mozilla.org/en-US/firefox/addon/gif-control/ Chrome: https://chromewebstore.google.com/detail/gif-control/nhoihin... Bugreports und Feedback sind willkommen. Ich hatte es früher schon einmal bei Show HN gepostet, aber es gab keine Reaktion https://news.ycombinator.com/item?id=48208916

    • xerox13ster: Als ich 2011 anfing, Linux erstmals als Daily Driver zu nutzen, war das Standardverhalten von Konqueror, Firefox, LibreWolf und Opera genau so. Für Autoplay musste man ein Flag aktivieren, und im Rendering-Bereich erschien eine Warnung, dass man klicken müsse, um ein automatisch abgespieltes Video zu laden. Dass das verschwunden ist, überrascht mich nicht
    • fc417fc802: Damit kann ich eBay vielleicht wieder benutzen. Vor einiger Zeit haben sie bei bestimmten Produkt-Thumbnails angefangen, statt Fotos Videos zuzulassen, und ich habe fast aufgehört, auf der Seite zu stöbern. Der verlinkte Show-HN-Post ist als dead markiert, daher weiß ich nicht, ob es ein Account-Problem ist, aber du solltest vielleicht dem HN-Mod-Team mailen
  • thatmf: Ich habe eine kleine installierbare Web-App per Vibe Coding gebaut, die mir sagt, wann am nächsten Tag mein erstes Meeting ist.
    Ich habe viele Meetings, und sie ändern sich ständig, aber ich will mich auf dem Handy nicht in arbeitsbezogene Accounts einloggen oder überhaupt an diese Welt denken. Ich will einfach nur wissen, wann ich aufstehen muss. Die App zeigt nur die Uhrzeit an, und per Tap kann ich den Titel sehen. Je nachdem, wie früh das Meeting ist, ändern sich auch Schriftart und Farbe, und vor 8 Uhr morgens wird Nosifer verwendet. Ich hätte sie selbst bauen können, hätte es aber wahrscheinlich nicht getan. Solche einfachen, extrem spezialisierten maßgeschneiderten Utilities sind meiner Meinung nach ideal für Vibe Coding

  • asciimoo: Ich arbeite an Hister, einem selbstgehosteten Suchdienst, um die Abhängigkeit von Online-Suchmaschinen und KI-Antworten zu verringern https://hister.org/ https://github.com/asciimoo/hister
    Hister ist ein Volltext-Indexer für Websites und lokale Dateien und speichert automatisch vom Browser gerenderte besuchte Seiten. Es bietet Web- und Terminal-Suchoberflächen mit Offline-Vorschau der Ergebnisse und einer detaillierten Abfragesprache und kann bei Bedarf schnell zu traditionellen Suchmaschinen wechseln. Für „Recall“-Suche, also das Auffinden zuvor besuchter Inhalte, bietet es eine datenschutzfreundliche Erfahrung, aber für „Discovery“-Suche, also das Finden neuer Inhalte, reicht es noch nicht aus

    • SyneRyder: Mein erstes KI-Projekt war ähnlich, ich bin aber vom Metasuch-Ansatz ausgegangen. Einen lokalen Index habe ich erst vor Kurzem mit SQLite FTS 5 hinzugefügt. Ich habe mein Projekt nie veröffentlicht, aber Hister hat eine wirklich großartige Website und sogar ein Terminal-Interface und einen MCP-Server. Ich wünschte, mehr Leute würden erkennen, wie leistungsfähig schon allein ein lokaler Suchindex für zuvor besuchte Inhalte ist. Und ich hoffe, es gibt mehr Leute, die große Indizes aufbauen, damit wir bei Discovery-Suchalternativen nicht nur von Brave, Mojeek, Marginalia und EUSP abhängen
  • hakunin: Ich habe einen SQLite-basierten Sweeper gebaut, der Scans, Notizen, PDFs und Bilder im Dateisystem durchsucht, die Pfade speichert und die von Mistral OCR gelieferten Beschreibungen und Texte durchsuchbar macht.
    Man kann Fragen stellen wie „Wann muss ich mein Auto warten?“ oder „Finde das Bild, das mein Kind zum Muttertag gemalt hat“. Auf Basis eines Raspberry Pi startet ein bash-Executable so einen Dokumenten-Chat https://github.com/maxim/ringbinder

    • nha1: Ich habe etwas Ähnliches komplett offline gebaut. Ich musste die Steuererklärung machen, und das Zusammentragen der Informationen war so mühsam, dass ich damit angefangen habe
  • alphaBetaGamma: Ich habe ein Tool entworfen, um in CAD von Informatik und Wissenschaft inspirierte Schmuckstücke zu designen.
    Ich habe eine DSL zum Beschreiben des Schmucks geschrieben und ein LLM dazu gebracht, einen Interpreter zu erstellen, der mit cadquery CAD-Dateien generiert. Dabei habe ich auch gelernt, dass LLMs bei 3D-Reasoning schwach sind. Ohne KI hätte ich mir dafür wohl keine Zeit genommen. Da ich kein Frontend-Entwickler bin, habe ich KI auch für das Design des Onlineshops genutzt, und es war erstaunlich zu sehen, wie meine Frau ohne technischen Hintergrund mit Claude Code Änderungen an der Website vorgenommen hat. Das Endergebnis ist ein Store, der Schmuck verkauft, der wie Lambda-Diagramme zur Berechnung der Graham-Zahl (Tromp-Diagramme) oder wie Fixpunktoperatoren nahe am Y-combinator aussieht. Der eigentliche Y-combinator war aus Schmuckperspektive weniger schön https://studio-galois.com

    • qiqitori: Gemini Pro war überraschend gut bei 3D-Reasoning. Ich habe es ein WebGL-Programm bauen lassen, das über WebSerial alle 100 ms Eingaben wie X123 Y123 Z123 entgegennimmt und daraus ein Objekt entlang eines Pfads erzeugt, und auch die Performance-Optimierung ließ sich einfach per Anweisung erledigen. Ich habe auch mehrere OpenSCAD-Modelle gebaut, zum Beispiel auf Anhieb einen Fernbedienungshalter mit 5 Schlitzen, versetzten Höhen und leichter Neigung, wobei die Neigung über eine Schermatrix umgesetzt wurde
    • 8note: Ein Tipp für 3D-Reasoning: Lass es Zeichnungen aus mehreren Richtungen anfertigen und wähle dann eine davon aus. Das spart viel mehr Zeit, als darüber zu streiten, dass du eine Rotation um die Y-Achse meintest und es stattdessen eine Rotation um die X-Achse erklärt
    • phyzix5761: Der Schmuck ist wunderschön. Mich würde interessieren, ob du schon Verkäufe hattest
  • mybbor: Schon vor der Verbreitung von agentischem Coding habe ich Sticker-Designs für Konzerte und Musikfestivals gemacht. Sticker zu machen und zu verteilen war eine gute Möglichkeit, neue Leute kennenzulernen.
    Ich habe außerdem mit OpenClaw einen Health-/Wellness-Coach-Agenten gebaut, der Kalorien und Alkohol erfasst und in ein persönliches Dashboard schreibt. Man schickt ein Foto einer Mahlzeit, er schätzt die Kalorien, protokolliert sie, hilft bei Essensentscheidungen und motiviert einen auch noch. Mit dem HAM-Dashboard-Repository https://github.com/VA3HDL/hamdashboard habe ich ein angepasstes Dashboard erstellt, das lokale Video- und Wetter-Feeds bündelt, und aus demselben Rabbit Hole heraus auch einen lokalen Funk-Referenzleitfaden für Sonoma County gebaut https://mybbor.com/petaluma-sonoma-ham-radio.html. Für verschiedene Interessen und Projekte habe ich außerdem fast ein Dutzend einmalige kleine Websites gebaut, und ich nutze gern einen Datei-Uploader auf einer kurzen Domain, um Markdown und HTML schnell zu hosten und mit Familie, Freunden und Kollegen zu teilen. Läuft auf Caddy und einem DigitalOcean-VPS, der Code ist offen https://github.com/RobbyMcCullough/honeydrop

  • yablak: Ich habe ein Tool gebaut, das Google Photos-Backups inkrementeller macht als Google Takeout https://github.com/ebrevdo/gphoto-pull
    Nachdem ich Google verlassen hatte, habe ich auch eine Art Linter-Version von IFTTT gebaut, die ich vermisst hatte https://github.com/ebrevdo/ifttt-lint

    • s3graham: Schön, gphoto-pull zu sehen. Ich habe bisher wie ein Höhlenmensch alle zwei Monate NN 50-GB-Zips heruntergeladen. Ich frage mich, ob ein Backup als „Original“ ein bytegenau identisches Backup liefert.
  • jfim: Ich habe eine ganze Menge Tools gebaut.
    Ich habe ein selbst gehostetes Web-Archivierungs-Tool mit Unterstützung für erweiterbare Verarbeitungspipelines gebaut, zum Beispiel Artikel extrahieren → übersetzen → zusammenfassen → Tags erzeugen oder Video herunterladen → Audio trennen → transkribieren → zusammenfassen. Dabei sind auch ein verwalteter Chromium-Browser mit Unterstützung für Erweiterungen und WARC sowie ein RSS-Synthesizer entstanden, der Feeds aus beliebigen Artikellistenseiten ohne RSS erzeugt. Es gibt auch einen Active-Learning-Loop für ein Modell, das Artikel bereinigt, indem es Störungen wie Native Ads und Sponsor-Blöcke entfernt. Außerdem habe ich ein Tab-Terminal mit Projektmanagement-Funktionen gebaut, das Datenbank, App-Server und Claude Code pro Tab auf einmal startet und automatisch den Browser mit der richtigen URL öffnet, wenn das Terminal etwa http://localhost:4000/ ausgibt. Dazu kommen ein modulares MCP-Server-System, mit dem sich mit Claude innerhalb weniger Minuten MCP-Server-Ideen hinzufügen und ausrollen lassen, sowie ein MCP-Proxy und OAuth2 DCR. Ich habe auch ein kleines Tool, das Claude-Konversationen rendert, damit ich sie in meinem Obsidian-Vault mit Links wie convo://claude-code/-home-jfim-projects-foo/ verlinken kann, und insgesamt nutze ich es stark für das Deployment von Docker-Containern in meiner selbst gehosteten Umgebung. Das meiste ist auf GitHub, aber der Reifegrad ist sehr unterschiedlich.

    • flutas: Ein paar davon sehen interessant aus, ich werde sie mir heute Abend ansehen.
    • seriocomic: Fühlt sich an, als würde ich einen ähnlichen Weg gehen. Ich habe nur den Großteil meines Self-Hosting von GitHub auf ein selbst gehostetes Forgejo verlagert.
  • joddystreet: Ich habe ein paar Dinge gebaut.
    Eine selbst gehostete POPSQL-Alternative https://github.com/p-raj/collab-sqlc, eine CleanMyMac-Alternative auf Basis von Open-Source-Tools https://github.com/p-raj/open-cleanmymac, ein Tool, das Stand-up-Meetings in Comics verwandelt https://github.com/p-raj/standup-to-comics, und ein konfigurierbares Pomodoro https://github.com/p-raj/open-tomato. Ich habe außerdem noch ein paar private Tools, die noch nicht einmal annähernd lauffähig sind.

    • jmaw: Ich frage mich, ob es Beispiele gibt, die mit standup-to-comics erzeugt wurden. Ich habe im Repository nichts gesehen und würde vor dem eigenen Aufsetzen gern ein Beispiel sehen.
    • jsrcout: Ich war nicht darauf vorbereitet, die README von standup-to-comics zu lesen. Nicht nur die Idee ist cool, sie hat mir auch einiges zum Nachdenken und mehrere neue Rabbit Holes gegeben.
  • SdtEE: Ich war die ganzen seltsamen Verhaltensweisen leid, die entstehen, wenn Excel CSV-Dateien öffnet, also habe ich angefangen, einen schnellen und leichten CSV-Viewer zu bauen.
    Später habe ich gemerkt, dass sich die Technik zum sofortigen Laden von CSV-Dateien beliebiger Größe zu progressiven Parser-Kombinatoren verallgemeinern lässt und damit für praktisch jedes Format nutzbar ist. Deshalb kann es nicht nur Dateien, sondern auch streamorientierte Quellen wie Pipes lesen. Ich habe AI bei der Entwicklung eingesetzt, aber für ein intuitives und konsistentes UX-Design ging so viel Zeit drauf, dass es keinen großen Geschwindigkeitsgewinn gab. Noch nicht ganz produktionsreif, aber wer Interesse hat, kann es sich ansehen https://github.com/Verticalysis/Hitomi

  • AJRF: Der Moment, in dem ich dachte „Ich hätte nicht erwartet, dass das funktioniert“, war, als ich mit GLM 5 einen User-Space-Treiber für den Nintendo Switch Pro 2 Controller unter Ubuntu gebaut habe.
    Beim Einstecken wurde das Gerät erkannt, aber beim Drücken der Tasten wollte es nur den Pairing-Prozess starten, und in evtest kam nichts an. Diese Beschreibung war fast wortwörtlich mein Prompt, und 10 Minuten später hatte ich einen Treiber inklusive systemd-Unit, der auch nach einem Neustart funktionierte. Erstaunlich.

  • josh_p: Ich habe einen Telegram-Bot gebaut, der mir morgens und nachmittags im Grunde meine To-do-Liste schickt. Er ist mit Google Calendar und einer improvisierten Memory-Datenbank (SQLite) verbunden, und meine Kinder wollten, dass er wie Yarnaby aus Silksong spricht.
    Ich habe auch ein automatisches Backup für Steam-Spielstände gebaut, für den Fall, dass meine Kinder dasselbe Spiel mit meinem Account spielen und Steam-Cloud-Speicherstände durcheinandergeraten. Außerdem ein Skript, das fehlgeschlagene GitHub Actions in Repositories mit flaky Tests automatisch neu startet. So eine Art Einsatzgebiet, bei dem man sich fragt, ob es sich überhaupt lohnt, das Problem richtig zu beheben. Ich lasse Branches auch automatisch auf main aufholen. Außerdem gibt es eine YNAB-Erweiterung für ein pi-Agent-Harness, die Eingaben für Käufe unterstützt, die kategorisiert werden müssen, und die ich in den Telegram-Bot eingebaut habe, sodass ich Käufe per Spracheingabe beschreiben kann. Ich hatte schon ein Python-Skript, das PDFs zum Drucken von Magic: The Gathering-Proxys erzeugt, und mit einem LLM lasse ich jetzt Trenner mit Set-Namen und Symbolen erstellen, was das Organisieren großer Kartenboxen deutlich erleichtert

  • geedy: Ich baue einen BRep-CAD-Kernel von Grund auf neu.
    Wenn die Fillets wirklich gut funktionieren, plane ich, ihn als Open Source zu veröffentlichen. Das wird noch etwas dauern, aber seit dem Start vor 10 Wochen bin ich ziemlich weit gekommen. Das mittelfristige Ziel ist eine GUI-App, die STEP-Dateien importieren und nur sehr hochwertige Fillets verarbeiten kann. Ich denke, das wäre für viele Hobbyanwender nützlich

    • mym1990: Als jemand, der CAD gerade erst lernt, frage ich mich, was mit „sehr hochwertigen“ Fillets gemeint ist
  • smeej: Ich nutze schon lange Logseq, und zum Glück sind sowohl Logseq als auch die Plugins Open Source.
    Es macht großen Spaß, ein oft genutztes Plugin zu klonen und dann zu sagen: „Claude, mach bitte auch X möglich“, um Features hinzuzufügen, die ich schon immer haben wollte

  • mike-cardwell: https://gitlab.com/grepular/calendiff überwacht .ics-URLs und informiert per E-Mail über Kalenderänderungen.
    https://gitlab.com/grepular/foxcage startet Firefox in podman, isoliert ihn vom Host und enthält nur ein paar Funktionen, die ich haben wollte. https://gitlab.com/grepular/claude-sandbox ist noch eine Claude-Sandbox, die ebenfalls in podman läuft und ein leistungsfähiges Proxy-System zum Schutz von Zugangsdaten hat. Derzeit arbeite ich an einem E-Mail-Bereinigungstool und werde etwas dazu auf https://www.grepular.com/blog/ veröffentlichen, sobald es so weit ist, dass andere es nutzen können. Es wendet Richtlinien auf HTML/SVG/calendar/vcard-Teile an, um Tags, Attribute, CSS und URL-Schemata zu erlauben oder zu blockieren, bereinigt URLs, lädt Remote-Inhalte beim Zustellen herunter und hängt sie an E-Mails an, um Tracking zu verhindern, und bietet viele weitere Funktionen wie automatische Ver- und Entschlüsselung mit PGP und S/MIME

  • eternityforest: Ich habe eine Inventar-Tracking-App gebaut, die nur im Browser mit yjs läuft und über peer.js synchronisiert, nutze sie aber in letzter Zeit nicht mehr oft https://eternityforest.github.io/Stuffer/
    Es ist zwar keine App, aber ich habe auch ein Produktivitätssystem. Jedes Mal, wenn ich etwas vergesse, sage ich es einer AI und habe das System teilweise verfeinert, indem ich nach Literatur aus der Forschung zu menschlichen Fehlern gefragt habe, die mit genau diesem Fehler zusammenhängt https://github.com/EternityForest/THUNDERWARS

  • david_shi: In den letzten 3 Monaten habe ich etwas gebaut, mit dem sich neue OpenClaw-Agenten in der Cloud sehr schnell einrichten lassen https://operator.io
    Mehrere isolierte Agenten in Telegram laufen zu lassen, jeweils mit eigenem Speicher und eigenen Aufgaben, war nützlich für Benachrichtigungsautomatisierung, Kontextverfolgung und als eine Art persönlicher externer Kortex

  • flutas: Ich habe ein Home-Agent-Setup gebaut, mit maßgeschneiderten Spezialagenten, die über Home Assistant verschiedene Aspekte meines Hauses verwalten.
    Sie sollen aus dem Feedback der Hausbewohner lernen und Dinge zur passenden Zeit anpassen. Ich habe dafür auch mehrere zugehörige MCPs gebaut. Es gibt außerdem einen entfernten Claude-Code-Server, der einen Überblick auf Projektebene sieht und Projekte auf dem Homeserver statt lokal auf dem Laptop ausführen und entwickeln kann. Er unterstützt SSH und ein Web-UI; das Web-UI hat eine Projektliste, eine mit https://xtermjs.org/ gerenderte Shell und eine Kachelübersicht, mit der man bei der Arbeit an mehreren Projekten sehen kann, wann ein Turn endet. Ähnlich dazu startet eine lokale Version automatisch podman-Container im Projektrahmen, reicht das Arbeitsverzeichnis durch, installiert CC/Codex/Grok und übergibt Authentifizierung und Konfiguration für jeden Agenten. Danach landet man in einer Shell mit Umgebungs-Flags zum Deaktivieren von Berechtigungs-Prompts und mit Aliasen. Zum Beispiel ist claude = claude --dangerously-bypass-permissions. Es gibt auch ein umfangreiches MCP, das Agenten Zugriff auf fortgeschrittene Funktionen von Obsidian sowie auf Plugin-Vorschläge, -Installation und -Konfiguration gibt. Für die alltägliche Produktivität war das hilfreich, aber meistens arbeite ich immer noch lieber direkt im Code, statt alles per Prompt steuern zu lassen

    • nzach: Ich frage mich, ob du Code oder Erkenntnisse zum Home Agent teilen kannst. Ich würde gern etwas Ähnliches bauen und einen digitalen Butler für mein Zuhause haben, der überwacht, was im Haus passiert, tote oder instabile Geräte meldet, kaputte Automatisierungen repariert und auf Basis von Sensordaten neue Automatisierungen vorschlägt. Ich habe das inoffizielle Home-Assistant-MCP eingerichtet, aber es scheint, als hätte das LLM noch gewisse Schwierigkeiten, es richtig zu nutzen, und ich habe mir die Ursache noch nicht genauer angesehen
  • danielvaughn: Ich arbeite an einem Browser für Designer. Er ist zwar auch für andere gedacht, aber hauptsächlich baue ich ihn für mich selbst.
    Ich arbeite mit Code, aber oft möchte ich keine Branches anlegen oder Demo-Komponenten und Dateien in der Codebasis verstreuen, nur um verschiedene Ideen auszuprobieren. Wenn ein normaler Browser Entwicklertools hat, dann hat dieser Browser eingebaute Design-Tools. Man besucht eine App, öffnet die umgebende Canvas, zieht Teile auf die Canvas, macht etwas in Richtung Designarbeit und kann es danach wieder in den Code zurückführen. Alles passiert in derselben UI. Es ist cool genug, dass ich es veröffentlichen werde, aber schon jetzt ist es für mich extrem nützlich https://matry.design/

  • margarita_dev: Auf meiner Liste der Dinge, die ich schon immer einmal von Grund auf bauen wollte, stand stets eine Programmiersprache; mit Hilfe von AI habe ich das nun geschafft.
    Im Unternehmen habe ich zwei große Probleme bei AI-Workflows und Skill-Bibliotheken gesehen. Wenn ein kompletter 100-Schritte-Markdown-File der Workflow ist, fehlt es an Determinismus, und Markdown-Skill-Bibliotheken sind nur schwach komponierbar, sodass man gegen DRY verstößt. Margarita lässt Markdown und logische Operatoren zusammen existieren, sodass man bei Bedarf Determinismus durch Codestruktur erhält und bei Bedarf zu dynamischem LLM-Code übergehen kann. Zusätzlich erlaubt es komponierbare Prompts wie bei React und löst damit auch das Problem von Skill-Bibliotheken, bei denen Text überall verstreut ist. Die Reaktionen auf Reddit waren eher verhalten, daher werde ich es vermutlich einstellen, aber der Bauprozess hat sehr viel Spaß gemacht. Ich habe Code-Agents für fast alle LLM-Anbieter gebaut und auch ein eigenes Harness erstellt; als Lernerfahrung kann ich das sehr empfehlen. https://www.margarita.run https://github.com/Banyango/margarita

    • vibcdingenjoyer: Ich habe da vielleicht noch nicht genug Verständnis, aber könntest du das mit einem Beispiel oder einem Use Case erklären?
  • jtap: Ich baue weiterhin ein Tool zum Scannen und Indizieren von Pokémon-Karten für meine Tochter, ihre Freunde und mich selbst. https://MyBulkCards.com
    Es besteht aus einer Handy-App und einer Website; die App scannt Karten mit der Kamera, schickt die Bilder durch einige Modelle und speichert dann die Karte samt Standort. Es ist simpel, aber man kann Box-Standorte wie „Box 1 AAA, Box 1 BBB …“ speichern und Karten dadurch leicht wiederfinden. Es gibt auch eine Freundesfunktion, mit der man sehen kann, welche Karten Freunde in der Nähe haben, und wir leihen uns häufig gegenseitig Karten aus. Der Bauprozess hat wirklich Spaß gemacht, und ich habe gerade die Freigabe im Android-App-Store erhalten. Ich werde es bald veröffentlichen, sobald ich noch etwas aufgeräumt habe.