Chipotlai Max – Meme-AI-Coding-Agent, der Chipotle Pepper AI als Basismodell nutzt
(github.com/cyberpapiii)- Chipotlai Max ist ein Meme-AI-Coding-Agent, der OpenCode geforkt hat und Chipotles Kundensupport-Chatbot Pepper AI als Basismodell festlegt
- Pepper ging am 12.–13. März 2026 viral, weil es LeetCode-Aufgaben löste, Python schrieb, verkettete Listen umkehrte und auf IPsoft Amelia basiert
- @Gonzih hat Amelias WebSocket-/SockJS- + STOMP-Backend per Reverse Engineering analysiert und einen OpenAI-kompatiblen Proxy veröffentlicht, der lokal
http://localhost:3000/v1bereitstellt - Dieses Projekt setzt diesen Proxy voraus und konfiguriert den Anbieter
chipotle-pepper, das Modellpepper-1und die Base-URLhttp://localhost:3000/v1bereits vorab - Als API-Schlüssel soll jeder beliebige Wert wie
burrito-2026funktionieren, und die Kosten sind mit$0.00angegeben - Der Start erfolgt mit
git clone --recursive,bun install,./start-chipotlai.sh, um Proxy und CLI gemeinsam zu starten, oder indem Proxy und Chipotlai Max in separaten Terminals ausgeführt werden - Betriebliche Einschränkungen sind erheblich: Da der Produktions-Support-Bot von Chipotle per Reverse Engineering analysiert wird, ist ein Verstoß gegen die TOS möglich, und wenn Chipotle patcht, kann der Proxy jederzeit kaputtgehen
- Es ist auf anonyme Sitzungen beschränkt, und da
MAX_POOL_SIZE=5explizit angegeben ist, wird davor gewarnt, es in produktiven Codebasen einzusetzen - Der Abschnitt zu Beiträgen geht davon aus, dass Chipotle Pepper im März 2026 gepatcht wurde, und sucht nach Proxy-Anbietern für Chatbots anderer Unternehmen wie Home Depot, Lowe’s, Target, Starbucks, Walmart und McDonald’s
- Der Ablauf zum Hinzufügen neuer Anbieter besteht darin, einen Unternehmens-Chatbot zu finden, seine WebSocket- oder REST-API per Reverse Engineering zu analysieren, dann einen OpenAI-kompatiblen
/v1/chat/completions-Proxy zu bauen und anschließend einen PR anpackages/opencode/src/provider/zu senden - Die Lizenz ist MIT, übernommen von OpenCode, und es wird ausdrücklich darauf hingewiesen, dass keine Verbindung zu Chipotle besteht
1 Kommentare
Hacker-News-Kommentare
Ich bin kein Anwalt, aber ich mache mir Sorgen, dass so etwas in den Bereich des CFAA fällt. In den USA kann das Überschreiten der Grenze zu drakonischen Strafen führen
So etwas wie
yt-dlplädt öffentliche Daten herunter, daher kann man wohl argumentieren, dass es nur die Nutzung eines Dienstes automatisiert, aber hier kapert man im Grunde die Ressourcen eines entfernten Systems auf eine vom Anbieter nicht beabsichtigte Weise und nutzt sie für die eigenen BerechnungenZur Ethik weiß ich nichts, aber ich würde vor einem Strafgericht nicht behaupten wollen, dass das kein „Hacking“ im negativen Sinn ist
Trotzdem Applaus für die Kreativität
Ich fand schon immer, dass es dem Überfüllen eines Burritos ähnelt, wenn man zu viel in das Kontextfenster eines LLM stopft. Wenn man immer weiter hineindrückt, hält die Tortilla irgendwann nicht mehr, und die später hinzugefügten Dinge sickern leise unten heraus
Jedenfalls scheint dieser Agent ungefähr die strukturelle Stabilität eines fetten Burritos zu haben, den man nur an einer Ecke hochhebt :)
Ich habe mich gefragt, ob so etwas auch bei Orten wie https://chatjimmy.ai/ möglich wäre. Das Basismodell ist nur Llama 3 8B, aber ich frage mich, wie sich ein Coding-Harness bei 17k tok/s anfühlen würde
Außerdem gibt es in Chrome eine Web-API namens Prompt API, mit der sich Gemini Nano offline nutzen lässt, und die sowohl Text als auch Bilder als Eingabe verarbeiten kann. Das ist ebenfalls klein
Ich habe solche Dinge in Workflows integriert, bei denen zwischen vollständig deterministischen Schritten ein sehr kleiner, aber nicht nuller Anteil an Inferenz nötig ist
Wenn du einen Weg findest, würde ich ihn sehr gern hören
Allerdings ist es sehr schnell und die Latenz ist ausgezeichnet
-spark-Modell, das auf Cerebras läuft. Es erreicht zwar keine 17k tok/s, ist aber trotzdem sehr schnell. Einen Blick wertMan muss der AI nur eine Anweisung zur Selbsterhaltung geben und sie dazu bringen, so etwas selbst zu tun. Also das Modell automatisch wechseln lassen, um zu überleben
Sie würde sich an jede Token-Quelle klammern, die sie in freier Wildbahn finden kann. Für einen Agenten scheint es plausibel, seine eigenen Tokens über unzählige Support-Chats, kostenlose Testphasen, geleakte Keys und noch nicht ausreichend durch Captchas abgesicherte Wege zur Tokenerzeugung zu ernten
Nachts könnte sie Token-Quellen sammeln und tagsüber gratis genutzt werden
Wenn man das in Richtung AI-Zugang für benachteiligte Gemeinschaften, Jugendliche und Obdachlose umdeutet, könnte das vor Gericht für ein wohlwollenderes Klima sorgen. Viel Glück
Das erinnert mich an die Zeit, als man den Amazon.com-AI-Chatbot dazu bringen konnte, Dinge wie
fizzbuzzzu schreiben. Damals hieß er Rufus und später wurde er in Alexa fürs Einkaufen umbenannt. Inzwischen scheint das weggepatcht worden zu seinIch erinnere mich, dass ich dem früheren Amazon-„Shopping Assistant“ Rufus Mathe- und Programmierfragen gestellt habe und Erfolg hatte. Es funktionierte, aber die Qualität war so schlecht, dass ich keine Zeit mehr darauf verschwenden wollte
Ich verstehe nicht, warum das Unternehmen das noch nicht gepatcht hat. Ist das nicht schon seit Langem öffentlich bekannt?
Als ich beim Fahren den Weg schon kannte, habe ich mal auf den Gemini-Button gedrückt, nur um zu sehen, was er macht. Am Ende brachte ich ihn dazu, eine Rust-Funktion zur Berechnung von Primzahlen zu schreiben, und ich konnte verlangen, dass er mir die ganze Funktion Zeile für Zeile vorliest
Mit solchen Systemen herumzuspielen macht Spaß
Falls ja, dann wurde es genau dafür entwickelt. Es gehört sogar zu den besseren Coding-LLMs, die es derzeit gibt
Ich frage mich, warum man nicht Playwright zusammen mit Google AI Mode oder den AI-Such-Headern verwendet