Der Inhalt des Artikels wirkt etwas seltsam, oder? Inhalte, die eigentlich separat als Hacker-News-Meinungen gesammelt erscheinen sollten, stehen im Haupttext ... Hat sich die Ausrichtung geändert?
In letzter Zeit gibt es bei den stark zunehmenden, auf Vibes basierenden Massenproduktionsprojekten oft Fälle, in denen Lücken im Ranking ausgenutzt werden, indem nur die Anzahl der Stars zählt. Deshalb wurde mit Originality eine neue Messmethode hinzugefügt. Dabei erzielte rhwp in zwei Bereichen die volle Punktzahl von 100/100 und landete damit auf Spitzenplätzen. Bei der Zahl der Stars kann man China nicht schlagen, schnief.
Die Benchmarks sollen zwar gut sein, aber im praktischen Einsatz scheint es mir noch nicht auf einem Niveau zu sein, auf dem man es als Coding-Agent wirklich sinnvoll nutzen kann.
Vielen Dank für die guten Informationen. Ich bekomme gerade richtig Lust darauf.
Es müsste schon ein a3b sein, damit man es wenigstens ein bisschen lokal laufen lassen kann, haha
Ich hoffe wirklich, dass dieses Projekt erfolgreich wird.
Der Inhalt des Artikels wirkt etwas seltsam, oder? Inhalte, die eigentlich separat als Hacker-News-Meinungen gesammelt erscheinen sollten, stehen im Haupttext ... Hat sich die Ausrichtung geändert?
Es ist schon etwas problematisch, ungeprüfte Fake News zu verbreiten;;
Wow, haha
Wow … ist das möglich … Wenn das stimmt, ist das wirklich beeindruckend.
Es sieht so aus, als würden jetzt alle für den Produktiveinsatz verfügbar werden.
Wenn das so weitergeht, kann man wohl bald jedes Gerät mit einem Klick deployen ... oha.
Daher scheint es eine gute Gelegenheit zu sein, einen Beitrag zu leisten.
Es scheint noch viele Modelle zu geben, die bisher fehlen.
In letzter Zeit gibt es bei den stark zunehmenden, auf Vibes basierenden Massenproduktionsprojekten oft Fälle, in denen Lücken im Ranking ausgenutzt werden, indem nur die Anzahl der Stars zählt. Deshalb wurde mit
Originalityeine neue Messmethode hinzugefügt. Dabei erzielte rhwp in zwei Bereichen die volle Punktzahl von 100/100 und landete damit auf Spitzenplätzen. Bei der Zahl der Stars kann man China nicht schlagen, schnief.Oh … so etwas gab es also. Das dürfte nützlich sein, um versteckte Open-Source-Perlen zu finden.
Ich kann dem Punkt über den
Generalistnur zustimmen. Als ich noch Berufseinsteiger war, dachte ich auch: Ich sollte Generalist werden~Die Benchmarks sollen zwar gut sein, aber im praktischen Einsatz scheint es mir noch nicht auf einem Niveau zu sein, auf dem man es als Coding-Agent wirklich sinnvoll nutzen kann.
Ich habe mir auch die anderen Tweets des Accounts angesehen, und es scheint einfach nur ein Scherz zu sein.
Darf ich fragen, mit welchem Gedanken Sie diesen Kommentar geschrieben haben, onetoday?
Beim Lesen davon hatte ich auch das Gefühl, dass es unbeabsichtigt nicht auch Menschen vergiften könnte.
Die Verbesserung des Modells ist wohl nur ein Vorwand; in Wirklichkeit wirkt es so, als würden Daten gesammelt, um Entlassungen zu rechtfertigen.
Hahaha, das sind echt lustige Leute.