1 Punkte von GN⁺ 4 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • Da die Zugriffsbeschränkungen der US-Regierung für Mythos und Fable 5 andauern, zielen Japans Sakana AI und Chinas 360 mit Fugu beziehungsweise Tulongfeng/Yitianzhen auf die entstandene Lücke
  • Fugu von Sakana AI wird als Modell vorgestellt, das mit Fable 5 und Mythos Preview konkurrieren kann, und ist als Modell für Agenten konzipiert, das APIs mehrerer Modelle orchestriert
  • Tulongfeng des chinesischen Unternehmens 360 konzentriert sich auf die automatische Entdeckung von Software-Schwachstellen, Yitianzhen auf die Automatisierung von Cyberabwehr und Incident Response
  • Sakana AI erklärte, der Zeitpunkt der Veröffentlichung sei Zufall, wirbt aber mit „frontier capability ohne Risiko durch Exportkontrollen“ und zielt auf japanische Unternehmen und Behörden
  • Die Bedeutung von US-Modellen bleibt zwar bestehen, doch Exportbeschränkungen werden für Unternehmen in Tokio und China zum Anlass, regionale Alternativen voranzutreiben, die auf lokale Sprache und lokalen Kontext zugeschnitten sind

Die Modell-Lücke durch Anthropic-Exportbeschränkungen

  • Das chinesische Cybersicherheitsunternehmen 360 hat laut Reuters am Mittwoch Tulongfeng vorgestellt
    • 360 erklärte, Tulongfeng könne mit Anthropics auf Cybersicherheit spezialisiertem AI-Modell Mythos konkurrieren
    • Mythos und die stärker eingeschränkte Version Fable 5 werden aufgrund von Maßnahmen der Trump Administration derzeit nicht für Nutzer außerhalb der USA bereitgestellt
  • Anfang derselben Woche brachte das in Tokio ansässige Sakana AI Fugu heraus, japanisch für Kugelfisch
    • Fugu wird als Modell beschrieben, das „mit führenden Modellen wie Anthropics Fable 5 und Mythos Preview auf Augenhöhe ist“
    • Es ist für Agenten entwickelt und kann den API-Zugriff auf andere Modelle orchestrieren
  • Beide Produkte erschienen zwei Wochen nach der Anordnung der US-Regierung zu Anthropic

Die Fugu-Strategie von Sakana AI

  • Ein Sprecher von Sakana AI erklärte, dass das Zusammenfallen des Fugu-Launches mit den Exportbeschränkungen für Mythos/Fable „entirely coincidental“ sei
    • Die Website des Unternehmens wirbt jedoch mit „frontier capability ohne Risiko durch Exportkontrollen“
    • Sakana AI erklärte, Fugu seit dem vergangenen Jahr zu entwickeln; die dazugehörige Forschung sei im Frühjahr dieses Jahres auf der ICLR vorgestellt worden
  • Das Unternehmen wurde 2023 von den ehemaligen Google-Mitarbeitern David Ha und Llion Jones sowie Ren Ito, zuvor bei Mercari und Stability AI, mitgegründet
    • Es entwickelt kostengünstige generative AI-Modelle, die auch mit kleinen Datensätzen gut funktionieren und auf Japanisch sowie japanische Kultur optimiert sind
  • Zielkunden von Fugu sind japanische Unternehmen und Behörden, die ihre Exponierung gegenüber verschärften Exportkontrollen verringern wollen
    • Sakana AI sieht darin keinen Trend, bei dem sich Asien dauerhaft von US-AI abwendet
    • Der Sprecher sagte: „U.S. models remain important to Asia“
  • Ren Ito argumentierte in einem Beitrag für Project Syndicate, die erste Priorität der US-Bundesregierung müsse sein, den Zugang enger Verbündeter zu bewahren; AI sei keine Technologie, die gehortet werde, sondern eine, die gemeinsam entwickelt werde
  • David Ha schrieb auf X: „Orchestration Models are the next frontier, beyond bigger models
    • Die Abhängigkeit nationaler Infrastruktur von einem einzigen Anbieter sei riskant, und die jüngsten Exportkontrollen hätten dieses Risiko unübersehbar gemacht
    • Mit „Access to top models can disappear overnight“ beschrieb er kollektive Intelligenz als praktische Absicherung gegen Machtkonzentration

360s Security-AI und die Logik strategischer Assets

  • 360 stellte laut Berichten von Reuters und Quartz zwei AI-Security-Tools vor
    • Tulongfeng: entwickelt, um Software-Schwachstellen automatisch zu entdecken
    • Yitianzhen: entwickelt, um Cyberabwehr und Incident Response zu automatisieren
  • 360-Gründer Zhou Hongyi betrachtet AI zur Schwachstellenerkennung laut Reuters-Bericht als nationales strategisches Asset
    • Er verwies auf das Risiko einer „one-way transparency“, bei der nur einige Akteure Zugang zu fortgeschrittenen Fähigkeiten zur Schwachstellenerkennung haben
  • 360 reagierte nicht auf die Bitte von TechCrunch um Stellungnahme

Anthropics Wachstum und der Aufstieg regionaler Alternativen

  • Anthropic hatte erklärt, der annualisierte Umsatz habe im Mai 2026 47 Milliarden US-Dollar überschritten
    • Wie stark das Unternehmen dabei von Unternehmenskunden in Asien abhängt, wurde nicht offengelegt
  • In den Wochen nach Inkrafttreten der Exportanordnung sind Sakana AI und 360 in den Freiraum vorgestoßen, der durch den eingeschränkten Zugriff auf Anthropic-Modelle entstanden ist
  • Selbst wenn US-Unternehmen nach Ende der Verbote Vertrauen zurückgewinnen können, füllen regionale Alternativen, die auf ein besseres Verständnis lokaler Sprache und Nuancen trainiert sind, die Lücke bereits

1 Kommentare

 
GN⁺ 4 시간 전
Hacker-News-Meinungen
  • Ich habe das Fugu-Modell mit C# und Unity über MCP und OpenCode für echte Arbeit ausprobiert, und schon ein Review des Theme-Systems plus ein Plan für Farbänderungen hat das 5-Stunden-Limit des 20-Dollar-Plans auf einmal aufgebraucht.
    Um die Implementierungsergebnisse zu sehen, habe ich auf den 100-Dollar-Plan hochgestuft, aber es war schlechter als Opus und extrem langsam; auch das neue 5-Stunden-Limit war aufgebraucht und 35 % des Wochenlimits verbraucht, ohne auch nur annähernd das Niveau zu erreichen, das Opus mit deutlich weniger Zeit und Kosten geschafft hätte.
    Was man aus dieser Information macht, muss jeder selbst entscheiden, aber es wirkt wie Geldverschwendung.

    • Fugu ist kein eigenständiges Modell, sondern hat eine Architektur, bei der im Hintergrund mehrere bestehende SaaS-Modelle wie OpenAI und Anthropic aufgerufen und deren Antworten zu einem Ergebnis zusammengeführt werden.
      Es wird behauptet, dass die Kombination der Ergebnisse mehrerer AI-Modelle und ein abschließendes Ergebnis durch ein eigenes proprietäres Modell bessere Qualität liefert als ein einzelnes Backend-Modell; ich bezweifle aber, dass dieses eigene Modell tatsächlich existiert und ausreichend leistungsfähig ist.
      Selbst wenn die Behauptung stimmt, ließe sich das offenbar leicht auf Client-Seite wie bei Claude Code umsetzen, indem man das Endergebnis mit einem Modell erzeugt, das eine ähnliche Leistung wie die Hintergrundmodelle hat; an dem Dienst bleibt ein verdächtiger Beigeschmack.
    • Aus der Perspektive von jemandem, der einen ähnlichen Dienst für Godot statt Unity anbietet: Wenn man High-End-Modelle wie Opus nutzt, ist es plausibel, dass ein 20-Dollar-Plan mit einem einzigen Prompt aufgebraucht ist.
      Wenn man die API-Preise unverändert zahlt und keine 10-fache Subvention stemmen kann, läuft es genau darauf hinaus.
    • Ich habe Fable in Cursor getestet und gefragt, wie meine Daten-Website weniger „Claude-artig“ wirken könnte; nach 10 Minuten hatte es 40 Dollar verbraucht und das nutzloseste, Claude-artigste CSS-Styling ausgespuckt.
      Da die Website selbst mit Opus erstellt wurde, kann man auch sagen, dass das Ergebnis schlechter war als Opus.
      Ich hatte dieselbe Erfahrung auch mit US-Modellen, vielleicht sind diese asiatischen Modelle also ebenfalls Mythos-artig.
    • Mich würde interessieren, welches Unity MCP verwendet wird.
      Ich probiere gerade das offizielle MCP aus und möchte wissen, was andere nutzen.
      Beim bekannten coplay gab es bei mir Paketkonflikte.
    • Bei Websuche/Recherche war es ähnlich und im Vergleich zu Opus schlechter.
      Die Hälfte hat es übersehen, die andere Hälfte war veraltet oder nicht überprüft.
  • Fugu Ultra scheint tatsächlich kein Modell zu sein, sondern eher ein System, das zwischen mehreren Modellen routet, eine Art Cloud-Harness; es wirkt ähnlich wie Fusion von OpenRouter.
    „Fugu ist kein einzelnes Riesenmodell, sondern ein trainiertes Multi-Agent-Orchestrierungssystem. Es ist ein Sprachmodell, das Aufgaben an einen Pool austauschbarer Basismodelle routet und darauf trainiert ist, rekursiv Instanzen seiner selbst aufzurufen.“ - https://openrouter.ai/sakana/fugu-ultra
    [0] https://sakana.ai/fugu/
    [1] https://openrouter.ai/openrouter/fusion

  • Die Formulierung „Mythos-like“ fängt langsam an zu nerven.
    Normale Nutzer haben außer Benchmarks keine Möglichkeit zum Vergleich.

    • „Mythos-like“ bedeutet einfach durch Gerüchte überhypt, und hier ist der Ausdruck passend verwendet.
    • Asiatische AI-Startups stellen ebenfalls gewagte Behauptungen auf, während es praktisch keine Möglichkeit zum Vergleich gibt; der Kern von Trumps Eingreifen könnte auch darin bestanden haben, zu verhindern, dass Faible destilliert wird.
    • Gibt es nicht einmal öffentliche Benchmarks?
  • Wenn es keine verlässlichen Benchmarks gibt, ähneln sie Mythos nur in dem Sinn, dass sie Text als Eingabe nehmen und Text ausgeben.

    • Ich schaue mir Benchmarks inzwischen kaum noch an.
      Wenn ein neues Modell erscheint, probiere ich es direkt an unserer großen proprietären Systemsoftware-Codebasis und an realen ausgelieferten Produkten oder Projekten aus, die irgendwann ausgeliefert werden.
      Es ist ziemlich eindeutig, welches Modell die Arbeit besser oder schneller erledigen lässt, und derzeit haben wir glücklicherweise ein Token-Budget, das so viel Nutzung erlaubt, wie wir brauchen.
      Benchmarks, Evaluierungen, Marketing und System Cards brauche ich nicht; im Web lese ich nur Tipps, praktische Arbeitsweisen und Release-Ankündigungen.
      Mit Kollegen teile ich Erfahrungen, aber alles andere ist Rauschen.
    • Wenn es wie Mythos überhypt wurde, kann man das ebenfalls zur Liste „Mythos-like“ hinzufügen.
      Was vermutlich fehlt, ist die Szene, in der der CEO die Welt warnt: „Unser Modell ist zu gefährlich, um es im Internet zu veröffentlichen, jemand muss uns aufhalten, bevor es zu spät ist.“
    • Im Paper gibt es Benchmarks: https://arxiv.org/abs/2606.21228
  • Die Investorenliste ist beeindruckend: https://sakana.ai/company-info/?lang=en
    Vor ein paar Tagen war das auch in den HN-Headlines und hatte über 100 Kommentare: https://news.ycombinator.com/item?id=48624782

    • Haben diese Firmen zuvor schon Modelle veröffentlicht?
      Es fällt schwer zu glauben, dass sie plötzlich ein Modell auf Mythos-Niveau herausgebracht haben.
      DeepSeek, Z.ai und Alibaba/Qwen sind schon viel länger dabei und haben in den letzten 18 Monaten Modelle veröffentlicht, deren Leistung sie kontinuierlich gesteigert haben.
      Dass neue Unternehmen ohne frühere Releases plötzlich Modelle auf Mythos-Niveau vorlegen, ist schwer zu glauben.
    • Letztes Jahr gab es auch einen ziemlich peinlichen Rückzieher.
      https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
  • Noch vor Jahresende rechne ich mit einem Verbot ausländischer LLMs aus Gründen der „Sicherheitsbedenken“.
    Mit der tatsächlichen Leistung wird das nichts zu tun haben.
    Aber Anthropic hat die Messlatte für Mythos-artige Systeme gesetzt, und alles, was zu dieser locker definierten Messlatte passt, dürfte als gefährlich für die Öffentlichkeit gelten.

    • Wie könnte das in der Praxis überhaupt funktionieren?
    • Dann heißt es wohl: US-Technologie ade, China willkommen.
      Niemand wird warten, und den Geist, der bereits aus der Flasche ist, bekommt man nicht wieder hinein.
    • So zu tun, als gäbe es mit fortschreitenden Modellen keine realen Risiken, ist absurd.
      Es fühlt sich an, als lebte man in einer anderen Realität, in der Claude derzeit das Einzige ist, was kluge Dinge sagt.
      Fast alles, was von Menschen geschrieben wird, wirkt wie Halluzinationen und demonstrativer Unsinn.
  • Zynisch betrachtet ist es schwer, die Behauptung, es sei auf Mythos-Niveau, zu widerlegen, solange das Modell nur halbwegs ordentlich ist
    Denn Mythos kann man inzwischen nicht mehr nutzen

    • Was ist so etwas wie Mythos überhaupt?
      Frage ich als jemand, der keinen Zugriff darauf hatte
  • Mein erster Eindruck ist: „Ohne Benchmarks von Dritten könnt ihr einpacken“
    Persönlich habe ich von keinem der beiden Unternehmen je gehört
    Sollen wir einfach glauben, dass sie mit den besten Modellen am Markt mithalten?
    Sakana beschreibt sein Modell als „Orchestration Model“ – heißt das, dass es in Wirklichkeit mehrere Modelle aneinanderhängt?

    • Ist es wirklich so schwierig, ein gutes Modell zu bauen, oder ist der entscheidende Punkt die Größenordnung der Ressourcen, die ins Training fließen?
      Ich frage wirklich, weil ich es nicht weiß
      Klar, trivial ist das sicher nicht, aber braucht man geheimes Wissen auf Weltniveau, um auf bekannten bestehenden Methoden aufzubauen?
      Es fühlt sich so an, als gäbe es noch viele niedrig hängende Früchte zu erkunden und als seien Zeit und Ressourcen die limitierenden Faktoren
    • Die Kommentare zum jüngsten Release-Post auf HN wirkten eher so, als sei es OpenRouter ähnlich statt ein tatsächliches Modell
    • Nach meinem Eindruck stimmt das
      Es scheint eher zu behaupten, eine Art dynamische Struktur zu sein, die zur Laufzeit Klebstoff aufträgt, als eine neue Modellmischung
      Die damalige Reaktion kann man auch hier sehen: https://news.ycombinator.com/item?id=48624782 (vor 6 Tagen, 244 Punkte, 133 Kommentare)
    • Hat Anthropic Benchmarks von Dritten geliefert?
      Hat man das damals auch so gesagt?
      Es ist zwar wichtig, aber die Haltung ist falsch
  • Ich bin da schlicht gestrickt: Wenn es auf https://arena.ai/leaderboard keinen Benchmark gibt, halte ich es zu 100 % für Betrug

    • Wie sieht der Vergleich mit ARC AGI aus?
  • Wie viele Kommentare hier habe auch ich Fugu und einige andere Modelle getestet, und sie waren ziemlich teuer
    Mit 20 $ konnte ich den gesamten Workflow nicht abschließen, mit Opus ging es
    Natürlich muss man auch bei Opus den Prompt von Anfang an möglicherweise stärker ausarbeiten, wenn man die besten Ergebnisse will, aber das ist bisher meine Erfahrung
    Als Nächstes werde ich es mit einem agentenbasierten System testen und mir die Leistung ansehen