1 Punkte von GN⁺ 4 시간 전 | 4 Kommentare | Auf WhatsApp teilen
  • Anthropic hat nach Gesprächen mit der US-Regierung die Fable-5-Cybersicherheits-Schutzmaßnahmen aktualisiert; die meisten Coding-Aufgaben können unverändert genutzt werden
  • Kurzfristig können die neuen Schutzmaßnahmen harmlose Anfragen häufiger markieren als die bisherigen Fable-Schutzmaßnahmen; Anthropic will dies über die nächsten Wochen anpassen
  • Wenn eine Anfrage markiert wird, erscheint für Nutzer eine Benachrichtigung, und die entsprechende Antwort wird stattdessen von Opus 4.8 bereitgestellt
  • Die Klassifikatoren für Biologie und Chemie entsprechen dem Stand der Erstveröffentlichung, sodass auch einfache, biologiebezogene Fragen zu einem Fallback auf Opus 4.8 führen können
  • Bezahlte Tarife mit enthaltenem Nutzungsvolumen können Fable 5 bis zum 7. Juli für bis zu 50 % des wöchentlichen Nutzungslimits verwenden; danach müssen andere Modelle oder Nutzungsguthaben (usage credits) genutzt werden

Wiederaufnahme des Zugangs zu Fable 5 und Anpassung der Schutzmaßnahmen

  • Anthropic hat nach Gesprächen mit der US-Regierung die Cybersicherheits-Schutzmaßnahmen aktualisiert
  • Die meisten Coding-Aufgaben sind von dieser Änderung nicht betroffen
  • Kurzfristig können die neuen Schutzmaßnahmen etwas mehr harmlose Anfragen markieren als die bisherigen Fable-Schutzmaßnahmen
    • Anthropic will die Klassifikatoren in den kommenden Wochen verbessern
    • Markierte Anfragen werden den Nutzern klar angezeigt
    • Die entsprechende Antwort wird von Opus 4.8 bereitgestellt

Aktuelle Grenzen der Klassifikatoren für Biologie und Chemie

  • Die Klassifikatoren für Biologie und Chemie sind dieselben wie bei der Erstveröffentlichung
    • Die aktuellen Klassifikatoren greifen breiter, als es dem gewünschten Niveau entspricht
    • Auch bei einfachen, biologiebezogenen Fragen kann ein Fallback auf Opus 4.8 auftreten
    • Verbesserungen dieser Klassifikatoren sollen bald umgesetzt werden

Nutzungsbedingungen für bezahlte Tarife und Feedback-Kanäle

  • Alle bezahlten Tarife mit enthaltenem Nutzungsvolumen erhalten bis zum 7. Juli Zugang zu Fable 5
  • Fable 5 kann für bis zu 50 % des wöchentlichen Nutzungslimits verwendet werden
    • Für das danach verbleibende Nutzungsvolumen kann auf andere Modelle gewechselt werden
    • Fable kann auch mit Nutzungsguthaben weiter verwendet werden
  • Hinweise zum Promo-Zugang: Claude Fable 5 promotional access
  • Wenn eine Anfrage in Claude Code fälschlich markiert wird, kann dies mit /feedback gemeldet werden
  • In Claude.ai und Cowork kann Feedback über die Daumen-Buttons geteilt werden
    • Dieses Feedback wird genutzt, um die Klassifikatoren anzupassen und False Positives zu reduzieren
  • Blogbeitrag zu Fable 5: Claude Fable 5 Mythos 5

4 Kommentare

 
seoseonyu 1 시간 전
  1. Juli ... dann warte ich wohl einfach auf 5.6 Sol.
 
treestae 21 분 전

Ich warte auch auf Sol.
Galaxy oder Cosmos werden wohl auch erscheinen ...

 
GN⁺ 4 시간 전
Meinungen auf Hacker News
  • Ich denke, die Gewichte von Fable/Mythos könnten, ob böswillig oder nicht, schon durch einen einzigen Fehler an feindliche Akteure durchsickern oder in irgendeinem Torrent landen.
    Die Fable-Gewichte werden wahrscheinlich über Hunderte Rechenzentren verteilt, und Tausende Menschen könnten direkt oder indirekt teilweise oder vollständige Zugriffsrechte haben. Wenn es wirklich ein Weltuntergangs-Modell wäre, würde man wohl nicht so damit umgehen; bei Mythos kann ich noch glauben, dass es nur in Rechenzentren läuft, die staatliche Vorschriften erfüllen. Aber wenn ein Modell so wertvoll ist, werden staatlich unterstützte Hacker viel größere Anstrengungen unternehmen, es zu stehlen. Wie die Lage tatsächlich auch ist: Es fällt schwer zu glauben, dass es so bahnbrechend ist, wie Anthropic behauptet.

    • Seit GPT-2 hören wir, Modelle seien zu gefährlich.
      Ab einem gewissen Punkt wünscht man sich nicht mehr nur, dass der Hirtenjunge aufhört, „Wolf!“ zu rufen, sondern fast schon, dass ihn der Wolf frisst.
    • Vielleicht wäre es langfristig sogar das Beste, wenn Mythos irgendwie leakt und die gesamte Menschheit es per Self-Hosting nutzen kann.
    • Es könnte komplizierter sein, als man denkt. Soweit ich weiß, bietet Nvidia bei seinen teuren Produktlinien TEE an, daher könnten die Gewichte verschlüsselt genutzt werden.
      Das heißt nicht, dass ein Leak unmöglich ist, aber es würde zu einer ziemlich großen Aufgabe. Das könnte auch der Grund sein, warum Anthropic sich nicht allzu große Sorgen macht, wenn Elon das Modell auf seiner Seite als Service betreibt. Grob dürfte der Ablauf so aussehen: Handshake mit Nvidia TEE, Schlüssel injizieren und anschließend die verschlüsselten Gewichte hochladen. Wahrscheinlich gibt es auch einen Timer, der ohne Heartbeat-Signal abläuft, damit gestohlene Gewichte nicht einfach dauerhaft auf Nvidia-Hardware weiterbetrieben werden können.
    • Ich glaube nicht, dass Anthropic wirklich behauptet, es handle sich um etwas Weltuntergangsartiges. Es scheint eher darum zu gehen, dass es wegen offensiver Cybersecurity-Fähigkeiten gefährlich sein könnte.
    • Ich halte das alles für Marketing. Die Regierung hat immer wieder wie ein Insider-Trader gewirkt.
  • Ich habe das Manuskript eines Buchs über menschliches Bewusstsein eingegeben und wurde blockiert. Dieses Modell ist lächerlich schlecht, und Anthropic hat es in einem Maß entschärft, das sich fast böswillig anfühlt.
    Ich habe nicht vor, für etwas praktisch Nutzloses zu bezahlen.

    • Ich habe Sonnet heute gebeten, über Browser MCP den Benutzernamen und das Passwort für ein Projekt einzugeben, an dem ich arbeite; es antwortete, das könne es nicht tun, weil es gegen Sicherheitsprotokolle verstoße.
      Früher ging das problemlos. Ich mag Claude und habe es weiter genutzt, obwohl Leute sagen, Codex sei besser, aber das kommt wirklich an meine absolute Grenze. Ich zahle über 200 Dollar im Monat und empfehle es sogar bei Auftragsarbeiten, aber dass sie nicht einmal einen Dienst mit grundlegendem Respekt anbieten können, ist völlig absurd. In sechs Monaten werden sie nur noch Gespräche über Easy-Bake-Rezepte erlauben, und wenn sich jemand an einer Glühbirne verbrennt, stufen sie es weiter herunter auf Gespräche über Wildblumenwiesen.
    • Gleiches Problem. Auch ein Buch, an dem ich über Sprache und Thermodynamik schreibe, wird blockiert. Der Klassifikator scheint einfach eine Regex zu sein.
    • Der Zeitpunkt ist besonders ungünstig. Denn als Stärke dieses Modells wurden sein langer Arbeitskontext, seine Ausdauer und die Fähigkeit beworben, große Aufgaben autonom voranzutreiben.
      Wenn es aber zwischendurch auf Opus 4.8 zurückfällt oder jederzeit abbrechen kann, ist es schwer, sich auf diese Fähigkeit zu verlassen. Wenn man solche langen Prozesse laufen lässt, funktionieren sie eine ganze Weile recht solide, bis irgendetwas als Fehlschlag klassifiziert wird; dann ist die „Langzeitaufgabe“ tot, und ein Mensch muss sie wiederbeleben oder mühsam zurückrollen und erneut versuchen.
    • Es wurde schon bei der ersten Anfrage blockiert. Mein Partner bat darum, Notizen zu Bugs im Website-Frontend, Korrekturen an Produkttexten, CSS-Bugs und Formulierungsproblemen zu lesen, und es wurde sofort blockiert. Nutzlos.
    • Diesmal sieht es so aus, als hätten sie das tun müssen. Siehe den gestrigen Beitrag zur Ausweitung der Sicherheitsmarge beim Klassifikator.
  • In der Zeit ohne Fable hatte ich das Gefühl, dass Opus allein völlig ausreicht. Jetzt ist es zurück, aber ich habe es überhaupt nicht vermisst.

  • Ich werde es heute Nacht zwar nutzen, aber nicht wirklich gern. Denn nach dem 7. Juli möchte ich nicht plötzlich API-Preise zahlen, nachdem ich bisher per Abo einen viel größeren Gegenwert bekommen habe.
    Vielleicht ist genau das die „Token Economics“, die dieses Jahr alle trifft. Jedenfalls werde ich es so gut wie möglich ausreizen, solange es verfügbar ist, und danach zu meinen verlässlichen Partnern Opus 4.6 und Sonnet 4.6 zurückkehren. Keine Ahnung, wie lange die noch angeboten werden.

    • Wenn du es so nutzt, verbrauchst du dein Kontingent doch sofort und musst am Ende ohnehin API-Preise zahlen, oder?
    • Ich bin mir ziemlich sicher, dass nach dem 7. Juli ein Max-350-Tarif kommen wird.
    • Als die Leistungsverschlechterung anfing, habe ich das Standardmodell fest auf Opus 4.6 gesetzt. Die Ergebnisse sind viel besser als bei 4.7 und höher.
      Das ist wohl genau das, was man Serviceverschlechterung nennt.
  • Der Vertrauensverlust gegenüber US-basierten Modellen dürfte schwer wieder gutzumachen sein.
    Anthropics überzogene Weltuntergangsrhetorik und die davon beeinflusste Regierung haben das Vertrauen stark beschädigt und sogar eine Art Wettrüsten ausgelöst.

    • Andererseits ist „Unser Produkt war so gut, dass es verboten wurde“ die bestmögliche Werbung. OpenAI hätte wahrscheinlich alles getan, um in so eine Lage zu kommen.
      Sonnet 5 möchte ich nicht sofort testen, aber an Fable bin ich ziemlich interessiert.
    • Ich hoffe, dass OpenAI und chinesische Unternehmen den nötigen Wettbewerb bringen.
    • Wenn man ein KI-basiertes Produkt gebaut hat, sollte man seine Anbieter diversifizieren oder eine Abstraktionsschicht schaffen, damit man nicht von einem Modell abhängig ist. Man sollte jedes Modell einstecken und nutzen können.
      Wenn man als Endnutzer Software Engineer ist, kann man andere Modelle wie Gemini oder ChatGPT verwenden. Das ist produktiver, als sich über Vertrauen zu beschweren, das es von Anfang an nicht gab. Anthropic ist nur ein Unternehmen, das einen Dienst anbietet, und kann die Bereitstellung jederzeit einstellen, unabhängig davon, ob es Exportverbote gibt oder nicht. Das gilt für jedes KI-Unternehmen in jedem Land. Wenn man wirklich ein vertrauenswürdiges LLM will, muss man ein Open-Weight-Modell selbst betreiben.
    • Andererseits: Was wäre passiert, wenn Anthropic nicht so kommuniziert hätte wie jetzt und Fable zum Hacken des Pentagon genutzt worden wäre? Dario wäre an einem Baum aufgehängt worden.
    • Die meisten Nutzer haben wahrscheinlich überhaupt nicht mitbekommen, dass das passiert ist. Wir vergessen oft, dass wir hier auf HN in einer Blase leben. Das Unternehmen wird es als Erfolg verkaufen und weitermachen.
  • In manchen Projekten kann es nützlicher sein, statt den gesamten Code generieren zu lassen, den Plan sowie eine Test-/Format-Validierungsschleife erzeugen zu lassen.
    Solche Ergebnisse verbrauchen deutlich weniger Tokens als ein ganzes Projekt, und die anschließende Schleife kann mit älteren Modellen laufen.

    • Ich habe das heute bei einem Projekt über zwei Repositories hinweg so gemacht. Das Design für einen wichtigen Use Case stand bereits, und Claude musste im Wesentlichen eine nicht stark abweichende Obermenge daraus erstellen.
      Nachdem der Plan erstellt war, waren von Fable 5s 5-Stunden-Kontext nur noch etwa 10 % übrig, und das war alles, was ich heute daran gearbeitet habe. Natürlich lässt sich das schwer verallgemeinern.
    • Genau. Ich lasse Opus den Plan schreiben und starte mehrere Sonnet-Subagenten für die Implementierung. Günstiger und schneller.
    • Genau das ist das Ziel von Devin Fusion, und die bisherigen Ergebnisse sehen ziemlich gut aus.
      https://cognition.com/blog/devin-fusion
    • Ich frage mich, ob jemand mit Batch-Verarbeitung experimentiert hat. Laut https://claude.com/pricing#api senkt Batch Processing den Preis um 50 %.
      Ich frage mich, ob man Ausführungstools wie OpenCode/Pi dazu bringen könnte, das für Aufgaben wie die Planung zu nutzen.
    • Das ist die Idee von opusplan.
      https://code.claude.com/docs/en/model-config#opusplan-model-...
  • Ich nutze Claude Pro nur gelegentlich, und die Meldung verwirrt mich. Vielleicht übersehe ich auch etwas Offensichtliches.
    Bedeutet „Bis zum 7. Juli kannst du bis zu 50 % des wöchentlichen Nutzungslimits deines Plans für Fable 5 verwenden“, dass die Nutzung von Fable in meinem Abo eine zeitlich begrenzte Aktion ist? Ich habe doch ein Abo – warum kann ich das Modell nicht einfach nutzen? Wird das künftig so laufen, dass Abos nur noch ältere Modelle enthalten und neue Modelle extra kosten?

    • Ja.
      Dort steht: „Nach dem 7. Juli 2026 ist Claude Fable 5 nicht mehr im wöchentlichen Nutzungslimit deines Plans enthalten. Claude Fable 5 bleibt über Usage Credits verfügbar, und du kannst für Nutzung über das in deinem Plan enthaltene Kontingent hinaus bezahlen.“ Was das langfristig bedeutet, weiß ich nicht. Wenn stärkere Modelle erscheinen oder Anthropic seine Rechenkapazität ausbaut, könnte Fable 5 wieder ins Abo aufgenommen werden – oder es könnte der Anfang vom Ende der Abos sein. Es ergibt wenig Sinn, für ein Abo zu zahlen, das an Opus 4.8 gebunden ist, während andere Anbieter ständig bessere Modelle veröffentlichen.
    • Es hat nicht einmal lange gedauert.
      Dynamic workflow “Multi-lens review of docs/membership-and-friends-model.md with adversarial verification” completed · 25m 59s
      Limit für Fable 5 erreicht.
      Es heißt, ich habe die in dieser Woche enthaltene Fable-5-Nutzung aufgebraucht und brauche Usage Credits, um Fable 5 weiter zu verwenden.
    • Beim ersten Launch hieß es, dass Fable 5 für einen begrenzten Zeitraum Teil des Abos ist und danach Usage Credits erforderlich sind.
      Damals hieß es auch, man wolle es irgendwann wieder zu einem Bestandteil der Abo-Pläne machen. Bei dieser Rückkehr wurde der Nutzungszeitraum bis zum 7. Juli verlängert, aber auf 50 % des Nutzungslimits begrenzt, und es wurde nicht erneut gesagt, dass man es irgendwann dauerhaft in die Abo-Pläne aufnehmen wolle. Es gibt noch Hoffnung, aber es entwickelt sich eindeutig nicht in eine gute Richtung.
    • Der Zugang zu neuen Modellen wird in Abos weiterhin möglich sein. Man dürfte Zugriff auf Sonnet 5 bekommen, und das ist ein neues Modell. Nur Modelle der Mythos-Klasse sind API-only.
      So ist es im Moment; bei solchen Unternehmen weiß man nie, wann sich etwas ändert.
    • Fable ist teurer im Betrieb, und es sieht so aus, als hätten sie die Go-to-Market-Strategie noch nicht festgelegt.
      Vermutlich wollen sie sehen, wie viel die Leute tatsächlich nutzen, um zu entscheiden, ob es sich lohnt, es in den Max-/Pro-Plänen weiter zu subventionieren, oder ob sie darüber eine zusätzliche Stufe einführen.
  • „Wenn Claude Fable 5 eine Anfrage ablehnt, gibt die Messages API keinen Fehler zurück, sondern eine erfolgreiche HTTP-200-Antwort mit stop_reason: "refusal".“
    Genau das stelle ich mir unter „Erfolg“ vor.

    • Eine verpasste Gelegenheit, den Statuscode HTTP 451 zu verwenden.
      https://en.wikipedia.org/wiki/HTTP_451
    • Ich frage mich, ob eine Ablehnung auch mitten im Streaming auftreten kann, nachdem Statuscode und Header bereits empfangen wurden. Ich habe mir die API nicht angesehen.
  • Im Claude-Code-Terminal steht: „Bis zum 7. Juli kannst du bis zu 50 % des wöchentlichen Nutzungslimits deines Plans für Fable 5 verwenden; wenn du das Limit erreichst, kannst du mit Usage Credits weitermachen; Fable 5 verbraucht Nutzung schneller als Opus 4.8.“
    Diese 50-%-Regel gab es früher doch nicht, oder?

    • Opus 4.8 ist im Vergleich zu GPT 5.5 so langsam, dass es für alltägliche Engineering-Aufgaben nichts bringt, selbst wenn es etwas besser ist.
      GPT 5.6 dürfte bald kommen, und der Codex-Plan für 249 Dollar im Monat war bisher sehr großzügig. Um den neu vermuteten Preis von Fable 5 zu rechtfertigen, müsste es deutlich besser sein, als ich es von früher in Erinnerung habe.
    • Die Nutzung wurde auch nicht zurückgesetzt. Viel Glück.
    • Nach dem 7. Juli bleibt nur noch ein nutzungsbasiertes Modell. Es ist dann nicht mehr in irgendeiner Abo-Stufe enthalten.
      Fast wäre es mir lieber, sie hätten es gar nicht wieder eingebaut. Wenn man es wie früher geballt nutzt, ist es faktisch 10- bis 20-mal teurer als der Preis des 20x-Abos.
    • Früher war das nicht so.
  • Ich hoffe, sie überdenken es, den Fable-Zugang wieder in die Abo-Pläne aufzunehmen. Zumindest im 20x-Plan sollte er meiner Meinung nach enthalten sein.
    Als der Zeitraum von ungefähr den ersten 14 Tagen angekündigt wurde, war das meines Wissens die ursprüngliche Absicht, und sie arbeiteten daran, es in den Abo-Plänen zu behalten. Jetzt sagen sie nicht einmal mehr, ob das überhaupt noch in Diskussion ist.

    • Der Markt wird sie letztlich dazu bringen, es wieder aufzunehmen. Im Moment gibt es vermutlich Kapazitätsbeschränkungen, oder sie prüfen, ob es eine andere Preisstufe braucht, damit es zu Abos passt.
      Das unerwünschte Szenario dürfte sein, dass jemand vier Tage pro Woche codet und jede Woche das Limit voll ausschöpft.
    • Es ist nur bis nächste Woche enthalten.
      „Fable 5 ist bis zum 7. Juli mit bis zu 50 % des wöchentlichen Nutzungslimits enthalten und danach über Usage Credits verfügbar.“
 
runai 2 시간 전

Wer soll sich das über Credits leisten können? Im Monat könnten da leicht mehrere Tausend Euro zusammenkommen. Dann würde ich lieber gleich die nächste GPT-Version 5.6 verwenden.