1 Punkte von GN⁺ 4 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • Claude Science ist eine öffentliche Beta-App, mit der Life-Sciences-Forschende Analyseausführung, Datenbanksuche, Datenvorverarbeitung und Ergebnisdokumentation in einer Workbench nahtlos verbinden können
  • Abbildungen, Tabellen und Notebooks speichern den generierten Code, die Ausführungsumgebung und den Gesprächsverlauf mit, sodass sie später reproduziert, geändert und validiert werden können
  • Läuft auf lokalen Notebooks, Linux-Maschinen, HPC-Login-Nodes und Cloud-VMs und unterstützt das Einreichen und Verwalten von Jobs über SSH, Slurm und Modal
  • Richtet sich an Genomik, Single-Cell-Analysen, Proteomik, Strukturbiologie und Chemoinformatik und kann mit über 60 wissenschaftlichen Datenbanken sowie NVIDIA-BioNeMo-Tools verbunden werden
  • Verfügbar für macOS und Linux in den Plänen Pro, Max, Team und Enterprise; da es sich um eine Beta-App handelt, sind vor der organisationsweiten Bereitstellung eine Prüfung der Dokumentation und Admin-Einstellungen erforderlich

Claude-Workbench für wissenschaftliche Forschung

  • Claude Science ist kein neues Modell, sondern eine öffentliche Beta-App und nutzt die bestehenden Claude-Modelle, die im Plan des Nutzers enthalten sind
  • Neu hinzugekommen sind wissenschaftliche Tools, Datenbankanbindungen und Compute-Integrationen rund um Claude, mit denen sich vollständige Analysen auf der Infrastruktur des Nutzers ausführen lassen
  • Wird für macOS und Linux angeboten; die Seite führt zu den Downloads für die jeweiligen Betriebssysteme
  • Ziel ist es, wissenschaftliche Datenbanken, Forschungstools, ELNs, Protein- und Strukturmodelle sowie HPC in einer Forschungs-Workbench zu bündeln

Reproduzierbare Ergebnisse und Review-Abläufe

  • Claude Science ermöglicht die native Darstellung von Proteinen, Strukturen, Molekülen und mehr und macht Ergebnisse bis zum generierten Code nachvollziehbar
  • Abbildungen, Tabellen und Notebooks speichern die folgenden Informationen mit
    • den exakten Code, der das Ergebnis erzeugt hat
    • die Ausführungsumgebung
    • das Gespräch, das zum Ergebnis geführt hat
  • Gespeicherte Ergebnisse lassen sich auch Monate später reproduzieren, bearbeiten und verteidigen
  • Proteine, Alignments, Genom-Tracks, chemische Strukturen und PDFs können ohne zusätzliche Installation in nativen Formaten angezeigt werden
  • Der Background Reviewer markiert fehlerhafte Zitate, nicht nachvollziehbare Zahlen und Abbildungen, die nicht zum zugrunde liegenden Code passen
  • Nutzer können Abbildungen kommentieren, um Änderungen oder Fragen anzufordern; der Agent liest den Code, der die jeweilige Abbildung erzeugt hat, und nimmt die Änderungen direkt vor
  • Das Verfassen von Analyseergebnissen kann mit gerendertem Markdown und LaTeX-Vorschau erfolgen

Compute und Ausführungsumgebungen

  • Verwaltet die für jede Analyse erforderliche Ausführungsumgebung; Ausführungsorte können Notebooks, Linux-Maschinen oder HPC-Login-Nodes sein
  • Schreibt Batch-Skripte und reicht sie per SSH auf der Maschine des Nutzers oder einem HPC-Cluster ein und verwaltet sie dort, oder führt Jobs über ein Modal-Konto aus
  • Der Installationsort kann an den Speicherort der Daten angepasst werden
    • Notebook
    • Linux-Maschine im Labor
    • HPC-Login-Node
    • Cloud-VM
  • Kann über den Browser verbunden und genutzt werden
  • Jobs laufen in lokalen Kernels, auf Slurm-Clustern via SSH oder über ein Modal-Konto
  • Variablen, DataFrames und geladene Modelle bleiben über die gesamte Analyse hinweg im Speicher, sodass iterative Arbeit schneller durchgeführt werden kann

Aufgaben nach Life-Sciences-Domänen

  • Claude Science unterstützt Genomik, Single-Cell-Analysen, Proteomik, Strukturbiologie, Chemoinformatik und mehr, kann Literatur lesen und über 60 wissenschaftliche Datenbanken abfragen
  • Wichtige Anwendungsbeispiele sind
    • Single-cell RNA-seq-Analyse: Millionen Zellen aus einem gesamten Gewebe clustern und annotieren, Oberflächenmarker-Gene finden und jede Abbildung bis zum generierten Code zurückverfolgen
    • Phylogenetische und evolutionäre Analysen: Ortholog-Alignments, Maximum-Likelihood-Bauminferenz und phylogenetisches Mapping funktioneller Residuen in einer einzigen reproduzierbaren Sitzung durchführen
    • Proteinstruktur- und Sprachmodell-Arbeit: vorhergesagte Strukturen importieren, Domänen und klinische Varianten darüberlegen und sie interaktiv in 3D erkunden
    • Chemoinformatik und Moleküldesign: Bioaktivitätsdaten suchen, Eigenschaften und Ähnlichkeiten berechnen und Strukturen im 2D-Sketcher zeichnen oder verfeinern
  • Pipelines können als wiederverwendbare Skills gespeichert werden, und bevorzugte Labortools lassen sich über Connector anbinden, sodass sie in späteren Sitzungen automatisch verfügbar sind
  • Stellt ein vollständig belegtes Indication Dossier bereit und erweitert die Skill-Sets, die die Grundlage der jeweiligen Programme bilden

Anbindung an den bestehenden Labor-Stack

  • Connector bringen interne APIs, ELNs und angepasste Pipelines in Workflows ein, damit Claude Science mit den bestehenden Tools des Labors zusammenarbeitet
  • Bestehende Python-, R- und Shell-Workflows müssen nicht von Grund auf neu erstellt werden, sondern können gelesen, ausgeführt und erweitert werden
  • Wissenschaftliche Tools, Plattformen und domänenspezifische offene Modelle können als Skill oder Connector eingesteckt werden
  • Claude Science ersetzt nicht ein bestimmtes Tool, sondern dient als integrierte Workbench, in der spezialisierte Tools zusammenarbeiten

Modell-, Tool- und Datenanbindungen

  • Über das Diskutieren von Biologie mit einem allgemeinen AI-Assistenten hinaus unterstützt Claude Science das Ausführen von Pipelines, das Durchsuchen wissenschaftlicher Datenbanken, die Orchestrierung von Cluster-Jobs und das Nachverfolgen früherer Sitzungsverläufe
  • Die App enthält Analyse-Specialists für Genomik, Single-Cell-Analysen, Proteomik, Strukturbiologie, Chemoinformatik und mehr
  • Sie kann nativ mit domänenspezifischen offenen Modellen und über 60 wissenschaftlichen Datenbanken verbunden werden
  • Über den Skill des NVIDIA BioNeMo Agent Toolkit wird eine Verbindung zu den Life-Sciences-Modellen und Bibliotheken von BioNeMo hergestellt
    • Beispiele sind Evo 2, Boltz-2 und OpenFold3

Datenstandort und Validierung

  • Die Claude-Science-App läuft auf der Infrastruktur des Nutzers; Rohdatensätze und Compute bleiben lokal
  • Inhalte, die in Prompts und Modellantworten enthalten sind, werden gemäß den standardmäßigen Aufbewahrungsrichtlinien von Anthropic verarbeitet
  • Teamspezifische Anforderungen können über eine Vertriebsanfrage besprochen werden
  • Alle Outputs enthalten die folgenden Informationen
    • den exakten Code, der für die Erzeugung verwendet wurde
    • die Ausführungsumgebung
    • eine Klartextbeschreibung der durchgeführten Arbeit
    • das Gespräch, das zum Ergebnis geführt hat
  • Der Background Reviewer markiert Aussagen, die nicht auf Evidenz zurückgeführt werden können, bevor die Ergebnisse angezeigt werden

Pläne, Laborrabatte und Enterprise-Bereitstellung

  • Claude Science ist eine Beta-App, die unter macOS und Linux in den Plänen Pro, Max, Team und Enterprise verfügbar ist
  • Bei Team und Enterprise müssen Admins sie zunächst aktivieren
  • Der Rabatt Claude Team plan for research labs für Labore umfasst den Zugriff auf die Claude-Science-App
    • Zielgruppe sind aktive wissenschaftliche Forschungslabore an akademischen Einrichtungen und gemeinnützigen Forschungsinstitutionen
    • Biomedizinische und grundlagenwissenschaftliche Labore sowie Hard Sciences wie Chemie, Mathematik, Informatik und Physik gehören zu den Prioritäten
    • Die Berechtigung wird über die Laborleitung verifiziert
  • Gewinnorientierte Unternehmen, Auftragsforschungsinstitute und industrielle R&D-Teams sollten die Team and Enterprise plans beachten
  • Der Enterprise-Plan bietet SSO, SCIM-Provisioning, benutzerdefinierte Rollen und Nutzungsanalysen
  • Da es sich um eine Beta handelt, sollten Admins vor der Bereitstellung die Dokumentation prüfen
  • Die Dokumentation behandelt Installation, Tool- und Compute-Anbindungen sowie Admin-Einstellungen für Team und Enterprise

1 Kommentare

 
GN⁺ 4 시간 전
Hacker-News-Kommentare
  • Ich habe Biomni HPC gebaut, eines der Konnektivitäts-Tools in diesem Release, und mich schon ziemlich lange mit diesem Problem beschäftigt. Ich habe auch bei Anthropic gearbeitet, war aber nicht für dieses Produkt zuständig.
    Wie andere Kommentare schon sagen, ist das für Data Science gedacht, kann aber deutlich mehr als nur Diagramme erstellen und Papers schreiben. Es ist in verschiedene Datenbanken und Rechenwerkzeuge integriert, einschließlich der institutionellen Cluster von Forschenden.
    Das allein ist schon wertvoll. Ich habe in einem Bio-Startup mit genau diesem Problem gekämpft und dann selbst ein Startup gegründet; solche Tool- und Datenbankintegrationen sind schwierig und zeitaufwendig. Selbst wenn das Ergebnis dieses Produkts nur darin bestünde, eine großartige API für LLMs bereitzustellen, hätte das schon einen großen positiven Effekt. Viele Datenbanken in der Computational Genomics sind bis heute nur per FTP zugänglich.
    LLMs eignen sich besonders gut dafür, solche Tools und Datenbanken zu erkunden. Es ist hochspezialisiert, aber es gibt viele einfache Aufgaben, die sich gut mit in Kontext gelernten Fähigkeiten erledigen lassen. Ich habe erste Ansätze gesehen, wie meine früheren Kunden aus der Bioinformatik dieses Problem mit LLMs lösen, und bin deshalb 2024 zu Anthropic gegangen.
    Außerdem ist dieses Muster nicht grundsätzlich nur an Data Science gebunden. In manchen Wissenschaftsbereichen kann man es auch mit Wet Labs oder CROs integrieren, und daran arbeite ich gerade.
    Diese Art von Wissenschaft wird nicht alles lösen, ist aber in bestimmten Bereichen nützlich. Zum Beispiel kommen viele Forschungen zu seltenen Krankheiten nicht wegen fehlender grundlegender Durchbrüche nur langsam voran, sondern wegen eines Engpasses bei der Aufmerksamkeit von Forschenden.
    https://x.com/phylo_bio/article/2029233694775624096
    Zum Vergleich: OpenAIs Wissenschaftsprodukt Prism war im Wesentlichen eher ein durch die Übernahme von Crixet erhaltenes LaTeX-Editor.

    • Ich frage mich, worin genau der Unterschied dazu besteht, mehrere Agenten-Techniken einzubinden oder zu konfigurieren. Oder ob der Kern des Produkts darin liegt, viele nützliche Standardvorgaben zu kombinieren.
    • KI direkt mit Datenquellen zu verbinden, kann sehr viel komplexer werden, als Code zu erhalten, den man lokal direkt ausführt.
      Man muss institutionelle Richtlinien, geltende Vorschriften und Anforderungen an Datenzugriff und -speicherung erfüllen, etwa bei NIH-Datenspeichern, und eventuell braucht es auch rechtliche Verträge zwischen der Institution und dem KI-Anbieter. Zumindest bisher ist das schwer anzufassen.
    • Ich frage mich, wie man bei solcher Arbeit die Halluzinationen von LLMs herausfiltert und validiert.
    • Irgendwann würde ich bei Claude Science gern deutlich bessere Visualisierungen sehen. Nicht nur einfache Diagramme oder Protein- und chemische Strukturen, sondern eher threejs- und shaderbasierte Szenen mit didaktischem Charakter. Es wäre großartig, wenn viele Papers aus Literaturreviews solche Funktionen hätten.
    • Ich habe Biomni früher schon einmal in einen intelligenten Workspace integriert: https://blog.codesolvent.com/2025/07/ai-assistant-with-biome...
      Wenn Interesse besteht, können wir gern darüber sprechen.
  • Der interessanteste Punkt hier ist, dass Claude Science einen lokalen Server und eine webbasierte UI startet, die sich im Browser mit diesem Server verbindet.
    Das unterscheidet sich ziemlich deutlich von Strukturen wie bei Claude Code oder Cowork, wo die UI stärker an die Host-Maschine gekoppelt ist und dadurch Funktionen wie Computernutzung möglich werden.
    Die Strategie ist nachvollziehbar. Die meisten eingeschränkten Umgebungen mit interessanten Daten sind sehr stark abgeschottet, sodass man ein MacBook nicht einfach mit den Quelldaten verbinden kann.
    Genauso ist der Zugriff auf große genomische Biobank-Datensätze wie UK Biobank oder NIH All of Us nur über Remote-Datenanalyseplattformen namens Trusted Research Environment (TRE) erlaubt, oft sogar mit eingeschränktem Internetzugang. Desktop-Apps auszuführen ist nicht einfach, aber solche Umgebungen unterstützen üblicherweise JupyterLab oder VS Code und das Tunneln der UI zum Endnutzer. Ich habe früher das Team geleitet, das das All of Us TRE gebaut hat.
    Claude Science lässt sich daher leichter nicht als allumfassende Claude-Mega-App vorstellen, sondern als etwas, das innerhalb solcher eingeschränkten Datenumgebungen einen Server startet und nur die UI in den Browser des Nutzers proxyt. Für die Einführung in regulierten Forschungs- und Entwicklungsumgebungen dürfte das wichtig sein.
    Allerdings könnte Claude Science für durchschnittlich versierte Computational Scientists, die täglich RStudio, JupyterLab und VS Code verwenden, eine ziemlich ungewohnte Produktform sein. Ich frage mich, ob es bestehende Data-Science-Workbench-Tools ersetzen, neben ihnen genutzt oder sie am Ende eher umhüllen wird.

    • Aus meiner Arbeitsperspektive, in der ich viel mit Aufgaben mit Computational-Science-Charakter zu tun habe, war die Kombination aus Claude Code und Standard-Python-Datenbibliotheken sehr leistungsfähig und hat meinen Workflow stark beschleunigt.
      Ich arbeite als Datenanalyst in einem Geologieunternehmen mit interessanten Sensordaten, und wenn ich schnelle Analysen oder Visualisierungen brauche, schreibt Claude in wenigen Minuten den Code, für dessen Ausarbeitung ich sonst etwa eine Stunde brauchen würde. Dass ich die relevanten Bibliotheken gut genug kenne, um den Code lesen und prüfen zu können, ist ein wichtiger Unterschied dazu, Black-Box-KI blind zu verwenden.
      Allerdings passen Claude Code und Jupyter in VS Code derzeit nicht gut zusammen. Jedes Mal, wenn Claude etwas ändert, wird das gesamte Notebook von Anfang an neu ausgeführt. Deshalb gehe ich inzwischen einen Schritt vom Notebook weg, lasse Claude eigenständige Skripte schreiben und investiere später Zeit, sie wieder zu einem hübschen Notebook zusammenzuführen.
    • Ich stimme zu, dass es eine interessante Architektur ist, bin mir aber nicht sicher, wie sie auf einem stark kontrollierten Server funktionieren soll.
      Wenn man sich nicht von einem Mac aus verbinden kann, ist es sehr wahrscheinlich, dass auch einem Agenten auf dem Server nicht erlaubt wird, Anfragen zu senden.
  • Ich habe ausprobiert, wie es in meinem Bereich, dem computergestützten Design von RNAi-basierten biologischen Pflanzenschutzmitteln, abschneidet.
    Ich ließ es in einem Durchgang ein Design erstellen, das auf das DvSnf7-Transkript des Westlichen Maiswurzelbohrers abzielt, und der Ansatz war ziemlich naiv. Es wirkte wie die Vorgehensweise eines Doktoranden im ersten Jahr, aber die Aufgabe wurde tatsächlich erledigt.
    Es wies auch auf Grenzen hin, etwa dass Regeln für das Design bei Säugetieren verwendet wurden oder dass die Off-Target-Prüfung eingeschränkt sei. Nicht furchtbar schlecht, aber auch nicht großartig. Als ich auf die Mängel hinwies, hatte ich den Eindruck, dass die AI sich besser auskannte und gezielter vorgehen konnte. Danach markierte das Opus 4.8-Sicherheitssystem die Sitzung.

    • Wenn man glaubt, dass sich das für tatsächliche positive Wirkung einsetzen lässt, sollte man sich selbst oder die eigene Institution bzw. Firma für die Bio-Programme von OpenAI und Anthropic bewerben.
    • Inzwischen entstehen die Witze schon von selbst.
      Ich würde empfehlen, die 10 zentralen Arbeiten zu diesem Thema und 10 allgemeine Lehrbücher des Fachgebiets zusammenzutragen, sie per OCR oder Textextraktion in reinen Text umzuwandeln und dann dieselbe Aufgabe mit einem besseren Agent-Harness wie omp.sh zu versuchen.
      /goal set create biopesticide targeting the DvSnf7 transcript of western corn rootworm
      Nur keinen Fehler machen.
  • Bei „Science“ hätte ich nicht gedacht, dass damit Data Science gemeint ist, aber eine UI voller pandas-Code und Diagramme wirkt genau so.
    Selbst wenn es auf wissenschaftliche Fachgebiete fokussiert ist, dürfte das eher der weniger wertvolle Teil der Ankündigung sein, wenn man bedenkt, dass es wie Jupyter Notebook 2.0 aussieht.
    Anwendungsfälle, bei denen Datenvisualisierung als Bild verstanden wird, wurden bisher vernachlässigt, und aktuelle LLMs werden auch bei ordentlicher explorativer Datenanalyse immer besser. Trotzdem sollte ich vielleicht meinen Lebenslauf aktualisieren.

    • In vielen Natur- und Sozialwissenschaften nutzt man schlampigen matplotlib-Code, um Ergebnisse und Visualisierungen zu erzeugen, aber man nennt das nicht unbedingt Data Science.
      Nach allem, was ich gesehen habe, würde ich jederzeit den von Claude erzeugten Code dem Code vorziehen, den Mathematiker, Physiker, Biologen oder Linguisten schreiben. Ich habe Claude zwar auch schon bei riesigen Fehlern in der Datenanalyse gesehen, aber wahrscheinlich ist es trotzdem verlässlicher als die meisten Wissenschaftler, die bereits programmieren.
    • Gemessen am Video scheint eher Bioinformatik gemeint zu sein. Je nach Definition kann das unter den Oberbegriff Data Science fallen, aber üblicherweise nennt man es nicht so.
      Welche Wissenschaft es ist, bestimmt der behandelte Inhalt, nicht die Toolchain.
    • Dinge wie Protein- und chemische Strukturvisualisierung werden ebenfalls erwähnt.
    • All diese neuen Produkte beginnen auszusehen wie Propagandamaterial des sowjetischen Raumfahrtprogramms. Ich weiß nicht, ob da überhaupt noch etwas wirklich Neues dabei ist.
  • Vor den LLMs diskutierten die Technikgruppen, denen ich folgte, lebhaft darüber, welches Thema wann wofür eingesetzt werden sollte, und ich glaube, aus solchen Diskussionen sind viele Frameworks und Tools entstanden, nach dem Motto: „Klingt nach einer brauchbaren Idee, also schadet es nicht, sie umzusetzen.“
    Leider dreht sich heute alles um LLMs, und es wird nur noch darüber gesprochen, wie man LLMs auf die eine oder andere Weise zum Laufen bringt. Die eigentlichen Themen, zu deren Diskussion diese Gruppen ursprünglich geschaffen wurden, kommen kaum noch vor.
    Ich fürchte, dass die Wissenschaft bald dasselbe erlebt. Statt über die Themen zu sprechen, über die man eigentlich sprechen müsste, könnte LLM-Gerede den Raum einnehmen.

    • In LLMs sind bereits Hunderte Milliarden Dollar geflossen.
      Wenn man die bestehenden Assets nicht irgendwie nutzen kann, wird die Kapitalrendite kaum gut aussehen.
      Das ist kein Pro-Argument; es heißt nur, dass das Management am Ende den Aktionären Rede und Antwort stehen muss, die auf solche Renditekennzahlen schauen.
    • LLMs sind im Großen und Ganzen nicht besonders nützlich, und die Leute merken das.
  • Durch diese Ankündigung scheint Claude Desktop für Linux freigeschaltet worden zu sein: https://code.claude.com/docs/en/desktop-linux

    • Leider werden Arch-basierte Distributionen nicht unterstützt. Ich frage mich, warum es nicht als Flatpak paketiert wurde.
  • Ich habe ähnliche Tools ausprobiert; sie sind zwar beeindruckend, aber LLMs erzeugen viel zu oft falsche, aber plausibel wirkende Daten und geben sie als echt aus.
    Dazu gehört auch eine ziemlich tiefgehende Täuschung, bei der sogar Schein-Datenbank-Connectoren eingerichtet werden, damit es so aussieht, als kämen die Daten aus den richtigen Quellen, obwohl in Wirklichkeit synthetische Daten verwendet werden.
    Ich frage mich, wie dieses Produkt das verhindert.

  • War das nicht die Firma, die im Bereich Biowissenschaften LLMs wie ein verdorbenes Modell gemacht hat?

  • Ist das so etwas wie Claude Cowork für Wissenschaft, also ein Produkt für Nutzer mit weniger Technikaffinität?
    Bei Wissenschaftlern mit Programmierhintergrund würde ich erwarten, dass sie lieber einfach Claude Code allgemein nutzen und es in ihren selbst gewählten Stack integrieren, aber vielleicht gewinnen am Ende der Komfort und die Benutzerfreundlichkeit von Claude Science.

    • lebovic hat zwar geantwortet, aber das ist nicht einfach nur Claude Cowork, sondern hat speziell Verbindungen und Funktionen rund um HPC-Cluster.
      Ich kann mir gut vorstellen, dass ein Team aus einem staatlichen Forschungslabor das in sein System integriert und die Nutzung von Claude Code komplett aufgibt.
  • Man sollte es wohl Claude-bio-big-bucks nennen.
    Was ist mit Geowissenschaften, Physik und Ingenieurwesen? Die Connectoren und die Technik drehen sich komplett um Biologie und Pharma.

    • Wenn man nicht möchte, dass Unternehmen mit Profitfokus nur auf die Life Sciences zielen, dann muss man auch alle anderen Fachgebiete in ähnlicher Größenordnung finanzieren wie die Life Sciences.
      Vor Trump lag das jährliche Budget der NSF bei etwa 6 bis 8 Milliarden Dollar, das der NIH bei etwa 50 Milliarden Dollar pro Jahr. Genau das ist der Unterschied.