Chai-1: Entschlüsselung biomolekularer Wechselwirkungen

(chaidiscovery.com)

1 Punkte von GN⁺ 2024-09-12 | Noch keine Kommentare. | Auf WhatsApp teilen

Chai Discovery hat Chai-1 vorgestellt, ein Modell zur Vorhersage molekularer Strukturen für die Wirkstoffentwicklung, das Proteine, kleine Moleküle, DNA, RNA und kovalente Modifikationen in einem einzigen Modell abdeckt
In öffentlichen Benchmarks erreichte es 77 % Erfolgsquote bei PoseBusters und einen CASP15-Cα-LDDT von 0,849 und wurde direkt mit AlphaFold3 und ESM3-98B verglichen
Anders als bestehende Werkzeuge, die meist auf Multiple Sequence Alignment (MSA) angewiesen sind, behält Chai-1 den Großteil seiner Leistung auch im Single-Sequence-Modus bei
Bei Multimer-Vorhersagen erzielte es eine DockQ acceptable prediction rate von 69,8 % und lag damit über den 67,7 % des MSA-basierten AlphaFold-Multimer
Die kostenlose Weboberfläche ist auch für kommerzielle Nutzung offen, und Modellgewichte sowie Inferenzcode werden unter der Apache-2.0-Lizenz veröffentlicht

Veröffentlichung von Chai-1 und Nutzung

Chai-1 ist ein multimodales Modell zur Vorhersage molekularer Strukturen, das auf Aufgaben rund um die Wirkstoffentwicklung ausgerichtet ist
Zu den Vorhersagezielen gehören Proteine, kleine Moleküle, DNA, RNA und kovalente Modifikationen
Es kann über die kostenlose Weboberfläche genutzt werden und ist auch für kommerzielle Anwendungen wie die Wirkstoffentwicklung freigegeben
Modellgewichte und Inferenzcode werden als Softwarebibliothek chai-lab unter der Apache-2.0-Lizenz veröffentlicht

Die wichtigsten Benchmark-Ergebnisse werden als vergleichbar mit oder besser als die bestehender führender Modelle angegeben
- PoseBusters: Erfolgsquote 77 %, AlphaFold3 76 %
- CASP15-Set zur Strukturvorhersage von Proteinmonomeren: Cα LDDT 0,849, ESM3-98B 0,801
Viele bestehende Werkzeuge zur Strukturvorhersage erfordern Multiple Sequence Alignment (MSA), Chai-1 kann jedoch auch im Single-Sequence-Modus ausgeführt werden und behält dabei den Großteil seiner Leistung bei
Bei der Vorhersage des Multimer-Foldings erreichte es nach der DockQ acceptable prediction rate 69,8 %, während das MSA-basierte AlphaFold-Multimer bei 67,7 % lag
Laut Chai Discovery ist Chai-1 das erste Modell, das Multimer-Strukturen allein aus einer einzelnen Sequenz ohne MSA-Suche in einer Qualität auf dem Niveau von AlphaFold-Multimer vorhersagen kann
Werden neue Daten wie im Labor gewonnene Randbedingungen als Prompt eingegeben, kann sich die Leistung um zweistellige Prozentpunkte verbessern
- Ein Beispiel ist epitope conditioning: Schon mit nur wenigen Contact- oder Pocket-Residues verdoppelt sich die Genauigkeit der Strukturvorhersage von Antikörper-Antigen-Komplexen
- Solche Eingaben können aus Laborexperimenten stammen und machen KI-gestütztes Antikörper-Engineering praktikabler
Eine umfassende Analyse des Modells findet sich im technischen Bericht

Das Team von Chai Discovery besteht aus Personen mit Hintergrund bei Forschungs- und angewandten KI-Unternehmen wie OpenAI, Meta FAIR, Stripe und Google X
Viele im Team waren bei führenden Wirkstoffentwicklungsunternehmen Head of AI und haben insgesamt zu mehr als 12 Wirkstoffprogrammen beigetragen
Chai-1 ist das Ergebnis mehrmonatiger intensiver Arbeit, und das übergeordnete Ziel von Chai Discovery ist es, Biologie von einer Wissenschaft zu Ingenieurwesen weiterzuentwickeln
Künftig sollen weitere KI-basierte Modelle entstehen, die Wechselwirkungen zwischen biochemischen Molekülen vorhersagen und neu programmieren können