Chai-1: Entschlüsselung biomolekularer Wechselwirkungen
(chaidiscovery.com)- Chai Discovery hat Chai-1 vorgestellt, ein Modell zur Vorhersage molekularer Strukturen für die Wirkstoffentwicklung, das Proteine, kleine Moleküle, DNA, RNA und kovalente Modifikationen in einem einzigen Modell abdeckt
- In öffentlichen Benchmarks erreichte es 77 % Erfolgsquote bei PoseBusters und einen CASP15-Cα-LDDT von 0,849 und wurde direkt mit AlphaFold3 und ESM3-98B verglichen
- Anders als bestehende Werkzeuge, die meist auf Multiple Sequence Alignment (MSA) angewiesen sind, behält Chai-1 den Großteil seiner Leistung auch im Single-Sequence-Modus bei
- Bei Multimer-Vorhersagen erzielte es eine DockQ acceptable prediction rate von 69,8 % und lag damit über den 67,7 % des MSA-basierten AlphaFold-Multimer
- Die kostenlose Weboberfläche ist auch für kommerzielle Nutzung offen, und Modellgewichte sowie Inferenzcode werden unter der Apache-2.0-Lizenz veröffentlicht
Veröffentlichung von Chai-1 und Nutzung
- Chai-1 ist ein multimodales Modell zur Vorhersage molekularer Strukturen, das auf Aufgaben rund um die Wirkstoffentwicklung ausgerichtet ist
- Zu den Vorhersagezielen gehören Proteine, kleine Moleküle, DNA, RNA und kovalente Modifikationen
- Es kann über die kostenlose Weboberfläche genutzt werden und ist auch für kommerzielle Anwendungen wie die Wirkstoffentwicklung freigegeben
- Modellgewichte und Inferenzcode werden als Softwarebibliothek chai-lab unter der Apache-2.0-Lizenz veröffentlicht
Benchmark-Ergebnisse und geringere MSA-Abhängigkeit
- Die wichtigsten Benchmark-Ergebnisse werden als vergleichbar mit oder besser als die bestehender führender Modelle angegeben
- PoseBusters: Erfolgsquote 77 %, AlphaFold3 76 %
- CASP15-Set zur Strukturvorhersage von Proteinmonomeren: Cα LDDT 0,849, ESM3-98B 0,801
- Viele bestehende Werkzeuge zur Strukturvorhersage erfordern Multiple Sequence Alignment (MSA), Chai-1 kann jedoch auch im Single-Sequence-Modus ausgeführt werden und behält dabei den Großteil seiner Leistung bei
- Bei der Vorhersage des Multimer-Foldings erreichte es nach der DockQ acceptable prediction rate 69,8 %, während das MSA-basierte AlphaFold-Multimer bei 67,7 % lag
- Laut Chai Discovery ist Chai-1 das erste Modell, das Multimer-Strukturen allein aus einer einzelnen Sequenz ohne MSA-Suche in einer Qualität auf dem Niveau von AlphaFold-Multimer vorhersagen kann
- Werden neue Daten wie im Labor gewonnene Randbedingungen als Prompt eingegeben, kann sich die Leistung um zweistellige Prozentpunkte verbessern
- Ein Beispiel ist epitope conditioning: Schon mit nur wenigen Contact- oder Pocket-Residues verdoppelt sich die Genauigkeit der Strukturvorhersage von Antikörper-Antigen-Komplexen
- Solche Eingaben können aus Laborexperimenten stammen und machen KI-gestütztes Antikörper-Engineering praktikabler
- Eine umfassende Analyse des Modells findet sich im technischen Bericht
Team und weitere Ausrichtung
- Das Team von Chai Discovery besteht aus Personen mit Hintergrund bei Forschungs- und angewandten KI-Unternehmen wie OpenAI, Meta FAIR, Stripe und Google X
- Viele im Team waren bei führenden Wirkstoffentwicklungsunternehmen Head of AI und haben insgesamt zu mehr als 12 Wirkstoffprogrammen beigetragen
- Chai-1 ist das Ergebnis mehrmonatiger intensiver Arbeit, und das übergeordnete Ziel von Chai Discovery ist es, Biologie von einer Wissenschaft zu Ingenieurwesen weiterzuentwickeln
- Künftig sollen weitere KI-basierte Modelle entstehen, die Wechselwirkungen zwischen biochemischen Molekülen vorhersagen und neu programmieren können
Noch keine Kommentare.