c'est en fait fou depuis la sortie de l'IA, chaque modèle en biologie avait la même limitation : entraînez-le sur une maladie, il ne fonctionne que sur cette maladie. réentraînez-le pour tout nouveau médicament, patient ou tissu. la promesse du modèle fondamental pour la biologie n'existait pratiquement pas. la prédiction zéro-shot était impossible. jusqu'à maintenant. Le modèle de l'Arc Institute (Stack) apprend à partir de groupes de cellules au lieu d'une à la fois. de la même manière que les LLM voient les mots dans une phrase et non isolément, les cellules deviennent le contexte les unes pour les autres. vous pouvez lui montrer des cellules qui ont été traitées avec un médicament, et il prédit comment des cellules complètement différentes réagiraient à ce même médicament. même si personne n'a jamais réalisé cette expérience. même si ce tissu n'a jamais été perturbé. même si cette combinaison n'a jamais existé dans l'entraînement. les cellules elles-mêmes deviennent des prompts, juste par inférence. vous pouvez interroger la biologie maintenant. "que feraient les cellules hépatiques si je leur donnais ce médicament contre le cancer ?" et il répond avec de réelles prédictions d'expression génique. pas encore parfaitement, mais suffisamment bien pour qu'il ait battu les méthodes existantes dans 28 des 31 benchmarks (pratiquement jamais vu dans ce domaine où battre 60 % est considéré comme bon). ils l'ont utilisé pour construire un atlas de perturbation virtuel : 28 tissus humains, 40 classes de cellules, 201 médicaments. aucun laboratoire requis. purement in silico. lorsqu'ils ont validé par rapport à de réelles expériences en laboratoire, les prédictions correspondaient. la découverte de médicaments coûte actuellement plus de 5 millions de dollars et 2 ans par expérience qui pourrait ne pas fonctionner. maintenant, vous filtrez d'abord de manière computationnelle. "quels tissus auront des effets hors cible ?" "comment les cellules de ce patient réagiront-elles différemment ?" des questions qui nécessitaient auparavant des millions en subventions n'ont maintenant besoin que d'un GPU. lentement mais sûrement, nous résolvons la biologie.