esto es realmente una locura desde que salió la IA, cada modelo para biología tenía la misma limitación: entrenarlo en una enfermedad, solo funciona en esa enfermedad. reentrenar para cualquier nuevo fármaco, paciente o tejido. la promesa del modelo fundamental para la biología básicamente no existía. la predicción de cero disparos era imposible. hasta ahora. el modelo del Arc Institute (Stack) aprende de grupos de células en lugar de una a la vez. de la misma manera que los LLMs ven palabras en una oración y no de forma aislada, las células se convierten en contexto entre sí. puedes mostrarle células que fueron tratadas con un fármaco, y predice cómo responderían células completamente diferentes a ese mismo fármaco. incluso si nadie jamás realizó ese experimento. incluso si ese tejido nunca fue perturbado. incluso si esa combinación nunca existió en el entrenamiento. las células mismas se convierten en indicaciones, solo a partir de la inferencia. ahora puedes consultar la biología. "¿qué harían las células del hígado si les diera este fármaco contra el cáncer?" y responde con predicciones reales de expresión génica. aún no perfectamente, pero lo suficientemente bien como para superar los métodos existentes en 28 de 31 benchmarks (prácticamente inaudito en este campo donde superar el 60% se considera bueno). lo utilizaron para construir un atlas de perturbación virtual: 28 tejidos humanos, 40 clases de células, 201 fármacos. no se requiere laboratorio. puramente in silico. cuando validaron contra experimentos reales de laboratorio húmedo, las predicciones coincidieron. descubrir fármacos actualmente cuesta más de 5 millones de dólares y 2 años por experimento que podría no funcionar. ahora primero se hace un cribado computacional. "¿qué tejidos tendrán efectos fuera del objetivo?" "¿cómo responderán las células de este paciente de manera diferente?" preguntas que solían requerir millones en subvenciones ahora solo necesitan una GPU. poco a poco estamos resolviendo la biología.