Modelado y diseño de genomas a través de todos los dominios de la vida con Evo2

Modelado y diseño de genomas a través de todos los dominios de la vida con Evo2

¿Alguna vez te has imaginado tener a tu disposición un “traductor universal” que no solo entienda el ADN de cualquier ser vivo, sino que también pueda escribirlo desde cero? Durante años, la biología molecular ha lidiado con la inmensa complejidad oculta en nuestro genoma. Aunque secuenciar y editar ADN se ha vuelto rutinario, predecir el efecto de una simple mutación o diseñar sistemas biológicos complejos sigue siendo un desafío titánico. Pero las reglas del juego acaban de cambiar. Un equipo de investigadores ha presentado Evo 2, un modelo fundacional biológico de inteligencia artificial entrenado con la alucinante cifra de 9 billones de pares de bases de ADN, abarcando todos los dominios de la vida: bacterias, arqueas, eucariotas y fagos.

Lo que hace a Evo 2 tan especial no es solo su gigantesco tamaño, sino su asombrosa capacidad de “memoria” o ventana de contexto. Gracias a una novedosa arquitectura híbrida llamada StripedHyena 2, este modelo puede “leer” secuencias de hasta 1 millón de nucleótidos a la vez con una resolución de una sola letra. Para ponerlo en perspectiva, esto le permite comprender cómo elementos genéticos muy distantes interactúan entre sí a lo largo del genoma. Esta profunda comprensión evolutiva le otorga a Evo 2 la capacidad de predecir el impacto funcional de variaciones genéticas sin necesidad de ningún entrenamiento específico adicional (un enfoque conocido como predicción zero-shot). Por ejemplo, el modelo demostró ser excepcionalmente preciso al identificar mutaciones patogénicas en humanos, superando a otros métodos clásicos en la evaluación de variantes no codificantes y en la predicción de alteraciones en genes críticos y clínicamente relevantes como el BRCA1 y el BRCA2.

En el mundo de la inteligencia artificial, a menudo se critica que estos modelos tan grandes son “cajas negras” inescrutables de las que no podemos aprender nada. Sin embargo, los desarrolladores de Evo 2 aplicaron técnicas de interpretabilidad mecanicista, utilizando herramientas llamadas autoencoders dispersos (SAEs), para “mirar literalmente dentro” del cerebro de la IA. Lo que encontraron fue fascinante: descubrieron que el modelo había aprendido por sí solo conceptos biológicos fundamentales sin que nadie le hubiera proporcionado etiquetas. Evo 2 formó representaciones internas claras para los límites entre exones e intrones, los sitios de unión de factores de transcripción, los elementos estructurales de las proteínas (como las hélices alfa), e incluso identificó regiones de profagos y espaciadores del sistema CRISPR. Es como si la IA hubiera redescubierto las reglas de la biología molecular simplemente leyendo el inmenso código genético de la naturaleza. A continuación, podemos observar cómo se conceptualiza este monumental sistema:

Pero Evo 2 no se conforma solo con leer y predecir; también es un creador fenomenal. El modelo posee habilidades generativas a escala genómica, siendo capaz de diseñar secuencias continuas que se asemejan de manera realista a genomas de mitocondrias humanas o a genomas procariotas completos y funcionales, como el del Mycoplasma genitalium. Aún más impactante es su capacidad para ser guiado durante su fase de generación para diseñar arquitecturas de cromatina en mamíferos. Los investigadores lograron guiar a Evo 2 para generar secuencias de ADN artificiales de múltiples kilobases que, al ser introducidas en células de ratón, obligaban al genoma a abrirse y cerrarse formando patrones epigenéticos súper específicos. ¡Incluso lograron escribir mensajes en código Morse (como las palabras “LO”, “ARC” y “EVO2”) dibujados directamente en los picos de accesibilidad de la cromatina!

Todo este poder generativo, cabe destacar, fue desarrollado con estrictas medidas de bioseguridad éticas: los autores excluyeron intencionalmente los virus eucariotas de su entrenamiento para prevenir la generación accidental o malintencionada de virus patógenos para humanos. En resumen, Evo 2 representa un hito monumental que unifica las diferentes escalas de la biología bajo un mismo lenguaje. Al integrar datos a un nivel sin precedentes y ofrecer sus parámetros de forma completamente abierta a la comunidad científica, esta herramienta promete acelerar el descubrimiento biológico y abrirnos las puertas a una verdadera era de diseño genómico programable. La próxima vez que mires una secuencia de ADN, recuerda que la IA ya no es solo una base de datos, sino un colega experto capaz de hablar y escribir el lenguaje de la vida.

Referencia:
Brixi, G., Durrant, M.G., Ku, J. et al. Genome modelling and design across all domains of life with Evo 2. Nature (2026). https://doi.org/10.1038/s41586-026-10176-5

AI bacterias Biología Sintética CRISPR cáncer envejecimiento Escherichia coli evolución Microbioma microbiota regulación resistencia salud VIH virus

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Te invitamos a registrar tus datos como tu correo electrónico para que puedas recibir las últimas noticias y anuncios de Biología Molecular México

By signing up, you agree to the our terms and our Privacy Policy agreement.

Te invitamos a entrar a nuestro chat de whatsapp!