AlphaGenome: El Nuevo Modelo de Google DeepMind para Interpretar el Genoma Humano
Los humanos y chimpancés comparten aproximadamente el 98% de su ADN, lo que plantea la pregunta de por qué, a pesar de esta similitud genética, las especies son tan diferentes. Estas diferencias se deben a pequeñas variaciones en regiones reguladoras, donde cada letra dentro de los 3.000 millones de bases del genoma humano puede tener un impacto significativo en la expresión de los genes. Esto puede dar lugar a rasgos distintivos, así como a enfermedades como el cáncer o problemas neurológicos.
El Complejo Mundo del ADN
La secuenciación completa del genoma humano se realizó en 2003, lo que condujo a numerosas afirmaciones sobre genes asociados a la felicidad o la homosexualidad. Sin embargo, la biología es un campo más intrincado de lo que estas afirmaciones podrían sugerir. Además de las instrucciones para producir proteínas, también existe una gran porción del ADN, erróneamente denominada «ADN basura», que no codifica proteínas, pero influye en la expresión de los mismos.
Más del 98% de nuestras variantes genéticas se clasifican de esta manera, y su efecto puede variar según el tipo de célula, como en el cerebro o en músculos. Para entender esta complejidad, los investigadores recurren a potentes herramientas computacionales.
Presentación de AlphaGenome
Este miércoles, Google DeepMind lanzó su modelo AlphaGenome, diseñado para interpretar el genoma humano, especialmente las regiones no codificantes del ADN. Según Pushmeet Kohli, vicepresidente de Ciencia de Google DeepMind, “el proyecto del genoma humano nos proporcionó el libro de la vida, pero su lectura sigue siendo un desafío. Aunque tenemos el texto, la semántica permanece en proceso de desciframiento”.
Cómo Funciona AlphaGenome
AlphaGenome actúa como un intérprete que analiza fragmentos de ADN, pronosticando sus funciones letra por letra. Por ejemplo, se estima que una pequeña alteración en una secuencia de 24 letras de ADN puede influir en el desarrollo cerebral y favorecer el autismo.
Este modelo puede prever la cantidad de expresión de los genes, la organización tridimensional del ADN y el proceso de splicing, que permite a un mismo gen producir diferentes proteínas con diversas funciones. Comparado con modelos anteriores que solo podían analizar secuencias cortas o carecían de la resolución para ver efectos individuales, AlphaGenome integra ambas capacidades. Esto permite observar la influencia de reguladores lejanos que afectan genes situados a miles de letras de distancia.
Avances en la Comprensión de Enfermedades
El artículo también destacó la aplicación de AlphaGenome en la investigación de enfermedades como la leucemia linfoblástica tipo T. A pesar de no haber mutaciones en el gen TAL1 relacionado, este puede activarse de manera desmedida, desencadenando el cáncer. Mediante la identificación de una única letra mutada en un área del “ADN basura”, se pudo predecir cómo esa alteración activaría el gen tumoral. Este proceso, que tradicionalmente requeriría meses de experimentación, fue simulado y completado en poco tiempo gracias a AlphaGenome.
Limitaciones y Oportunidades Futuras
Investigadores como Mafalda Dias, del Centro de Regulación Genómica de Barcelona, consideran que AlphaGenome representa un avance importante, aunque advierte sobre la capacidad limitada de personalización de estos modelos. Según ella, estos sistemas son eficaces para entender la biología regulatoria, pero no pueden predecir el impacto específico de variantes individuales en distintas personas.
Žiga Avsec, responsable del diseño del modelo, reconoce que todavía hay un camino largo por recorrer en la predicción de efectos variantes. A pesar de sus limitaciones, Robert Goldstone, director de Genómica en el Instituto Francis Crick, resalta que el nivel de precisión logrado es una hazaña técnica significativa.
AlphaGenome como Herramienta de Investigación
Natasha Latysheva, coautora del estudio, ve AlphaGenome como una herramienta para comprender mejor los elementos funcionales del genoma, lo que podría acelerar el avance en la comprensión del código de la vida. El modelo ya está disponible para investigadores con fines no comerciales a través de GitHub.
