Deutsche Tageszeitung - Google presenta AlphaGenome, un nuevo paso en la comprensión del genoma humano

Google presenta AlphaGenome, un nuevo paso en la comprensión del genoma humano


Google presenta AlphaGenome, un nuevo paso en la comprensión del genoma humano
Google presenta AlphaGenome, un nuevo paso en la comprensión del genoma humano / Foto: © AFP/Archivos

AlphaGenome, la herramienta de inteligencia artificial (IA) de Google hecha pública el miércoles, da un paso más en la comprensión del genoma al analizar cómo determinadas porciones del ADN regulan la actividad de los genes en la célula.

Tamaño del texto:

La decodificación del conjunto del genoma humano en 2003 "nos dio el libro de la vida, pero leerlo sigue siendo un desafío", destacó Pushmeet Kohli, vicepresidente de investigación de Google DeepMind, con motivo de la presentación de AlphaGenome en la revista Nature.

"Tenemos el texto" —la sucesión de 3.000 millones de pares de nucleótidos A, T, C y G que componen el ADN—, pero "comprender la gramática y la manera en que ésta gobierna la vida constituye la próxima gran frontera de la investigación", subrayó ante la prensa.

Solo 2% de las secuencias de ADN "codifican" directamente proteínas, indispensables para el funcionamiento de los organismos vivos.

El 98% restante desempeña un papel de "director de orquesta": coordina, protege y regula la expresión de la información genética en cada una de nuestras células.

Estas secuencias, llamadas "no codificantes", contienen numerosas variantes asociadas a enfermedades.

Es justamente ésto lo que AlphaGenome estudia, complementando otros modelos desarrollados por el laboratorio de IA de Google: AlphaMissense (análisis de las secuencias codificantes del ADN), AlphaProteo (diseño de proteínas) y AlphaFold (predicción de la estructura de proteínas, que obtuvo el premio Nobel de Química en 2024).

El modelo de aprendizaje profundo (en el que una red neuronal aprende a reconocer automáticamente patrones complejos) fue entrenado con datos procedentes de grandes consorcios públicos, que midieron experimentalmente estas propiedades en cientos de tipos de células y tejidos en humanos y ratones.

Es capaz de analizar una larga secuencia de ADN y "predecir" la influencia de cada par de nucleótidos en distintos procesos biológicos de la célula.

- Fundamental pero no perfecto -

Ya existían otros modelos, pero debían adoptar un compromiso entre la longitud de las secuencias analizadas y la precisión de la resolución.

Una secuencia larga —de hasta un millón de pares de nucleótidos— es "necesaria para comprender el entorno regulador completo de un único gen", explica Ziga Avsec, uno de los coautores del proyecto.

La precisión de la resolución permite estudiar el efecto de variantes genéticas comparando las predicciones de secuencias mutadas con las de secuencias no mutadas.

Otro avance es que AlphaGenome modela simultáneamente la influencia de la secuencia sobre once procesos biológicos, mientras que hasta ahora los científicos debían utilizar varios modelos.

Esta herramienta "puede acelerar nuestra comprensión del genoma ayudando a cartografiar la ubicación de los elementos funcionales y a determinar sus roles a nivel molecular", estima Natasha Latysheva, también coautora.

"Esperamos que los investigadores lo enriquezcan con más datos y modalidades", señala Kohli sobre el modelo, que ya fue probado por 3.000 científicos de 160 países y que ahora está disponible en código abierto para la investigación no comercial.

"Identificar con precisión las diferencias en nuestros genomas que nos hacen más o menos susceptibles a desarrollar miles de enfermedades es un paso clave hacia mejores tratamientos", observa Ben Lehner, responsable de genómica generativa y sintética en el Wellcome Sanger Institute, de Cambridge.

El investigador, que no participó en el proyecto pero probó el modelo, lo considera "muy eficaz", aunque todavía "lejos de ser perfecto".

"Los modelos de IA son tan buenos como los datos utilizados para entrenarlos", y la mayoría de los conjuntos de datos existentes "son demasiado pequeños y no están suficientemente estandarizados", explica en una reacción al organismo británico Science Media Center (SMC).

AlphaGenome no es una "solución milagrosa para todas las cuestiones biológicas", ya que la expresión de los genes "es influida por factores ambientales complejos, pero constituye una herramienta fundamental", coincide Robert Goldstone, responsable de genómica en el Francis Crick Institute, citado en el mismo texto.

Según él, esta nueva herramienta permitirá a los científicos "estudiar y simular de manera programática las bases genéticas de las enfermedades complejas".

(V.Sørensen--DTZ)