AlphaGenome, la IA de DeepMind, lee un millón de letras del ADN oscuro y predice efectos de variantes para cáncer, raras y terapias génicas.
Google DeepMind acaba de sacar a escena una herramienta con nombre de saga —AlphaGenome— y con ambición de manual: convertir el “genoma oscuro” en algo legible. No es un eslogan. Es la idea central del trabajo que se publica en Nature con fecha 28 de enero de 2026 y que la revista coloca en portada en su número de esta semana: un modelo de inteligencia artificial capaz de leer secuencias larguísimas de ADN, hasta un millón de letras de golpe, y a la vez predecir, con resolución fina, qué efectos funcionales puede tener un cambio mínimo, una sola “errata” genética, en mecanismos celulares que acaban pesando en enfermedades.
La novedad no está en que una IA “mire” ADN —eso ya ocurría—, sino en la combinación rara y difícil: mirar muy lejos y ver muy nítido. AlphaGenome promete contexto largo (ese millón de bases) sin renunciar al detalle de una base concreta, y lo hace sacando predicciones simultáneas sobre miles de señales biológicas. Traducido a la vida real de un laboratorio: no es “una predicción”, es un panel entero de pistas sobre cómo podría alterarse la regulación de un gen, cómo cambia el uso de un sitio de empalme del ARN, si se modifica la accesibilidad de la cromatina, si se enciende un interruptor regulador que antes estaba a oscuras. Y, sobre todo, por qué la mayoría de variantes asociadas a enfermedad suelen caer en el lugar más frustrante del mapa: ese 98% del ADN que no codifica proteínas y que, aun así, decide cuándo, dónde y cuánto se usan los genes.
El salto: del ADN que fabrica proteínas al ADN que manda
Durante décadas se ha contado la genética como si el guion estuviera casi todo en los genes que codifican proteínas. Era cómodo: ahí las mutaciones se entienden mejor, se conectan antes con un fallo molecular y, a veces, con un diagnóstico. Pero el genoma humano funciona con otra lógica más parecida a una ciudad que a una lista de piezas. Hay carreteras, cruces, semáforos, horarios, normas locales. Mucho de eso vive fuera de los genes codificantes, en regiones reguladoras que no “fabrican” una proteína pero dirigen el tráfico.
Ese es el territorio donde AlphaGenome quiere ser útil: el de los cambios diminutos en secuencias no codificantes que alteran la regulación génica, el control fino de la actividad de los genes. No hablamos de poesía biológica: la regulación explica por qué una célula del hígado y una neurona comparten ADN y, aun así, se comportan como mundos distintos. Y también explica por qué una variante que no cambia ninguna proteína puede terminar asociada a un cáncer, a una cardiopatía, a un trastorno autoinmune o a rasgos complejos de salud mental. La enfermedad muchas veces no es “la pieza está rota”, sino “la pieza se enciende cuando no toca” o “se apaga justo cuando debería arrancar”.
Ahí hay una dificultad clásica: interpretar variantes. En genética clínica, cuando aparece una variante y no se sabe qué hace, se queda en un limbo muy conocido, una etiqueta casi burocrática que desespera por lo que implica: “significado incierto”. En el mejor de los casos, esa incertidumbre se resuelve con más datos, más familias, más estudios; en el peor, se queda años en un cajón. En ese contexto, modelos como AlphaGenome llegan con una promesa muy concreta: priorizar, sugerir mecanismos plausibles, ordenar el caos. No diagnostican por sí solos; cambian la brújula del trabajo.
Qué es AlphaGenome y quién lo firma
AlphaGenome nace dentro de Google DeepMind, el mismo laboratorio que colocó a AlphaFold como referencia global para predecir estructuras de proteínas. El nuevo modelo se presenta como un sistema unificado “de secuencia a función”: recibe ADN como entrada y devuelve predicciones de actividad reguladora y efectos de variantes.
El trabajo está liderado por Žiga Avsec, Natasha Latysheva y Pushmeet Kohli, tres nombres que aparecen vinculados al desarrollo del modelo y a su despliegue científico. No es un detalle menor: DeepMind insiste en que la herramienta se ha construido para ser útil en investigación biomédica, no como un experimento aislado. Y, en paralelo a la publicación en Nature, la compañía ha reforzado el acceso para investigación, con disponibilidad para uso no comercial y apertura del código en un movimiento que busca acelerar validaciones externas, réplicas, mejoras… y críticas, que también hacen falta cuando un modelo se acerca a la medicina.
La clave técnica que se repite en la presentación científica es esta: entrada de hasta 1 megabase de ADN (un millón de pares de bases) y predicciones en miles de “pistas” funcionales con resolución de par de bases. Entrenado con datos humanos y de ratón, AlphaGenome puede predecir simultáneamente del orden de 5.930 señales genéticas humanas o 1.128 murinas asociadas a funciones específicas. Esas señales cubren modalidades muy distintas: expresión génica, inicio de transcripción, accesibilidad de cromatina, modificaciones de histonas, unión de factores de transcripción, mapas de contactos de cromatina en 3D y variables relacionadas con el splicing, el proceso de montaje del ARN que puede cambiar drásticamente el resultado final de un gen sin que el ADN “central” se haya modificado.
El truco real: contexto largo sin perder la lupa
Una manera rápida —y bastante justa— de entender el desafío es imaginar un texto larguísimo y tratar de explicar el sentido de una frase mirando solo una palabra. Muchos modelos anteriores eran fuertes en esa “palabra”: predicen bien efectos locales, pero se quedan cortos para captar decisiones que dependen de un párrafo entero. En el genoma pasa algo parecido: una variante puede estar a miles de bases del gen al que afecta, o influir a través de la arquitectura tridimensional del ADN, que se pliega, se acerca, se separa, forma bucles y vecindarios funcionales dentro del núcleo celular.
AlphaGenome busca resolver una tensión antigua del campo: longitud frente a resolución. O mirabas corto y fino, o largo y borroso. Aquí se intenta mirar largo y fino a la vez. Eso abre la puerta a preguntas que antes eran carísimas de explorar en laboratorio: “si toco esta base aquí, lejos del gen, ¿qué cambia aguas abajo?”. Con técnicas tradicionales, demostrarlo puede implicar meses entre cultivos, ensayos, validaciones, repeticiones. Un modelo computacional no sustituye ese trabajo, pero puede hacer algo muy valioso: proponer el itinerario más probable.
En los resultados presentados, el modelo se compara con sistemas previos y se subraya un dato que ha circulado mucho en las primeras lecturas: AlphaGenome iguala o supera a modelos existentes en 25 de 26 pruebas estándar. Es un indicador de rendimiento comparativo, no un sello clínico. Aun así, en un área donde la mejora incremental suele ser lenta, ese tipo de salto llama la atención.
Hay ejemplos concretos que ayudan a no quedarse en la abstracción. Uno de los casos que se citan en la literatura asociada al trabajo es el de una variante reguladora implicada en la activación anómala de un gen oncogénico, TAL1, en un contexto de leucemia linfoblástica de células T. La idea que se muestra es potente: un cambio mínimo, lejos de un gen codificante, puede activar un programa maligno. Lo relevante aquí no es solo que “lo prediga”, sino que lo haga proponiendo el mecanismo regulador, el cómo. En ciencia, el “cómo” es el puente entre una correlación y una intervención.
Splicing: el detalle que decide una enfermedad sin tocar la proteína
Si hay un punto donde la genética se vuelve especialmente contraintuitiva, es el splicing. Un gen no siempre se transcribe y se traduce igual; el ARN puede cortarse y empalmarse de maneras distintas, generando variantes de proteína o alterando la estabilidad del mensaje. Algunas enfermedades raras, y también ciertos procesos en cáncer, se apoyan en alteraciones de splicing. AlphaGenome incorpora predicciones específicas sobre uso de sitios de splicing y coordenadas y fuerza de uniones, un campo que suele exigir modelos especializados y que aquí se integra en una arquitectura más amplia.
Esto importa porque muchas variantes “misteriosas” no están en el lugar obvio. No cambian aminoácidos; cambian el montaje del mensaje. Y ese matiz, que suena técnico, es una diferencia real entre interpretar bien o mal una variante.
Cómo se entrena un modelo así: datos públicos, biología humana y ratón
AlphaGenome se entrena con grandes proyectos y conjuntos de datos públicos que han medido actividad reguladora en cientos de tipos celulares y tejidos, tanto en humanos como en ratón. El uso del ratón no es casual ni decorativo: sigue siendo uno de los modelos experimentales centrales en biomedicina por capacidad de manipulación genética y por la cantidad de datos acumulados. Entrenar con ambos permite comparar, generalizar y, en parte, cruzar validaciones.
Lo que hace el modelo con esos datos es aprender a asociar patrones de secuencia con señales funcionales observadas: cuándo una región está abierta o cerrada, dónde se unen determinados factores, qué marcas epigenéticas aparecen, cómo se organiza la cromatina, qué transcritos resultan. A partir de ahí, puede puntuar el efecto de variantes comparando predicciones entre la secuencia “normal” y la mutada. Esa comparación es importante: no basta con predecir actividad, hay que estimar el cambio inducido por una variación concreta.
En este punto conviene mantener el enfoque: no es un detector mágico de enfermedades, ni una máquina de vaticinios personales. Es un modelo que intenta predecir efectos moleculares y regulatorios. Entre eso y una enfermedad hay muchos escalones: fisiología, ambiente, historia celular, interacciones con otras variantes, exposición a factores externos. Por eso, incluso en las coberturas más entusiastas aparece la misma frase, con distintos tonos: la herramienta acelera hipótesis, pero la validación experimental sigue siendo imprescindible.
Lo que puede cambiar mañana en investigación biomédica
Cuando una herramienta permite explorar variantes de manera masiva, sin dejarse semanas en cada paso, hay un cambio de ritmo. Y en biomedicina, el ritmo es casi un factor clínico: lo que tarda en entenderse un mecanismo tarda en traducirse a un tratamiento.
En investigación básica, AlphaGenome puede servir para cartografiar mejor regiones reguladoras, entender por qué un elemento actúa en un tejido y no en otro, o qué secuencias están detrás de patrones de expresión durante el desarrollo. El genoma no se “lee” igual en un embrión que en un adulto; no se regula igual en un tejido sano que en uno inflamado. Un modelo que predice actividad en múltiples modalidades permite, al menos, plantear preguntas con más precisión.
En descubrimiento de dianas terapéuticas, el enfoque cambia de “busco genes mutados” a “busco circuitos reguladores alterados”. En muchas enfermedades complejas, el problema no es un gen roto, sino un programa de regulación desplazado. Encontrar nodos de ese programa es lo que convierte la biología en farmacología: dónde intervenir para corregir una trayectoria. Identificar mutaciones que empujan un cáncer, por ejemplo, no siempre significa encontrar una mutación en un gen famoso; puede significar encontrar un regulador que activa un gen conocido sin tocarlo directamente.
En biología sintética y terapia génica, la utilidad se intuye rápido. Manipular ADN no es solo insertar o corregir una secuencia, también es asegurarse de que esa secuencia se expresará como se espera, en el tejido correcto, con la intensidad correcta, sin efectos no deseados. Modelos que anticipan consecuencias regulatorias podrían ayudar a diseñar construcciones más seguras o a evitar diseños que, sobre el papel, parecen perfectos y en la célula se vuelven impredecibles.
En fármacos basados en ARN, donde splicing y regulación tienen un papel central, una herramienta que predice cambios en el procesamiento del ARN puede orientar dianas que antes quedaban fuera de radar o eran demasiado costosas de explorar. Aquí, de nuevo, el valor es acelerar la selección de hipótesis.
La frontera clínica: pruebas genéticas, “variantes inciertas” y enfermedades raras
La medicina genómica vive de informes. Y los informes viven de interpretaciones. Si el laboratorio detecta una variante y no puede interpretarla, el resultado clínico se atasca. En enfermedades raras, ese atasco es especialmente cruel: familias con años de peregrinación diagnóstica, pruebas que señalan “algo”, pero sin cerrar el círculo.
AlphaGenome entra justo ahí con un argumento concreto: si la mayoría de variantes de riesgo caen en regiones no codificantes, hay que tener herramientas capaces de interpretarlas. El modelo podría ayudar a reducir el volumen de variantes “no interpretables” al proporcionar predicciones de efecto sobre regulación y splicing. No sustituye la evidencia clínica, pero puede servir para priorizar variantes candidatas, sugerir qué tejidos o procesos mirar, orientar experimentos funcionales específicos y, en algunos casos, reanalizar datos antiguos con una capa nueva de interpretación.
En cáncer, el impacto potencial es más inmediato en investigación traslacional. Muchas mutaciones relevantes no están en el “cuerpo” de los genes, sino en regiones reguladoras que los activan o los silencian. Comprender esas rutas puede explicar por qué dos tumores con mutaciones similares se comportan distinto, o por qué uno responde a un tratamiento y otro no. Si una herramienta ayuda a conectar una variante reguladora con un cambio funcional plausible, se gana tiempo y se reduce el tiro al aire.
También hay un área delicada: salud mental y rasgos complejos. Aquí la genética es poligénica y dependiente de contexto; cualquier afirmación simple suele ser sospechosa. Pero, incluso en este terreno, entender mejor la regulación génica y los efectos de variantes no codificantes puede aportar piezas a un puzle que hasta ahora ha sido casi inabordable con métodos tradicionales.
Lo que dicen los expertos y la letra pequeña que no conviene saltarse
La reacción en la comunidad científica combina entusiasmo y prudencia, que es una mezcla sana. Se ha descrito AlphaGenome como un avance notable en genómica computacional por su capacidad de igualar o superar modelos previos y por la integración de modalidades que normalmente se modelan por separado. También se insiste en lo inevitable: un modelo es tan fiable como los datos y las pruebas que lo sostienen, y el mundo real tiene ruido. En biología, el ruido no es un defecto; es parte del sistema.
Hay además una cuestión de generalización. Aunque AlphaGenome se entrene con enormes conjuntos de datos y cubra múltiples tejidos y tipos celulares, siempre habrá zonas menos medidas, señales menos representadas, contextos biológicos extremos o raros. Ciertas predicciones pueden ser excelentes en células y condiciones muy estudiadas y menos robustas en entornos donde hay pocos datos de entrenamiento. Eso exige transparencia en cómo se usan las predicciones y, sobre todo, evita el malentendido más peligroso: tratar una puntuación computacional como si fuera una verdad clínica.
La apertura del acceso para investigación no comercial y la publicación de código ayudan precisamente a esto: permiten que grupos independientes prueben, comparen, encuentren puntos débiles, propongan mejoras y, si hace falta, corrijan excesos de interpretación. La ciencia se fortalece cuando algo se puede replicar y discutir con el mismo material.
AlphaGenome en el mapa de DeepMind: de proteínas a genoma completo
La historia de DeepMind en biociencia venía marcada por AlphaFold, que cambió el ritmo en predicción de estructura de proteínas y se convirtió en herramienta cotidiana en laboratorios de medio planeta. AlphaGenome se presenta como un siguiente salto: si AlphaFold respondía a “cómo se pliega una proteína”, AlphaGenome se asoma a “cómo se lee el genoma”, que es otra forma de preguntar por qué una célula hace lo que hace.
Pero son retos distintos. La estructura de una proteína tiene una física relativamente acotada; el genoma está atravesado por capas de regulación, epigenética, arquitectura 3D, dinámica celular. Por eso, el impacto de AlphaGenome no se debería medir como “lo resolvió”, sino como “hizo el problema tratable”. En ese sentido, que Nature lo lleve a portada y que la publicación enfatice el equilibrio entre escala y resolución sugiere que el campo lo ve como una pieza que faltaba.
También hay una lectura estratégica: el genoma es un océano de datos, y la IA vive bien en océanos de datos. Si se consigue que el modelo sea robusto y útil, puede convertirse en una infraestructura de investigación, como lo fue AlphaFold, aunque en un plano más complejo y con más cautelas por su proximidad a la interpretación clínica.
El estado de la promesa: una herramienta potente, una medicina todavía lenta
A día de hoy, AlphaGenome se coloca con claridad en el terreno de la investigación, aunque con una sombra larga hacia la clínica. El camino típico será este, aunque nadie lo diga así de crudo: primero lo usan grupos académicos para entender mecanismos, luego se incorpora a pipelines de interpretación de variantes en centros avanzados, después se valida con estudios grandes, y solo entonces empieza a influir de forma sistemática en decisiones clínicas. Ese trayecto no es un defecto; es el filtro que evita que una buena idea termine haciendo daño por exceso de confianza.
Mientras tanto, lo inmediato es más tangible: mejores mapas para el “ADN oscuro”, hipótesis más rápidas, experimentos mejor diseñados, menos tiempo perdido en callejones sin salida. Y en un campo donde los callejones sin salida cuestan dinero, energía y años de vida científica, eso ya es un cambio serio.
Cuando el genoma deja de ser un libro cerrado
AlphaGenome no convierte el ADN en una receta simple, ni promete curas automáticas, ni debería venderse como un oráculo. Lo que sí pone sobre la mesa, con fechas, nombres y rendimiento comparativo, es una idea potente: la parte no codificante del genoma puede empezar a interpretarse con herramientas capaces de leer contexto largo y devolver predicciones funcionales ricas. Si esa capacidad se consolida, la genética deja de ser solo “qué genes están alterados” y pasa a ser, cada vez más, “qué regulación se desajustó y por qué”.
En esa transición hay un efecto silencioso pero profundo: cambia la conversación científica sobre muchas enfermedades. Algunas mutaciones dejarán de ser “ruido estadístico” y pasarán a ser mecanismos plausibles. Algunas pruebas genéticas dejarán de acabar en un cajón con la etiqueta de incertidumbre. Algunos diseños de terapia génica o de biología sintética se harán con más previsión y menos ensayo a ciegas. Todo eso no sucede de golpe, pero empieza con una herramienta que, por primera vez en este formato, intenta leer un millón de letras del genoma sin perderse en el camino y sin olvidar el detalle.
🔎 Contenido Verificado ✔️
Este artículo ha sido redactado basándose en información procedente de fuentes oficiales y confiables, garantizando su precisión y actualidad. Fuentes consultadas: Nature, Google DeepMind, EL PAÍS, Cadena SER, Science Media Centre, STAT.
Alessandro Elia
Fuente de esta noticia: https://donporque.com/alphagenome-descifra-el-adn-oscuro/
También estamos en Telegram como @prensamercosur, únete aquí: https://t.me/prensamercosur Mercosur
Recibe información al instante en tu celular. Únete al Canal del Diario Prensa Mercosur en WhatsApp a través del siguiente link: https://www.whatsapp.com/channel/0029VaNRx00ATRSnVrqEHu1W
ACERCA DEL CORRESPONSAL
REDACCIóN CENTRAL
Prensa Mercosur es un diario online de iniciativa privada que fue fundado en 2001, donde nuestro principal objetivos es trabajar y apoyar a órganos públicos y privados.
- ★Nasa gastará US$ 20 bilhões em base na Lua e cancela estação orbital
- ★JW Marriott Panama revela su nueva colección de habitaciones de lujo
- ★American Airlines lanza un kits de amenidades y pijamas de edición especial
- ★Seabourn incorpora a The Atlantic para organizar eventos selectos
- ★Conesa lo ganó en el final y sumó su primera victoria en el Apertura

