Advertisement

If you have an ACS member number, please enter it here so we can link this account to your membership. (optional)

ACS values your privacy. By submitting your information, you are gaining access to C&EN and subscribing to our weekly newsletter. We use the information you provide to make your reading experience better, and we will never sell your data to third party members.

ENJOY UNLIMITED ACCES TO C&EN

Protein Folding

C&EN En Español

La inteligencia artificial DeepMind predice la estructura de las proteínas

El programa de la compañía AlphaFold dinamita la competición bianual CASP de predicción de la estructura de proteínas

by Laura Howes
December 7, 2020 | A version of this story appeared in Volume 98, Issue 47

 

Acceda a todo el contenido español de C&EN en cenm.ag/espanol.

Los programas creados por la empresa de inteligencia artificial de Google, DeepMind, han vencido a los humanos que juegan al ajedrez, al Go y algunos juegos de ordenador de Atari. Biólogos e informáticos dicen que la empresa ha hecho ahora lo mismo con el rompecabezas sobre cómo se pliegan las proteínas. En una competición internacional, el programa de la compañía predijo cómo las proteínas se pliegan en tres dimensiones con solo la información sobre sus secuencias de aminoácidos. “Un gran desafío de 50 años en ciencias de la computación ha sido resuelto en gran medida”, dice John Moult, biólogo estructural de la Universidad de Maryland, quien anunció los resultados esta semana.

Credit: DeepMind
El modelo de ORF8 de SARS-CoV-2 predicho por la inteligencia artificial (azul) coincide estrechamente con la estructura determinada de forma experimental (verde).

Las formas y funciones de las proteínas son resultado de cómo los aminoácidos que componen cada proteína interactúan entre sí y con su entorno. Hay que considerar un gran número de estas interacciones, incluso para un tramo corto de proteína, lo que hace que predecir cómo las proteínas se pliegan sea un desafío enorme para los científicos. A principios de la década de 1990, Moult ayudó a establecer la competición CASP (de sus siglas en inglés Critical Assessment of protein Structure Prediction o Evaluación Crítica de la Predicción de la Estructura de Proteínas), para impulsar a los investigadores a superar el desafío de la predicción. Pero los investigadores, incluido Moult, admiten que habían perdido la esperanza de vivir para ver una solución.

Entonces, en 2018, en la última conferencia CASP en Cancún, se podía ver a investigadores dando vueltas aturdidos. Los recién llegados a AlphaFold, el equipo de plegamiento de proteínas de DeepMind, acababan de superar a otros grupos de larga trayectoria con muchos años de experiencia. AlphaFold no solo ganó la competición, si no que pusieron una gran distancia entre ellos y el siguiente mejor equipo. Sin embargo, sus estructuras predichas aún no coincidían con las reales obtenidas a través de experimentos de biología estructural, como la cristalografía de rayos X o la microscopía electrónica criogénica.

En la competición de este año, dos tercios de las estructuras de proteínas predichas por AlphaFold estaban dentro del error experimental. Básicamente, estas estructuras eran tan buenas como las que los investigadores podían obtener a través de las técnicas de laboratorio.

Muchos grupos han recurrido a técnicas de aprendizaje automático (Maching Learning) para intentar predecir las estructuras de las proteínas. Entrenan sus algoritmos en pliegues de proteínas conocidos, con la esperanza de que los programas puedan encontrar patrones que se traduzcan en pliegues específicos. Pero no contentos con sus resultados en 2018, el equipo de AlphaFold dirigido por John Jumper volvió a empezar desde el principio y reconstruyó por completo su enfoque de aprendizaje automático para este año. No fue fácil, dijo Jumper en una conferencia de prensa la semana pasada, pero funciona. El nuevo enfoque de AlphaFold utiliza diferentes técnicas de aprendizaje automático, incluido un algoritmo basado en la atención para resolver estructuras de proteínas en pequeños fragmentos, un proceso que Jumper compara con la resolución de un rompecabezas, con diferentes “islas de solución” que luego tienes que averiguar cómo relacionar. “Realmente no sabíamos hasta dónde habíamos avanzado en este campo hasta que no vimos los resultados del CASP”, dice Jumper.

Uno de los investigadores que evaluó los resultados de los programas de los diferentes equipos para la competición CASP de este año, fue Andrei Lupas del Instituto Max Planck de Biología del Desarrollo. Él dice que fue inmediatamente evidente que AlphaFold había logrado una mejora increíble con sus esfuerzos de 2018. No solo tenían una gran ventaja sobre otros grupos en general, dice, si no que mientras que la precisión de las predicciones de los otros equipos se reducía a medida que las estructuras se volvían más difíciles de resolver, AlphaFold apenas registró una diferencia. “No les importa si el objetivo es fácil o difícil”, explica.

Para probar lo bueno que era AlphaFold, Lupas extrajo una proteína para la que su equipo de investigación no conocía la estructura completa. El grupo de Lupas tenía un buen conjunto de datos para la proteína, dijo, pero durante los últimos 10 años, habían agotado varios enfoques de biología estructural para traducirlo en una estructura 3D. “Entonces, la propusimos como objetivo y pedimos modelos”, explica. El modelo de AlphaFold “resolvió nuestra estructura en media hora”.

“La visión definitiva detrás de DeepMind siempre ha sido construir IA (Inteligencia Artificial) general y luego usarla para ayudarnos a comprender mejor el mundo que nos rodea”, dice Demis Hassabis, CEO y cofundador de DeepMind. Hassabis dice que se interesó por primera vez en el problema del plegamiento de proteínas en la universidad. La compañía “ha tenido grandes avances con juegos como Go, Starcraft y Atari”, agrega. “Pero es importante darse cuenta de que siempre fueron un trampolín en el camino hacia este objetivo general”.

Este nuevo programa AlphaFold no ha resuelto por completo el problema del plegamiento de proteínas. Todavía hay algunas estructuras que no pueden resolverse con AlphaFold, como los complejos con muchas interacciones proteína-proteína o proteínas de las membranas celulares. Sin embargo, dice Lupas, para muchos biólogos, las soluciones serán lo suficientemente buenas para sus necesidades. Por ejemplo, Lupas podría usar estructuras resueltas rápidamente para comparar diferentes proteínas y encontrar formas o dominios específicos que sugieran que evolucionaron a partir de una proteína o péptido ancestro común.

En los próximos 10 años, Lupas cree que la IA avanzará hasta el punto de que los biólogos sólo necesitarán un conjunto de datos y un algoritmo para resolver la estructura de una proteína, lo que les permitirá dedicar menos tiempo a los experimentos y más tiempo a pensar y conceptualizar qué significan los resultados obtenidos.

“Las proteínas son las estructuras más bonitas y hermosas, y la capacidad de seguirlas para predecir exactamente cómo se pliegan en tres dimensiones es realmente muy, muy desafiante”, dice Janet Thornton, directora emérita y científica senior del Instituto Europeo de Bioinformática, parte del Laboratorio Europeo de Biología Molecular. “Éste es un problema ideal para el aprendizaje automático”, agrega. “Pero creo que también hay muchos problemas, particularmente en la medicina y en el medio ambiente, que realmente se beneficiarán de estos enfoques de aprendizaje automático”.

Si bien los detalles completos del nuevo sistema AlphaFold aún no están disponibles para su revisión, Jumper dice que el equipo planea enviar un artículo completo que describa su trabajo a una revista revisada por pares tal como lo hicieron después de su éxito en 2018 (Nature 2020, DOI : 10.1038/s41586-019-1923-7). El equipo de investigadores también ha iniciado varias colaboraciones con otros grupos de investigación para ver en qué medida podría ser útil AlphaFold. También están explorando cómo podrían poner sus servicios a disposición de la industria.

Traducido al español por Marta Isabel Gutiérrez-Jiménez para C&EN. La versión original (en inglés) de este artículo está disponible aquí.

Article:

This article has been sent to the following recipient:

0 /1 FREE ARTICLES LEFT THIS MONTH Remaining
Chemistry matters. Join us to get the news you need.