Una técnica de ‘big-data’ predice el 12% de las estructuras desconocidas de proteínas | January 23, 2017 Issue - Vol. 95 Issue 4 | Chemical & Engineering News
Volume 95 Issue 4
Issue Date: January 23, 2017 | Web Date: January 19, 2017

Una técnica de ‘big-data’ predice el 12% de las estructuras desconocidas de proteínas

Un hito en la modelización predice 100 nuevos plegamientos de proteínas
Department: Science & Technology
Keywords: structural biology, proteins, machine learning
[+]Enlarge
La modelización de proteínas in-silicoha resuelto la estructura de 600 familias de proteínas desconocidas, que incluyen un componente de la RNA helicasa, una transportadora de hierro y más de 100 nuevos giros (de los que se muestran cuatro arriba).
Credit: AAAS/Science
09504-notw1-newfoldcxd
 
La modelización de proteínas in-silicoha resuelto la estructura de 600 familias de proteínas desconocidas, que incluyen un componente de la RNA helicasa, una transportadora de hierro y más de 100 nuevos giros (de los que se muestran cuatro arriba).
Credit: AAAS/Science

Investigadores han presentado la conformación tridimensional del 12% de las familias de proteínas que, hasta ahora, tenían una estructura desconocida. Esto supone un enorme hito para el campo de la modelización de estructuras proteicas por ordenador. Las 600 familias de proteínas recién elucidadas incluyen 100 pliegues que todavía no existían en el Protein Data Bank y 200 proteínas de membrana (Science 2017, DOI: 10.1126/science.aah4043)

[+]Enlarge
Credit: AAAS/Science
09504-notw1-DUF3418cxd
 
Credit: AAAS/Science

Un equipo liderado por David Baker de la Universidad de Washington modeló las estructuras de estas proteínas usando su algoritmo Rosetta en una red de ordenadores personales que, cedidos por voluntarios, participan en computación distribuida. El equipo de Baker depositó algunas de las estructuras predichas en bases de datos públicas. En los meses siguientes, otros biólogos resolvieron de manera fortuita –y confirmaron– la estructura tridimensional de 6 de estas familias desconocidas.

“La similitud es alucinante,” comenta Johannes Söding del Instituto Max Planck de Química Biofísica, que no estuvo implicado en el estudio. “Y no se trata de proteínas pequeñas, sencillas. La mayoría tienen cientos de aminoácidos y giros complicados,” dice Söding.

Durante más de dos décadas, los investigadores han desarrollado modelos computacionales para predecir la estructura de una proteína a partir de su secuencia de aminoácidos, consiguiendo niveles de acierto muy poco consistentes. El método de Baker y su equipo está basado en una idea de hace 20 años.

[+]Enlarge
Credit: AAAS/Science
09504-notw1-ferrous
 
Credit: AAAS/Science

En aquel entonces, Chris Sender, actualmente en el Instituto Broad del MIT y la Universidad de Harvard (Massachusetts, EE.UU.), propuso que la homología de proteínas –el hecho de que organismos muy diferentes tienen proteínas provenientes de una proteína ancestro común– podría usarse para predecir estructuras. Proteínas homólogas tienen secuencias de aminoácidos similares, hacen tareas parecidas en las células y, generalmente, tienen también estructuras parecidas. 

Si las cadenas laterales de dos aminoácidos en una proteína se tocan, siempre querrán tocarse a lo largo de la Evolución, explica Baker. “Así que si uno muta para tener una cadena más larga, es probable que su complementario mute para tener una cadena más corta [y seguir encajando].”

Los algoritmos de ordenador identifican estos aminoácidos “complementarios” alineando secuencias de proteínas análogas y estadística avanzada. Como esos aminoácidos suelen estar espacialmente cerca, la información puede usarse para predecir estructuras tridimensionales. 

Para usar esta estrategia in-silico –un algoritmo que requiere de aprendizaje automático– Baker y sus colaboradores necesitaron muchas secuencias ya conocidas: cuantas más secuencias pudiera comparar el algoritmo, más fiable sería el resultado. Para ampliar el tamaño de su base de datos, los investigadores sacaron parte de los datos de un sitio poco usual: los proyectos de investigación en metagenómica microbiana. En esos proyectos, los científicos secuencian DNA de bacterias de todas partes (suelo, océano, sistema digestivo…). “Nadie había pensado en usar esos datos para predecir estructuras,” dice Baker, pero los proyectos de metagenómica ayudaron al equipo a mejorar la precisión de sus cálculos. 

“Es una estrategia que combina ‘big-data’ y fuerza bruta, pero parece funcionar mucho mejor que cualquier otra aproximación hasta la fecha,” apunta Söding. 


 

Traducción al español producida por Fernando Gomollón Bel de Divulgame.org para C&EN. La versión original (en inglés) del artículo está disponible aquí.
Para ver las traducciones en español, visita http://cen.acs.org/espanol.html.


 
Chemical & Engineering News
ISSN 0009-2347
Copyright © American Chemical Society

Leave A Comment

*Required to comment