Advertisement

If you have an ACS member number, please enter it here so we can link this account to your membership. (optional)

ACS values your privacy. By submitting your information, you are gaining access to C&EN and subscribing to our weekly newsletter. We use the information you provide to make your reading experience better, and we will never sell your data to third party members.

ENJOY UNLIMITED ACCES TO C&EN

Computational Chemistry

C&EN En Español

¿Está sobrevalorado el ‘aprendizaje automático’?

Un grupo de químicos analiza las posibilidades y los agujeros de esta tecnología de inteligencia artificial

by Sam Lemonick
August 22, 2018 | A version of this story appeared in Volume 96, Issue 34

 

Los algoritmos de aprendizaje automático –machine learning, en inglés– están sobrevalorados. El aprendizaje automático no está sobrevalorado. El aprendizaje automático va a transformar nuestras vidas. El aprendizaje automático es una herramienta como cualquier otra.

Pregunta a diez químicos lo que piensan sobre el aprendizaje automático y conseguirás 10 respuestas diferentes. Esto estaría bien para un acalorado debate en Twitter, pero la discusión tiene implicaciones muy serias.

Si es menos valioso de lo que se ha dicho, dice George Schatz, químico físico en la Universidad Northwestern, “la gente perderá tiempo y esfuerzo” probándola en sus laboratorios. Los científicos que inviertan clases, tiempo de laboratorio, y dinero en aprendizaje automático podrían encontrarse en una posición muy comprometida si esta herramienta no resuelve los problemas como prometía.

Por otro lado, si de verdad es el futuro, los químicos que no empiecen a utilizarlo ahora pueden quedarse atrás.

Seguramente sea imposible contestar a la pregunta que plantea el titular de este artículo. Pero tras decenas de conversaciones con químicos, C&EN ha conseguido averiguar cuál es el consenso científico actual alrededor de la inteligencia artificial.

El aprendizaje automático es un tipo de inteligencia artificial que consiste en la capacidad de entrenar a un ordenador a partir de un conjunto de datos para que éste cree ‘reglas’ de conocimiento a su alrededor. A los químicos les interesa, sobre todo, su poder de predicción. Por ejemplo, si le das a un algoritmo de este tipo los puntos de fusión de 100 aleaciones, ¿podría adivinar el punto de fusión de una aleación que no esté en la lista? ¿Podría predecir el punto de fusión para una aleación que jamás ha sido preparada?

A pesar de todas las promesas –o de lo que se percibe como grandes promesas– lo que está claro es que los algoritmos de aprendizaje automático no son mágicos. “Hay que ser realistas,” dice George Dahl, científico en Google. “Estos algoritmos utilizan una regresión no lineal,” un tipo de análisis estadístico bastante simple en los que los datos obtenidos se “encajan” con parámetros de referencia. Dahl ganó una competición de aprendizaje automático, organizada por Merck & Co., junto con un estudiante de doctorado del grupo de Geoffrey Hinton en la Universidad de Toronto.

Vender el aprendizaje automático como algo que no es podría ser realmente dañino para esta tecnología. Si no puede alcanzar el listón, los científicos y las entidades que financian la ciencia podrían decidir que ya no merece la pena invertir. “Necesitamos atraer a las mentes más brillantes” para estudiar sus beneficios y para que sean exitosas, dice Nuno Maulide, un químico orgánico sintético en la Universidad de Viena.

Para explorar el “limbo” entre lo que algunos han prometido y lo estos algoritmos pueden hacer realmente—y para ver cuál es el consenso entre químicos sobre esta herramienta—C&EN ha examinado algunos de los campos donde generan más entusiasmo, y a la vez más escepticismo.

Química farmacéutica y “drug discovery”

Entre los pioneros en utilizar el aprendizaje automático se encuentran las compañías farmacéuticas, por varias razones. Podían invertir en ordenadores muy potentes cuando todavía estaban fuera del alcance de muchos químicos, y además tenían millones de datos sobre pequeñas moléculas y dianas biológicas con los que entrenar a los algoritmos.

Además de los medios, la industria farmacéutica tenía motivación. Los algoritmos de aprendizaje automático ofrecían las mismas promesas para mejorar el descubrimiento de nuevos fármacos que la química combinatoria o el ‘high-throughput screening,’ estrellas que brillaron y ya se han apagado. “A las compañías farmacéuticas les atraen estas nuevas tecnologías porque desarrollar medicamentos es extremadamente difícil, y siempre buscan nuevas formas de multiplicar las posibilidades de éxito,” dice Robert P. Sheridan, químico computacional de Merck & Co recién jubilado.

Según cómo definas el aprendizaje automático pueden encontrarse diferentes fechas en las que las compañías farmacéuticas empezaron a usar esta tecnología. Llevan utilizando algoritmos de redes neuronales artificiales, una forma sencilla de machine learning, desde hace casi medio siglo. En 1973 un grupo de investigadores en la antigua URSS demostraron que estos algoritmos podrían predecir la actividad biológica de 1,3-dioxanos sustituidos (Comput. Biomed. Res. 1973, DOI: 10.1016/0010-4809(73)90074-8).

Ya en los noventa, los químicos médicos usaron estos mismos algoritmos para crear modelos de estructura-actividad cuantitativos—QSAR por sus siglas en inglés. Los modelos QSAR predicen las propiedades de una molécula a partir de las propiedades conocidas de otras, y pueden ayudar a decidir si es un buen candidato a medicamento. Hoy en día, otros programas más avanzados como los algoritmos de bosque aleatorio y las máquinas de vectores de soporte han reemplazado a los primeros algoritmos QSAR.

Desde esa perspectiva, dice Sheridan, no es demasiado correcto decir que el aprendizaje automático esté sobrevalorado. “Algoritmos como QSAR llevan décadas usándose y han demostrado ser claramente útiles,” dice. Los modelos QSAR no son perfectos, pero muchas compañías como Merck continúan usándolos porque les ayudan a priorizar el trabajo sobre ciertas moléculas, ahorrando tiempo y dinero.

Las farmacéuticas ya han vivido el “ciclo de hype” completo sobre los algoritmos de aprendizaje automático. La consultoría Gartner introdujo este concepto de “ciclo de hype” en 1995 para explicar cómo se adapta la gente a las nuevas tecnologías. Al principio, una innovación gana muchísima atención y crea expectativas demasiado surrealistas que acaban llevando a un inevitable valle de desilusión. Cuando la gente acaba haciéndose a las limitaciones de una tecnología y sus posibilidades reales, ésta alcanza una meseta de productividad. Los que conozcan a fondo la industria farmacéutica pueden reconocer estas olas de atención en innovaciones relativamente recientes como la nanotecnología o la química combinatoria.

Las compañías farmacéuticas no parecen haber generado ninguna resistencia al “hype” a pesar de lo común que es. Las redes neuronales avanzadas –redes de aprendizaje profundo o deep learning– están viviendo su momento en el descubrimiento de nuevos fármacos, alcanzando la cima de la sobre-expectación. Como los algoritmos de aprendizaje más primigenios, las redes más avanzadas intentan imitar nuestro cerebro: la información pasa por una serie de nodos interconectados que imitan a nuestras neuronas. Cada nodo analiza ciertas piezas de la información de una forma específica, y luego pasa el mensaje a sus vecinos. Así funcionan los programas de reconocimiento de imágenes—primero reconocen sombras y formas, luego orejas, ojos, y finalmente una cara completa. Las redes neuronales profundas tienen muchas más capas y nodos que sus predecesoras, y han hecho posibles avances espectaculares en campos como el reconocimiento de imagen o el procesamiento natural de lenguajes.

La capacidad de las redes neuronales profundas de aprender de grandes y muy complejos juegos de datos las hace especialmente atractivas para la industria farmacéutica. Adam Heifets es CEO y cofundador de Atomwise, que crea software basado en redes neuronales avanzadas para predecir las energías de unión de candidatos a medicamento con sus respectivas dianas en el cuerpo humano. Cree que la introducción de estas redes neuronales ha supuesto un avance fundamental, aunque algunos acusan a su empresa de aumentar deliberadamente la expectación sobre el potencial de esta tecnología. Un artículo de Techcrunch de 2015 citaba a otro cofundador de la empresa, Alexander Levy, diciendo que su software le había permitido predecir una cura para el sarampión desde su salón. En una respuesta a otro artículo sobre el tema en el blog ‘In the Pipeline’, especializado en química farmacéutica, Levy parecía echar las culpas al periodista: “¿No sería maravilloso si Atomwise funcionara la mitad de bien de lo que suena en Techcrunch?” escribió. Levy dejó Atomwise a principios de 2018.

Heifets no está contento con la reputación que se ha ganado su empresa, entre otras. Él tiene claro que el trabajo de Atomwise no es predecir la cura de nada. “Nos centramos en la afinidad y la energía de unión. Que se una no quiere decir que sea un medicamento,” dice. Otros investigadores del campo comparten el mismo pensamiento. Si bien los algoritmos de aprendizaje automático pueden predecir de manera muy precisa qué moléculas van a unirse bien a ciertas dianas –y pueden incluso hacerlo mejor que los humanos– hay muchísimos otros pasos que dar antes de crear un nuevo medicamento que dé beneficios. “El descubrimiento de nuevos fármacos es un camino largo,” dice Dahl, de Google. Utilizar las algoritmos puede compararse a desarrollar un ensayo mejor o un microscopio con más aumentos, probablemente causarían un impacto real, pero pequeño.

Las grandes farmacéuticas parecen entusiasmadas con las redes neuronales profundas, aunque como Heifets son cautas y tratan de no sobredimensionar las expectativas. “No creemos que el aprendizaje automático vaya a resolver todos los problemas. Es muy potente para ciertas tareas concretas,” dice Jeremy Jenkins, jefe de química biológica y ciencia de datos terapéuticos en Novartis.

Aun así, algunos químicos creen que las redes neuronales profundas pueden llevar el descubrimiento de fármacos al siguiente nivel, ayudando a descifrar los complejos datos que proporciona la biología humana. “A menudo la biología es tan compleja que es complicado tener una visión global,” dice Vijay Pande, socio del grupo de inversores Andreessen Horowitz y químico computacional en la Universidad de Stanford. Cree que los humanos han alcanzado su límite para comprender datos biológicos, pero que gracias a los algoritmos de aprendizaje automático seremos capaces de comprender la borrosa frontera entre la química de los medicamentos y la biología de nuestro cuerpo.

Advertisement

Jenkins dice que, con el tiempo, los algoritmos de aprendizaje automático podrían adquirir la habilidad de sugerir una o varias moléculas a los químicos médicos, para que pudieran centrar sus esfuerzos en desarrollar estas y convertirlas en medicamentos más rápidamente. Esto suena muy parecido a las promesas de algunos algoritmos más antiguos, y muchos son escépticos de que el aprendizaje profundo sea diferente. Sheridan dice que, cuando su grupo comparó redes neuronales profundas con otras técnicas de inteligencia artificial, encontraron mejoras estadísticamente significativas en su capacidad de predicción. Pero, si se tiene en cuenta el camino completo del desarrollo de medicamentos, los beneficios siempre son bastante modestos.

Results of a C&EN survey about whether machine learning is overhyped.

Resultados de la encuesta

C&EN encuestó a través de internet a los químicos sobre su opinión de los algoritmos de aprendizaje automático. Estas son sus respuestas.

30%: El porcentaje de encuestados que dicen usar estos algoritmos habitualmente en su trabajo


¿En qué área de la química crees que pueden tener el mayor impacto los algoritmos de aprendizaje automático?

“En mi experiencia, hay tantísima información disponible que es complicado saber si las conclusiones que sacamos de nuestras búsquedas bibliográficas están sesgadas. Creo que los algoritmos de aprendizaje automático pueden ayudarnos a buscar información libre de sesgos, gracias a la estadística.”—Samuel Nuñez-Pertinez, estudiante de doctorado en la Universidad de Birmingham

“Tiene el enorme potencial de encontrar correlaciones que los humanos tendemos a pasar por alto. Herramientas como el aprendizaje automático ayudarán a los químicos a tomar mejores decisiones, y nos darán sugerencias que quizás nos ayuden a tener nuevas ideas.”—Thomas Struble, investigador postdoctoral en el MIT


¿En qué área de la química crees que las expectativas de los algoritmos de aprendizaje automático son más utópicas?

“Los algoritmos de aprendizaje automático no hacen sino interpolar en conjuntos de datos muy grandes. Será muy difícil de usar –casi imposible– en áreas en las que es complicado generar muchos datos, porque entonces los algoritmos extrapolarán y darán respuestas totalmente erróneas.”—Bernd Hartke, profesor en la Universidad de Kiel

“La química analítica. Será muy complicado tanto para químicos como para legisladores confiar en los resultados que da una máquina sin conocer exactamente cuál ha sido el proceso que se ha seguido desde el análisis de la muestra hasta el resultado.”—Andrea Leoncini, investigador postdoctoral, Universidad Nacional de Singapur.

“Igual que el DFT no ha reemplazado a los métodos basados en la función de onda, y mucho menos ha evitado la necesidad de hacer experimentos, los métodos de aprendizaje automático no van a reemplazar a las metodologías de la química cuántica. Sin embargo, tienen el potencial de dar un mejor resultado sobre los cálculos computacionales que hacemos.”—Marissa Estep, estudiante de doctorado en la Universidad de Georgia.


¿En qué área de la química trabajas?

Química orgánica: 23.3%

Química física: 17.3%

Química analítica: 16.0%

Química inorgánica: 12.7%

Bioquímica: 10.0%

Química computacional: 7.3%

Otras: 13.3%

Respuestas totales = 150

Nota: El total no es 100% debido al redondeo. No todos los participantes respondieron todas las preguntas.

Fuente: Encuesta online de C&EN, 2018

Podría ser interesante ver cómo, mientras los algoritmos de aprendizaje automático ayudan al descubrimiento de fármacos, también impactan a otras áreas de la química.

Ciencia de materiales

“La razón por la que se cree que los algoritmos de aprendizaje automático son demasiados complejas para el desarrollo de fármacos es porque la pregunta está mal hecha,” dice Leroy Cronin, químico en la Universidad de Glasgow. Estos algoritmos funcionan bien con un objetivo determinado, como reconocer una cara. Pero Cronin explica que, dado que los humanos no acabamos de entender qué hace que un fármaco existoso—mientras que es sencillo identificar una cara—no sabemos con qué datos alimentar a nuestros algoritmos para hacerlos exitosos. Es posible que las redes neuronales profundas, con su habilidad de procesar datos más complejos, puedan dar mejores resultados, pero todavía tienen que demostrar sus capacidades. Cronin y otros opinan que el impacto de la inteligencia artificial llegará antes a la ciencia de materiales.

“¿Cómo afecta la química a las propiedades de un material? Hay una conexión directa,” dice Jillian Buriak, un químico de materiales en la Universidad de Alberta, y editor jefe de la revista Chemistry of Materials. La dureza de un cristal es una consecuencia de cómo se unen sus átomos entre sí. Por eso es más probable que la inteligencia artificial sea útil en ciencia de materiales, explica.

El aprendizaje automático ha llegado al campo de los materiales más tarde que al campo de la química farmacéutica—sólo lleva usándose unos 10 años. Aún así, hay numerosos artículos que demuestran que estos algoritmos pueden predecir las propiedades de moléculas y materiales, dando muy a menudo resultados muy sorprendentes.

Los algoritmos descubrieron los complejos de espín entrecruzado, complejos inorgánicos que pueden actuar como interruptores y sensores (J. Phys. Chem. Lett. 2018, DOI: 10.1021/acs.jpclett.8b00170), y también han predicho la existencia de vidrios metálicos hechos con aleaciones que jamás se habían imaginado (Sci. Adv. 2018, DOI: 10.1126/sciadv.aaq1566).

Como en la industria farmacéutica, la ciencia de materiales lleva años usando lo que hoy llamaríamos “aprendizaje automático.” Heather Kulik, profesora del MIT que lideró la investigación sobre los complejos de espín entrecruzado, dice que cuando creó su laboratorio unos cuatro o cinco años atrás, les decía a sus colegas que su objetivo era adaptar las técnicas que funcionaban en la química computacional orgánica a la química inorgánica. “Ahora jamás diría eso,” dice Kulik. “Ahora diría que aceleramos el descubrimiento de materiales inorgánicos con inteligencia artificial, porque sé que atraerá más a quienes leen mis artículos y a los organismos que financian mi investigación.”

Buriak está de acuerdo en que los científicos de materiales llevan años usando algoritmos de aprendizaje automático, pero llamándolos con otro nombre. Buriak señala proyectos como la iniciativa para descifrar “el genoma de los materiales,” una colaboración entre varias agencias federales dotada con más de $500 millones en 2011 para encontrar y producir nuevos materiales más rápido. La iniciativa recopiló y clasificó datos -la mayoría en formato digital- para acelerar el avance de la ciencia de materiales.

La idea de obtener “el genoma de los materiales” –recoger y analizar grandes cantidades de datos para poder encontrar nuevas ideas– se remonta tan sólo a 2002, y ya en 2016 los investigadores demostraron el potencial de algoritmos de aprendizaje automático en ciencia de materiales. Los autores construyeron una base de datos públicos que incluía resultados de reacciones fallidas, y pudieron predecir cómo cristaliza la selenita de vanadio de una forma mucho más exacta que cualquier humano (Nature 2016, DOI: 10.1038/nature17439).

Un ordenador que gana a un humano en una tarea específica no es algo demasiado sorprendente, los investigadores del campo suelen decir que nada puede reemplazar a nuestra intuición. Bobby G. Sumpter, un químico físico en el Laboratorio Nacional de Oak Ridge que trabaja en métodos computacionales desde los ochenta, dice que hay razones para creer que la inteligencia artificial puede interpolar entre grandes cantidades de datos y hacer predicciones que serían demasiado sutiles o demasiado complejas para los humanos. Pero pensar que una máquina puede predecir algo más allá de los datos con los que ha sido entrenada es ignorar las reglas más básicas de la estadística, dice Sumpter. Si esto funcionara, podríamos predecir la estructura de una molécula a partir de sus propiedades empíricas. Y aún no podemos.

Bert de Jong, un químico computacional en el Laboratorio Nacional Lawrence de Berkeley dice que lo que hoy llamamos “aprendizaje automático” no es más que una herramienta para acelerar los cálculos computacionales sobre bases de datos muy grandes. No puede extrapolar más allá del conocimiento que hay en los datos que recibe, no puede comprender la física de las moléculas, no puede aprender, añade.

Pero puede mejorar los métodos experimentales de los científicos de materiales. “Los algoritmos de aprendizaje automático pueden ayudar de manera muy significativa a analizar los datos y arrojar resultados interesantes,” dice Sumpter.

Dice que los algoritmos de aprendizaje automático son bastante buenos interpretando imágenes y espectros de compuestos y materiales, en especial distinguiendo las señales del ruido cuando estamos cerca de los límites de detección de un aparato. También pueden ayudar, opina, a guiar experimentos en tiempo real. Porque los algoritmos pueden asimilar e interpretar cantidades inmensas de datos en milisegundos, y gracias a esto pueden ajustar los parámetros de la reacción para optimizar el experimento sobre la marcha, en tiempo real, algo que es particularmente útil en reactores de flujo continuo.

Si está bien construido, un algoritmo no tiene los sesgos que sí tenemos los humanos, y es más consistente. Para muchos investigadores, es la mejor herramienta para diseñar experimentos. “La química es sucia y complicada,” dice Cronin. “Los algoritmos de aprendizaje automático pueden ayudarnos a diseñar mejores experimentos,” especialmente cuando el número de variables puede sobrecoger a un humano, como entender los efectos del disolvente en una reacción.

Descubrimiento de reacciones

Lo primero que se le viene a la cabeza un químico cuando oye hablar de inteligencia artificial y sobrexpectación es la retrosíntesis. Desde el mismo día que Elias J. Corey, el prestigioso químico de Harvard, describió su método para planear una ruta sintética identificando los enlaces clave y los “ladrillos” más fundamentales, él y muchos otros han tratado de crear programas de ordenador que puedan jugar a construir moléculas con ellos.

“Llevan tanto tiempo diciendo que serán capaces de hacerlo,” dice Sumpter, “que ahora todo el mundo piensa: ya, claro.” Pero a pesar de este escepticismo, Sumpter está dentro del grupo de gente que cree que los algoritmos de aprendizaje automático pueden llegar a aprender retrosíntesis. Pero los químicos en esta área no tienen las expectativas tan altas como quizás cabría esperar.

“Creo que estos algoritmos mejorarán algunas habilidades de los humanos. No nos harán innecesarios, sino mucho más eficientes en todo lo que hacemos,” dice Matt Toussant, vicepresidente senior de producto y operaciones en CAS, una división de la American Chemical Society—la sociedad que publica C&EN.

Toussant dice que, este otoño, CAS lanzará su programa para planificar retrosíntesis: ChemPlanner. En agosto, MilliporeSigma lanzó Synthia—anteriormente conocido como Chematica.

Los dos programas necesitan expertos humanos que creen las bases de datos con las reglas del juego, con las trasformaciones químicas posibles a partir de la bibliografía y su propio conocimiento. Los algoritmos navegarán por esas bases de datos y, con las reglas que han aprendido, sugerirán posibles rutas sintéticas para lograr obtener la molécula deseada.

Bartosz Grzybowski del Instituto Nacional Ulsan de Ciencia y Tecnología en Corea, creador de Synthia, explica que los algoritmos de aprendizaje automático son sólo una de las herramientas que utiliza este programa. Synthia también usa dinámica molecular, mecánica cuántica, y propiedades electrónicas para juzgar cuán favorable es una transformación, así como evaluar la estabilidad de los intermedios a lo largo de la ruta sintética. Grzybowski dice que los algoritmos de aprendizaje automático no pueden hacerlo todo. “Algunos aspectos más avanzados de la química orgánica requieren todas esas otras herramientas. Lo que quiero decir es que tenemos que ser abiertos y solucionar el problema sin insistir en un método en particular.”

Comparison of human- and computer-created synthetic plan.
Synthia, un programa basado en inteligencia artificial, planificó una ruta sintética (derecha) para un inhibidor de la ATR quinasa que conlleva menos pasos que la ruta publicada en la bibliografía (izquierda), consiguiendo un rendimiento similar.

Algunos químicos siguen siendo escépticos a las ventajas que ofrecen estos productos frente a la forma tradicional de planear una síntesis, que normalmente requiere que uno de tus estudiantes de doctorado acceda a bases de datos como Reaxys o SciFinder –también un producto de CAS–, den con una posible ruta y la prueben en el laboratorio. Toussant dice que lo que importará realmente a los químicos es si un algoritmo como ChemPlanner los hace más productivos y les permite hacer más descubrimientos.

Grzybowski responde al escepticismo con su mantra: “cocínalo.” Comprueba si de verdad el programa es capaz de predecir una ruta mejor (o la misma ruta), pero más rápido que un humano usando una base de datos. Él mismo hizo la prueba en uno de sus últimos artículos (Chem 2018, DOI: 10.1016/j.chempr.2018.02.002), donde demostró que Synthia encuentra rutas nuevas, eficientes, y que funcionan experimentalmente en tan sólo 15 o 20 minutos.

Si los químicos creen que necesitan palabras rimbombantes como “inteligencia artificial” para atraer más ojos, o más dólares, es estupendo, dice Grzybowski. No les culpo, “el factor de impacto es importante,” añade. Pero cuando pase la sobrexpectación, tan solo sobrevivirán las herramientas realmente útiles, como ha ocurrido anteriormente en genómica y en química combinatoria. Estas dos técnicas viajaron por la montaña rusa de la expectación. Ninguna alcanzó sus respectivas expectativas, pero ambas siguen usándose.

Toussant cree que la inteligencia artificial está a punto de caer desde la cima de la expectación hacia el valle de la desilusión. “Pero todas las tecnologías acaban recuperándose y saliendo del pozo,” dice. “Espero que los algoritmos de aprendizaje automático hagan lo mismo, creo en su futuro.”

Aprendizaje humano

A pesar de todas sus diferencias, los químicos entrevistados por C&EN están de acuerdo. Sí, los algoritmos de aprendizaje automático están sobrevalorados. No curarán el cáncer, pero son una herramienta útil que ha venido para quedarse.

Todavía hay que debatir si es realmente útil. Pero para aprovechar al máximo estos algoritmos, los químicos tienen que cambiar su comportamiento. Empezando por los datos.

No es ninguna sorpresa que los campos donde los algoritmos de aprendizaje automático se utilizan con más frecuencia sean la química farmacéutica y la ciencia de materiales—son dos áreas que llevan años creando bases de datos útiles sobre las propiedades químicas. Crear datos limpios y comprensibles para poder entrenar a los algoritmos es algo que ha supuesto un gran problema en química orgánica. La información sobre reacciones exitosas está desperdigada por revistas con todo tipo de formato y nomenclaturas. Y las reacciones que no funcionan están escondidas en viejos cuadernos de laboratorio.

“Las reglas del juego son las mismas,” dice Sumpter, del Laboratorio Nacional Oak Ridge. “Las gallinas que entran por las que salen.” Si alimentas un algoritmo con basura, no deberías sorprenderte si el resultado es precisamente eso. Entrenar un algoritmo requiere muchos datos, muy organizados, y preferiblemente necesita que estos datos incluyan también resultados negativos. Cronin, de la Universidad de Glasgow, dice que los químicos tienen que aprender cómo construir bases de datos, y cómo crear descriptores de estos datos que permitan aprender al algoritmo.

Los químicos deberían aprender a programar, algo básico al menos. Javier García Martínez, profesor de química inorgánica en la Universidad de Alicante, dice que el entrenamiento de los químicos ha de cambiar. “Todo estudiante de doctorado sabe RMN y difracción de rayos X,” dice. “Pero las nuevas herramientas son los algoritmos de aprendizaje automático y la inteligencia artificial.” García-Martínez recomienda a los químicos que ya terminaron la universidad a seguir estudiando, hay cientos de cursos gratuitos disponibles en internet.

Casi todos coinciden en que las colaboraciones serán cada vez más importantes. Los expertos en química orgánica tendrán que trabajar mano a mano con sus colegas los químicos computacionales e informáticos para encontrar las formas de aplicar los nuevos algoritmos en su investigación. Dahl dice que sería feliz si más químicos fueran a Google con datos y preguntas: “me encantaría probar a trabajar con ellos.”

Incluso los más acérrimos defensores de la inteligencia no creen que vaya a ser útil para los químicos sin un esfuerzo por su parte en aprender más sobre estas nuevas herramientas. Tienen que cambiar su manera de pensar, su manera de ver los datos, incluso empezar a plantear las preguntas de forma diferente. Si lo logran, dice Joshua Schrier, químico computacional de la Universidad Fordham y el Haverford College, “entonces los algoritmos otorgarán superpoderes a los químicos.”

¿Hay demasiada expectación? Depende de tu punto de vista. Para los que trabajan mano a mano con los algoritmos, el entusiasmo que ven en las notas de prensa y las conversaciones de ascensor es ya bastante cansino. Creen de verdad que esta tecnología tendrá un impacto real y duradero en la química, especialmente si se enseña a más gente. Al mismo tiempo, algunos se preocupan de que esta herramienta nunca pueda alcanzar las expectativas que muchos tienen, y que la desilusión generada acabe afectando al progreso.

Cronin lo deja muy claro: “Yo siempre digo que los algoritmos de aprendizaje automático están sobrevalorados y son aburridos. Aún así, los químicos deberían utilizarlos más.”

Traducido al español por Fernando Gomollón Bel para C&EN. La versión original (en Inglés) de este artículo está disponible aquí.

Article:

This article has been sent to the following recipient:

0 /1 FREE ARTICLES LEFT THIS MONTH Remaining
Chemistry matters. Join us to get the news you need.