Advertisement

If you have an ACS member number, please enter it here so we can link this account to your membership. (optional)

ACS values your privacy. By submitting your information, you are gaining access to C&EN and subscribing to our weekly newsletter. We use the information you provide to make your reading experience better, and we will never sell your data to third party members.

ENJOY UNLIMITED ACCES TO C&EN

Synthesis

C&EN En Español

Un programa de planificación de síntesis basado en la relación hombre-máquina

El programa híbrido combina conocimientos humanos y el aprendizaje de las máquinas—machine learning—para desarrollar rutas sintéticas

by Sam Lemonick
December 2, 2019 | A version of this story appeared in Volume 97, Issue 47

 

Acceda a todo el contenido español de C&EN en cenm.ag/espanol.

Los programas de planificación sintética asistidos por ordenador (CASP, por sus siglas en inglés) tienen como objetivo replicar lo que hacen los químicos sintéticos cuando se enfrentan a una síntesis: empezar con una molécula objetivo y trabajar hacia atrás para trazar una ruta sintética que incluya una serie de reacciones y reactivos eficientes y fáciles de conseguir. El trabajo en este campo se remonta a hace 50 años, aunque los ejemplos exitosos hayan surgido en los últimos años. Estos se basan o bien en reglas químicas escritas por químicos humanos o en algoritmos de machine-learning que han adquirido el conocimiento sintético a partir de bases de datos de reacciones.

Structure of the molecule bimatoprost.

Los investigadores publican ahora que un programa CASP que combina el conocimiento humano y el aprendizaje de la máquina funciona mejor que uno que utiliza solo la inteligencia artificial, particularmente para las rutas sintéticas que requieren reacciones que no se utilizan casi nunca.

Este programa es una actualización de Chematica, que fue desarrollado por Bartosz A. Grzybowski del Instituto Nacional Ulsan de Ciencia y Tecnología y de la Academia Polaca de la Ciencia y que se comercializa por MilliporeSigma como Synthia. Grzybowski dice que el programa incluye casi 100.000 reglas que él y sus colaboradores han codificado durante 15 años. El año pasado demostraron que la planificación sintética de Chematica es tan buena o mejor que la de los químicos humanos en los laboratorios de síntesis. Hasta ahora, Grzybowski ha sido ‘quizás el defensor más acérrimo del método de los expertos’ para el software de planificación sintética, dice Connor W. Coley del Instituto de Tecnología de Massachusetts, que ha desarrollado un programa de machine-learning basado en CASP.

Grzybowski y sus colaboradores han incorporado machine learning a Chematica. Entrenaron unos algoritmos llamados redes neuronales en alrededor de 1.4 millones de moléculas producto que coinciden con una o más de las reacciones codificadas por expertos de Chematica. Grzybowski dice que este modelo híbrido enseña a los algoritmos las reglas avanzadas que utilizan los químicos expertos. Esto puede ayudar a Chematica a evitar un paso sintético que es posible pero poco práctico o favorecer una reacción que rara vez se ve en la literatura pero que es necesaria para ciertas transformaciones.

Grzybowski dice que es importante incluir el conocimiento humano en un programa CASP porque la síntesis química plantea un reto más difícil para los algoritmos de machine learning que jugar al ajedrez o a los juegos de Go en los que estos programas constantemente superan a los humanos. La planificación exitosa de una ruta sintética a menudo conlleva considerar dos o tres pasos simultáneamente. A diferencia de hacer un movimiento en esos juegos, calcular los efectos de una transformación sintética determinada—por ejemplo, de densidad electrónica o estereoquímica—requiere un tiempo de computación considerable.

Los investigadores compararon las capacidades de su algoritmo con las de un enfoque basado en una red puramente neuronal que se publicó el año pasado (Nature 2018, DOI: 10.1038/nature25978). Los dos métodos eran prácticamente igual de efectivos proponiendo pasos sintéticos que coincidían con reacciones publicadas cuando sus datos de entrenamiento incluían miles de ejemplos. Sin embargo, cuando había menos de 100 ejemplos publicados, el método de la red neuronal rara vez identificaba una transformación verificada, mientras que la versión híbrida de Chematica la encontraba en más del 75% de las veces. Algunas de las reacciones propuestas por el programa híbrido para sintetizar el fármaco bimatoprost contra el glaucoma no estaban representadas en sus datos de entrenamiento, lo cual demuestra su habilidad para adoptar reacciones poco comunes.

Los químicos están de acuerdo en que esta relación humano-máquina tiene potencial, especialmente para reacciones poco comunes. ‘Esto es importante porque ha habido una preferencia hacia los algoritmos retrosintéticos modernos que favorecen reacciones con muchos antecedentes’, dice Timothy A. Cernak, cuyo laboratorio en la Universidad de Michigan está patrocinado por MilliporeSigma y utiliza Synthia. Pero Coley en el MIT advierte que hacer una justa comparación entre un enfoque híbrido y una red neuronal es difícil porque existe un potencial mayor para que los humanos expertos sesguen los datos en los que el sistema está entrenado y probado.

Los investigadores no han verificado las rutas sintéticas generadas con experimentos en el laboratorio, pero Grzybowski dice que su grupo publicará pronto unas síntesis de productos naturales de este programa que son nuevas y han sido probadas en el laboratorio. También añade que hay planes para incorporar el sistema híbrido en Synthia.

Traducido al español por Lorena Tomás Laudo para C&EN. La versión original (en inglés) de este artículo está disponible aquí.

Advertisement

Article:

This article has been sent to the following recipient:

0 /1 FREE ARTICLES LEFT THIS MONTH Remaining
Chemistry matters. Join us to get the news you need.