Advertisement

If you have an ACS member number, please enter it here so we can link this account to your membership. (optional)

ACS values your privacy. By submitting your information, you are gaining access to C&EN and subscribing to our weekly newsletter. We use the information you provide to make your reading experience better, and we will never sell your data to third party members.

ENJOY UNLIMITED ACCES TO C&EN

Computational Chemistry

C&EN em Português

Programa de planejamento de síntese baseia-se em parceria homem-máquina

Programa híbrido combina insights humanos e aprendizado de máquina para desenvolver rotas sintéticas

by Sam Lemonick
December 2, 2019 | A version of this story appeared in Volume 97, Issue 47

 

Acesse todo o conteúdo em português da C&EN em cenm.ag/portuguese.

Structure of the molecule bimatoprost.

Os programas de planejamento de síntese auxiliado por computador (CASP) visam a replicar o que os químicos fazem ao lidar com uma síntese: começam com uma molécula alvo e depois vão no sentido inverso para traçar uma rota sintética, incluindo uma série eficiente e alcançável de reações e reagentes. O trabalho nesse campo remonta a 50 anos, mas exemplos bem-sucedidos surgiram apenas nos últimos anos. Eles se baseiam nas regras de química escritas por químicos humanos ou em algoritmos de aprendizado de máquina que assimilaram o conhecimento de síntese a partir de bancos de dados de reações.

Os pesquisadores agora relatam que um programa CASP que combina conhecimento humano e aprendizado de máquina tem melhor desempenho do que um que usa apenas inteligência artificial, particularmente para rotas sintéticas que envolvem reações raramente usadas (Angew. Chem., Int. Ed. 2019, DOI: 10.1002/anie.201912083).

O programa é uma atualização para o Chematica, desenvolvido por Bartosz A. Grzybowski do Instituto Nacional de Ciência e Tecnologia de Ulsan e da Academia Polonesa de Ciências e comercializado pela MilliporeSigma como Synthia. Grzybowski diz que o programa inclui quase 100.000 regras que ele e seus colegas codificaram ao longo de 15 anos. No ano passado, eles demonstraram que os planos sintéticos do Chematica são tão bons ou melhores que os de químicos humanos nas sínteses em laboratório. Até este ponto, Grzybowski tem sido “talvez o maior defensor da abordagem especializada” ao software de planejamento de síntese, diz Connor W. Coley, do Instituto de Tecnologia de Massachusetts, que desenvolveu um programa CASP baseado em aprendizado de máquina.

Grzybowski e colaboradores incorporaram o aprendizado de máquina ao Chematica. Eles treinaram algoritmos de aprendizado de máquina chamados redes neurais em cerca de 1,4 milhão de moléculas de produtos que correspondem a uma ou mais das reações codificadas por especialistas do Chematica. Grzybowski diz que essa abordagem híbrida ensina os algoritmos que esses especialistas em regras realmente usam. Isso pode ajudar o Chematica a evitar um passo sintético possível, mas impraticável, ou a favorecer uma reação que raramente é vista na literatura, mas necessária para certas transformações.

Grzybowski diz que é importante incluir a percepção humana em um programa CASP, porque a síntese química representa um desafio mais difícil para os algoritmos de aprendizado de máquina do que jogar xadrez ou Go, jogos em que esses programas sempre vencem os humanos. Por exemplo, o planejamento bem-sucedido de rotas sintéticas geralmente envolve a consideração de duas ou três etapas simultaneamente. E, diferentemente de uma ação nesses jogos, calcular os efeitos de uma determinada transformação sintética - por exemplo, na densidade de elétrons ou estereoquímica - leva um tempo de computação significativo.

Os pesquisadores compararam as habilidades de seu algoritmo híbrido com as de uma abordagem puramente baseada em rede neural publicada no ano passado (Nature 2018, DOI: 10.1038/nature25978). Os dois métodos foram igualmente eficazes na proposição de etapas sintéticas que correspondiam às reações publicadas quando seus dados de treinamento incluíam milhares de exemplos dessas reações. Mas, quando havia menos de 100 exemplos, a abordagem de rede neural raramente identificava uma transformação verificada, enquanto a versão híbrida do Chematica a encontrou em 75% das vezes. Várias das reações propostas pelo programa híbrido para sintetizar o medicamento para glaucoma bimatoprost não foram representadas em seus dados de treinamento, demonstrando sua capacidade de adotar reações incomuns.

Os químicos concordam que essa parceria homem-máquina mostra-se promissora, especialmente para reações menos comuns. “Isso é importante porque houve uma preferência dos algoritmos retrosintéticos modernos em favorecer reações com bons precedentes”, diz Timothy A. Cernak, cujo laboratório da Universidade de Michigan é patrocinado pela MilliporeSigma e usa Synthia. Mas Coley, do MIT, adverte que uma comparação justa entre uma abordagem híbrida e uma rede neural sozinha é difícil, porque há um potencial maior de especialistas humanos influenciarem os dados nos quais o sistema é treinado e testado.

Os pesquisadores não verificaram as rotas sintéticas geradas em experimentos de laboratório, mas Grzybowski diz que seu grupo publicará novas sínteses de produtos naturais deste programa testadas em laboratório em breve. Ele também diz que há planos para incorporar o sistema híbrido ao Synthia.

Article:

This article has been sent to the following recipient:

0 /1 FREE ARTICLES LEFT THIS MONTH Remaining
Chemistry matters. Join us to get the news you need.