Alphafold: conheça a inteligência artificial capaz de prever as estruturas das proteínas

Modelo conseguiu solucionar problema de 50 anos da bioquímica

Imagens criadas com as IAs (da esquerda para a direita) DALL-E 2, Midjourney e Stable Diffusion, com o seguinte comando: "Uma fotografia colorida de uma estrutura de proteína em uma revista, produzida em estúdio, com uma luz de fundo dramática" Foto: DALL-E 2 / MidJourney / Stable Diffusion / Estadão

Em 1972, o químico Christian Anfinsen postulou que seria possível determinar as estruturas de proteínas a partir das suas sequências de aminoácidos. Nas cinco décadas seguintes, cientistas lutaram para encontrar modelos computacionais capazes de fazer isso.

A tarefa não era fácil: em 1969, o biólogo Cyrus Levinthal estimou que enumerar todas as possibilidades de configurações de uma proteína levaria mais tempo do que o tempo conhecido do universo. O jogo começou a virar em 2018, quando a DeepMind, empresa da Alphabet (também dona do Google), começou a desenvolver o Alphafold, um potente modelo de inteligência artificial (IA) especializado na predição da estrutura tridimensional de proteínas.

Treinado a partir de banco de dados com 170 mil proteínas com estruturas já mapeadas e utilizando uma capacidade computacional equivalente entre 100 e 200 GPUs (chips especializados em IA), o Alphafold passou a obter resultados muito precisos nos principais testes de predição de estrutura de proteínas. No ano passado, a DeepMind publicou na revista Science um artigo já considerado um clássico da química e da inteligência artificial. Os resultados impressionantes na predição de estruturas rendeu ao modelo o título de descoberta do ano pela publicação científica.

As imagens abaixo foram geradas por IA, usando os modelos DALL-E 2, Midjourney e Stable Diffusion)

Imagens criadas com as IAs (da esquerda para a direita) DALL-E 2, Midjourney e Stable Diffusion, com o seguinte comando: “Uma fotografia colorida de uma estrutura de proteína em uma revista, produzida em estúdio, com uma luz de fundo dramática” Foto: DALL-E 2 / MidJourney / Stable Diffusion / Estadão

“O Alphafold deve render o primeiro prêmio Nobel para a área de inteligência artificial”, afirma Alexandre Chiavegatto, diretor do Laboratório de Big Data e Análise Preditiva em Saúde da Universidade de São Paulo (USP). Há motivos para acreditar: proteínas são um dos pilares do mundo orgânico e suas estruturas determinam suas funções na natureza. Ao entender o formato, a indústria farmacêutica, por exemplo, poderá acelerar o desenvolvimento e encontrar novos fármacos – é uma revolução a caminho.

O Alphafold deve render o primeiro prêmio Nobel para a área de inteligência artificial

Alexandre Chiavegatto diretor do Laboratório de Big Data e Análise Preditiva em Saúde da USP.

O impacto do Alphafold já pode ser sentido: o artigo original da Science recebeu em pouco mais de um ano mais de 5 mil citações científicas. O modelo mapeou as estruturas de todas as 200 milhões de proteínas conhecidas – e o banco de dados disponível publicamente já foi acessado por 500 mil pesquisadores de 190 países.

Em setembro, um grupo de cientistas da Universidade de Washington, nos EUA, publicou na revista Science a ProteinMPNN, uma IA inspirada pela Alphafold capaz de prever estruturas ainda desconhecidas e até de imaginar novas proteínas.

O potencial é grande, mas Chiavegatto faz uma ressalva. “O Alphafold é um caminho intermediário no desenvolvimento de novos medicamentos. Ele apenas indica a estrutura de uma proteína. Caberá a pesquisadores, ou a outros algoritmos, determinar a criação das novas drogas. Esse segundo passo será fundamental para a medicina”.

Fonte: Estadão