Gato: conheça a inteligência artificial que é ‘pau para toda obra’

Sistema foi preparado com diversos bancos de dados abertos e é capaz de realizar 604 tarefas diferentes

Imagens criadas pelas IAs (da esquerda para a direita) DALL-E 2, MidJourney e Stable Diffusion com comando "Uma renderização tridimensional colorida de um gato rosa, escrevendo código em um computador, em sua mesa de escritório violeta" Foto: DALL-E 2 / MidJourney / Stable Diffusion / Estadão

Os mais promissores modelos de inteligência artificial (IA) do momento, como os que aparecem neste especial, têm em comum o fato de serem muito bons em tarefas específicas. Há IAs especialistas em textos, imagens ou controle de robôs. Mesmo que sejam altamente sofisticadas em suas áreas, elas são quase inúteis para outras aplicações. Não é o caso do Gato, modelo divulgado em maio deste ano pela DeepMind.

O sistema é “pau para toda obra”: consegue jogar videogame, criar legendas para fotos, controlar chatbots e comandar um braço robótico. No total, ele é capaz de realizar 604 tarefas diferentes. As múltiplas funções têm origem na diversidade das informações que alimentaram o sistema (a técnica usada para treinar o modelo é a mesma de sistemas focados em gerar texto). O Gato foi preparado com diversos bancos de dados abertos, desde jogadas para games de Atari até pacotes de imagens.

“O Gato é um modelo de fundação, que pretende absorver conhecimento de várias áreas que vão além da linguagem. A ideia é que, ao adotá-lo para determinada aplicação, ele traga informações de outros campos”, explica Fábio Cozman, diretor do Centro para Inteligência Artificial (C4AI) da Universidade de São Paulo (USP).

As imagens abaixo foram geradas por IA, usando os modelos DALL-E 2, Midjourney e Stable Diffusion)

Imagens criadas pelas IAs (da esquerda para a direita) DALL-E 2, MidJourney e Stable Diffusion com comando “Uma renderização tridimensional colorida de um gato rosa, escrevendo código em um computador, em sua mesa de escritório violeta” Foto: DALL-E 2 / MidJourney / Stable Diffusion / Estadão

IAs desse tipo ganham importância à medida que avançam para solucionar problemas mais complexos. Por exemplo: um sistema de segurança de trânsito que faz identificação de placas de automóveis e realiza varreduras em bancos de dados sobre veículos funciona melhor no esquema do Gato do que um sistema que adota dois algoritmos diferentes (um de detecção de imagens e outro de busca de palavras). “A comunicação entre IAs diferentes é complexa e aumenta a chance de erros no sistemas”, diz Anderson Soares, coordenador do Centro de Excelência em Inteligência Artificial da Universidade Federal de Goiás (UFG).

Modelos generalistas não são novidade entre pesquisadores – é a partir dessa ideia que IAs são representadas na ficção na maioria das vezes. No mundo real, porém, o Gato é o primeiro a apresentar resultados razoáveis. “Ela é a primeira a apontar para uma nova classe de sistemas de IA”, explica Soares.

O Gato é a primeira IA a apontar para uma nova classe de sistemas

Anderson Soares, coordenador do Centro de Excelência em Inteligência Artificial da Universidade Federal de Goiás (UFG)

A empolgação foi registrada nas palavras de Nando de Freitas, um dos pesquisadores por trás do Gato. “O jogo acabou!”, escreveu ele no Twitter em maio, em referência ao crescimento de sistemas generalistas. Há, porém, um longo caminho pela frente.

Na mesma mensagem, o pesquisador admite que é preciso tornar os modelos maiores, mais seguros e mais eficientes. Soares diz também que eles precisam se provar eficientes em aplicações comerciais. Para isso, o Gato precisa melhorar seus resultados.

O modelo faz várias tarefas, mas não é excepcional em nenhuma delas. Das 604 tarefas capazes de cumprir, o sistema atingiu nível de excelência em mais de 50% das vezes em apenas 450. No mundo da IA, não basta ser aluno nota 6 em todas as matérias. É preciso ter taxas bem mais altas para causar impacto duradouro.

Fonte: Estadão