Como a inteligência artificial está a criar coisas que não existem?

Um ramo da inteligência artificial está a ganhar forças com as aplicações dos últimos anos. A inteligência artificial generativa é uma área da inteligência artificial que tende a criar coisas que não existiam antes apenas ao observar padrões, desde rostos até obras de arte.

Inteligência artificial cria coisas novas?
Tem ocorrido uma explosão de aplicações de inteligência artificial que utiliza uma área chamada inteligência artificial generativa.

Recentemente, estamos a ver o sucesso do ChatGPT que consegue gerar desde textos expositivos-explicativos até mesmo roteiros de filmes. Também vemos o StableDiffusion que é um modelo capaz de gerar imagens e vídeos extremamente realistas.

A ideia de uma inteligência artificial a criar coisas novas não é nova. Modelos que são capazes de gerar frases já vem desde os anos 90 com o advento dos chatbots. O próprio corretor automático de telemóveis são exemplos de inteligência artificial generativa.

A inteligência artificial generativa é um exemplo de modelos que geram coisas novas a partir das observações de um conjunto de dados. Elas aprendem ao observar uma série de dados, como imagens ou textos, e através de técnicas de probabilidade, aprendem a criar novos dados.

Exemplos de redes neurais generativas

O exemplo mais recente e que tem chamado muita atenção é o ChatGPT. O ChatGPT é um modelo de linguagem natural que utiliza técnicas de aprendizagem de máquina para conseguir gerar textos após uma entrada de texto. Abaixo um texto gerado pelo ChatGPT com a entrada de texto: Descreva a história da música All Too Well de Taylor Swift.

A música é conhecida por ser uma das faixas mais pessoais e emocionais de Swift, e é amplamente considerada uma das melhores músicas da sua carreira. A história por trás de "All Too Well" remonta a um relacionamento de curta duração que Swift teve com o ator britânico Jake Gyllenhaal em 2010.
De acordo com Swift, a letra da música é baseada numa experiência pessoal em que ela se apaixonou profundamente por alguém, mas o relacionamento acabou de forma abrupta e dolorosa. A música retrata o sentimento de perda e arrependimento que Swift sentiu após o fim do relacionamento, e os versos detalhados e emotivos têm sido amplamente interpretados como uma expressão das suas próprias emoções na época.

Outro exemplo são as imagens geradas pelo DALL-E 2 que consegue criar imagens a partir de uma entrada de texto. Abaixo exemplos de gerações da DALL-E 2.

Imagens geradas pelo DALL-E
Imagens geradas pelo DALL-E 2. Na primeira imagem, o input que gerou a imagem é "gato vestido de astronauta a olhar para a Terra no estilo do estúdio Ghibli". A segunda imagem foi gerada com "planeta Júpiter com um rosto de gato na sua superfície". Crédito: DALL-E 2

Estes são alguns exemplos de aplicações de inteligência artificial generativa. Elas criam algo após aprender a usar observações de padrões que a priori não existiam.

Machine learning: aprender através de observações

A aprendizagem de máquina, ou machine learning, é uma técnica que consiste em alimentar dados para um algoritmo. Este algoritmo vai observando uma função após encontrar padrões naquele conjunto de dados. Um exemplo é que você pode alimentar uma série de pinturas de Van Gogh, o algoritmo irá gerar uma função capaz de entender o estilo de Van Gogh.

Há diferentes formas de aprendizagem de máquina mas uma delas chama a atenção: a aprendizagem supervisionada.

A aprendizagem supervisionada consiste em fornecer um conjunto de dados e a resposta do que é pretendido que o modelo devolva.

Imagine que dá várias imagens de um cão de pequeno porte para um algoritmo aprender a reconhecer um cão pequeno juntamente com a classificação “cão pequeno” ou imagens de gatos com a classificação “gato”. Em suma, é dado ao algoritmo a resposta que é pretendida e ele aprende ao observar estes conjuntos.

Outra forma são as aprendizagens não-supervisionadas que deixa para que o modelo consiga aprender sozinho após observar vários dados.

Como uma inteligência artificial generativa funciona?

A inteligência artificial generativa é um exemplo de aprendizagem de máquina. Ela recebe um conjunto de dados e consegue reproduzir após observar e aprender os padrões.

As redes neurais generativas (GANs) são redes neurais criadas com a intenção de gerar coisas novas. Elas funcionam da seguinte forma: há duas redes, uma chamada geradora e uma chamada discriminadora. A geradora tem o objetivo de receber um conjunto de dados e aprender a recriar eles. A discriminadora tem o objetivo de reconhecer o que é real e o que foi criado pela geradora.

O modelo está completo quando a geradora consegue enganar a discriminadora. Por outras palavras, a geradora fez um trabalho tão bom em imitar os dados reais, que os dados gerados por ela conseguem parecer dados reais.
Esquema de uma rede neural generativa
Esquema de uma rede neural generativa. Na imagem, a geradora está marcada a azul e a discriminadora está marcada a vermelho. Crédito: Thalles Silva blog.

Já o ChatGPT recorre a um outro tipo de rede chamada de transformers. As transformers utilizam uma técnica chamada de attention que é capaz de processar textos e prestar atenção em diferentes partes de um texto. A atenção funciona como uma camada que consegue colocar a atenção matematicamente na compreensão de um texto.

Estão de facto a criar coisas que não existem?

Estes modelos de inteligência artificial precisam de observar dados para conseguir aprender. Estes dados são gerados de forma humana, seja através de fotografias, textos ou pinturas. Não criam do zero, são muito boas em encontrar padrões e fazer predições que parecem criadas.

É sempre bom lembrar que por trás de todos estes modelos há um algoritmo que utiliza matemática para conseguir encontrar funções que conseguem modelar algo, seja geração de textos ou de imagens.