Crédito, Getty Images

  • Author, Zoe Kleinman
  • Role, Editora de tecnologia

A empresa OpenAI lançou na segunda-feira (13/5) a versão mais recente do seu chatbot ChatGPT, de inteligência artificial.

O GPT-4o será aberto para todos os usuários do ChatGPT, incluindo não assinantes.

Esse modelo é mais rápido que os anteriores e foi programado para se assemelhar mais a humanos conversando — às vezes até mesmo com um tom de flerte em suas respostas aos usuários.

A nova versão consegue ler e discutir imagens, traduzir idiomas e identificar emoções a partir de expressões visuais. O robô também possui uma memória para recuperar perguntas anteriores.

O GPT-4o pode ser interrompido durante as suas respostas e a conversa flui com maior facilidade — não existe demora entre se fazer uma pergunta e receber uma resposta.

Falhas

Durante uma demonstração ao vivo usando a versão de voz do GPT-4o, o robô deu sugestões sobre como resolver uma equação simples escrita em um pedaço de papel — em vez de simplesmente resolvê-la. O novo ChatGPT analisou alguns códigos de computador, traduzindo entre italiano e inglês e interpretou as emoções em uma selfie de um homem que aparecia sorrindo.

Com uma calorosa voz feminina de sotaque americano, o GPT-4o cumprimentou as pessoas na demonstração, perguntando como elas estavam. Ao receber um elogio, o robô respondeu: “Pare com isso, você está me fazendo ficar vermelha!”.

A demonstração não foi perfeita. Em um momento, o robô confundiu o homem sorridente com uma superfície de madeira e em outra ocasião, começou a resolver uma equação que ainda não lhe tinha sido mostrada.

Isso demonstrou que ainda há um longo caminho a percorrer antes que as falhas e “alucinações” que tornam os chatbots não confiáveis e potencialmente inseguros possam ser resolvidas.

Mas a OpenAI mostrou por que pretende que o GPT-4o se torne a próxima geração de assistente digital de IA, uma espécie de Siri turbinada, que lembra o que foi dito no passado e consegue interagir além da voz ou do texto.

Há outro problema envolvendo essa tecnologia que não apareceu na demonstração feita à imprensa e ao público presente, que gritava e aplaudia o lançamento: o alto preço ambiental dessa tecnologia.

Sabemos que a inteligência artificial consome mais energia do que a computação tradicional e que quanto mais sofisticada ela se torna, mais poder de computação necessita. Não houve menção à sustentabilidade na apresentação da OpenAI.

‘Mágico’?

Já vimos chatbots como Grok, de Elon Musk, e Pi, do cofundador da DeepMind, Mustafa Suleyman, priorizarem a “personalidade” de seus produtos, mas a maneira como o GPT-4o lidou perfeitamente com a combinação de texto, áudio e imagens com uma resposta instantânea parece colocar a OpenAI à frente da concorrência.

É claro que, no momento, só temos o que a empresa quis nos mostrar – a demonstração foi cuidadosamente selecionada e gerenciada por eles. Será interessante ver como o GPT-4o lidará em grande escala com os milhões de pessoas que já usam o ChatGPT à medida que for implementado.

A diretora de tecnologia da OpenAI, Mira Murati, descreveu o GPT-4o como “mágico”.

Uma escolha de palavras interessante e emotiva: embora esta tecnologia esteja rapidamente ficando mais sofisticada e cada vez mais convincente como companheira, ela não é autoconsciente ou mágica. Trata-se de programação complexa e aprendizagem automática.

Houve rumores sobre uma parceria entre OpenAI e Apple e, embora isso ainda não tenha sido confirmado. Foi revelado durante a apresentação que produtos da Apple foram utilizados por toda parte.

Outro tiro certeiro foi o momento deste evento. Ele aconteceu 24 horas antes de seu rival Google exibir seus mais recentes desenvolvimentos de IA em sua conferência anual, Google IO.