A OpenAI anunciou nesta segunda-feira (13) que vai abrir para todos os usuários a sua “versão mais poderosa” até aqui do ChatGPT, alimentada pelo GPT-4o, novo modelo de inteligência artificial (IA) da empresa. A atualização vai permitir que o robô processe imagem, texto e voz em tempo real e de forma mais eficiente.
O objetivo é criar uma interação humano-computador “muito mais natural”, segundo a companhia.
“Uma parte importante da nossa missão é poder disponibilizar nossas ferramentas avançadas de IA para todos gratuitamente”, afirmou Mira Murati, diretora de tecnologia da OpenAI, durante o “Spring Update”, evento que apresentou o GPT-4o.
Ela acrescentou que novo modelo mas é “muito mais rápido” que a vesão anterior, o GPT-4, além de capacidade maior de processar texto, imagem e áudio. De acordo com a executiva, os assinantes do serviço vão poder processar “cinco vezes” mais conteúdos na versão paga.
Depois do evento em que apresentou o GPT-4o, a OpenAI divulgou uma série de demonstrações das novas funções do sistema. Em vídeos curtos, funcionários da companhia contam piadas para o ChatGPT (que responde com risada), pedem para a ferramenta cantar “parabéns” a um aniversariante e escutam conselhos do robô sobre como melhorar o visual para participar de uma entrevista.
Outra novidade apresentada nesta segunda-feira é um aplicativo do ChatGPT para computador. Isso significa que, além de acessar o robô pela web ou pelo celular, será possível ter, no PC, o ChatGPT instalado.
Traduções, conversas em tempo real e leitura de emoções
Com o GPT-4o, a ferramenta irá funcionar com capacidades de fala que envolvem interações em tempo real. Na demonstração dos novos recursos, um executivo da OpenAI pediu conselhos para o ChatGPT para se acalmar em uma apresentação importante. O assistente de voz foi capaz de ouvir e analisar a respiração dele, depois oferecer sugestões sobre como seria possível melhorar as técnicas de respiração.
Em outra demonstração, a equipe da OpenAI exibiu como ChatGPT agora será capaz de “enxergar” a partir da câmera do celular. Uma equação simples foi exibida e IA foi capaz de dar conselhos de como resolvê-la.
O sistema também poderá interpretar emoções a partir de imagens.
A atualização também vai permitir que todos os usuários possam enviar imagens para o ChatGPT e pedir que ele analise o conteúdo – de documentos, a fotografias ou capturas de tela. Antes, apenas assinantes da ferramenta tinham essa possibilidade. “Por exemplo, agora você pode tirar uma foto de um menu em um idioma diferente e falar com o GPT-4o para traduzi-lo, aprender sobre a história e o significado da comida, e obter recomendações”, conforme a OpenAI.
O anúncio da OpenAI acontece às vésperas do principal evento anual do Google, o Google I/O, que começa nesta terça-feira, em Mountain View, California. A rival liderada por Sundar Pichai deve apresentar novos recursos de inteligência artificial (IA) com o Gemini, concorrente do ChatGPT. Na semana que vem, a corrida de novidades de IA terá a largada ainda da Microsoft, que fará anúncios de IA durante o Build 2024.