Você está interessado neles OFERTAS? Economize com nossos cupons em WhatsApp o TELEGRAMA!

ChatGPT agora é um assistente que pode ver, ouvir e falar

25 setembro 2023

ChatGPT, desenvolvido pela OpenAI, está introduzindo novos recursos que permitem interagir por meio de voz e imagens, oferecendo uma interface intuitiva e mais formas de integrar o ChatGPT ao seu dia a dia. Num anúncio recente no seu site, a OpenAI decidiu revelar antecipadamente estas novas funcionalidades. Da mesma forma, ele também destacou os benefícios que trazem e os desafios que apresentam no crescente mercado de IA.

Tópicos deste artigo:

ChatGPT: interação por voz

Com a nova funcionalidade de voz, os usuários podem ter conversas interativas com ChatGPT. Isso permite que você utilize o assistente mesmo em movimento, aumentando o potencial do chatbot. Por exemplo, um usuário pode pedir ao ChatGPT para contar uma história infantil enquanto estiver em trânsito, tornando-a mais divertida.

Uma história criada pelo chatbot

Ou, durante um jantar com amigos, pode surgir um debate sobre um tema específico; neste caso, os usuários podem utilizar o bot para obter informações precisas e resolver o debate de forma construtiva.

A tecnologia de voz do ChatGPT usa um modelo avançado de conversão de texto em fala. Em colaboração com dubladores profissionais, este modelo é capaz de gerar áudio humanóide a partir de texto e amostras curtas de voz, tornando a interação com o ChatGPT ainda mais natural e intuitiva. Além disso, graças a Sussurro, um sistema de reconhecimento de fala de código aberto desenvolvido pela OpenAI, as palavras faladas são transcrito em texto com grande precisão, permitindo que o chatbot entenda e responda de forma eficaz às solicitações dos usuários.

ChatGPT: interação visual

Como acima, o modelo de IA agora pode analisar uma ou mais imagens, permitindo aos usuários resolver problemas, planejar refeições ou analisar gráficos complexos. Por exemplo, um usuário pode enviar uma foto do conteúdo de sua geladeira. O chatbot deve, portanto, ser usado analisar os alimentos presentes e sugerir receitas baseadas nesses ingredientes, também fornecendo instruções passo a passo para preparação.

Veja também: GPT-4: Gemini será rival do Google. Aqui estão as diferenças

Além disso, se o usuário precisar focar em um elemento específico da imagem, O aplicativo móvel do ChatGPT inclui uma ferramenta de desenho que permite destacar áreas específicas da imagem, tornando a comunicação e a análise ainda mais precisas e personalizadas.

A compreensão de imagens é alimentada pelos modelos multimodais GPT-3.5 e GPT-4. Esses modelos avançados eles aplicam suas habilidades linguísticas a uma ampla variedade de imagens, como fotografias, capturas de tela e documentos que contêm texto e imagens, permitindo ao ChatGPT compreender e interpretar o contexto visual com precisão e detalhes.

Vale ressaltar que a partir poco OpenAI integrou não apenas isso canva mas também DALL-E 3 no ChatGPT, ou o modelo de imagem generativo.