fbpx

Já é possível falar com o ChatGPT por voz

ChatGPT

A OpenAI fez grandes actualizações ao seu famoso software ChatGPT, e outros grandes nomes do mundo digital já estão a incorporar a tecnologia da empresa nos seus próprios serviços.

Como já definimos várias vezes, ChatGPT é um modelo de linguagem desenvolvido pela OpenAI que utiliza a arquitetura GPT (Generative Pre-trained Transformer) para gerar texto coerente e relevante em resposta a perguntas e comandos em linguagem natural. 

Lançado em Novembro de 2022, com o objectivo de fornecer assistência virtual em uma ampla variedade de tarefas, como responder a dúvidas, gerar texto criativo, traduzir idiomas e muito mais. Desde o seu lançamento, ChatGPT passou por várias iterações e melhorias, antes das novas funcionalidades, O chatbot sempre foi apenas uma caixa de texto. 

Baoba Hub_GIF

A plataforma ChatGPT passa a contar com uma atualização que torna possível que os utilizadores comuniquem-se com a plataforma através da voz.

Os utilizadores podem escolher entre 5 opções de voz diferentes, incluindo masculinas e femininas, e é possível escutar amostras delas no blog da OpenAI.A nova versão do ChatGPT também pode responder a imagens.

Além disso, a OpenAI revelou que o chatbot de inteligência artificial (IA) será capaz de analisar fotografias e compreender o que se passa nelas.

Juniper, Sky, Cove, Ember e Breeze são os nomes das cinco vozes, que são uma mistura de homens e mulheres com sotaque americano. De acordo com a OpenAI, as vozes podem ser utilizadas para tudo, desde contar uma história para adormecer até resolver um desentendimento à mesa de jantar.

“O ChatGPT pode agora ver, ouvir e falar… Os utilizadores Plus poderão ter conversas de voz com o ChatGPT (iOS e Android) e incluir imagens nas conversas (todas as plataformas).”

Anunciou a empresa através da rede social X (antes Twitter)

Para aceder na parte da conversação por voz o utilizador deve tocar num botão e apresentar a sua preocupação, o ChatGPT converte-a em texto e envia-a para o modelo de linguagem de grande dimensão, recebe uma resposta, converte-a novamente em voz e diz a resposta em voz alta. 

A funcionalidade aproxima-se das plataformas com a Alexa ou o Google Assistant, só que a OpenAI assume que aqui as  as respostas serão melhores graças à tecnologia subjacente melhorada. Tudo indica que as tecnologias de assistentes virtuais estão a ser reconstruídas para se basear em LLMs, ferramenta em que a OpenAI está à frente.

LLM trata-se da abreviação para um modelo largo de linguagem composto por uma rede neural com muitos parâmetros. São treinados com grandes quantidades de texto usando aprendizado de máquina supervisionado. 

A marca também revelou recentemente que os utilizadores podem mostrar fotografias do ChatGPT que a inteligência artificial pode examinar e analisar. A empresa afirma ter avaliado o modelo em “domínios como o extremismo e a proficiência científica” para ajudar na sua implementação responsável.

A pesquisa de imagens é semelhante à do Google Lens onde o utilizador tira uma fotografia do que lhe interessa e o ChatGPT tenta perceber o que está a perguntar e responder de forma adequada. A ferramenta também pode ser utilizada para desenho para esclarecer melhor a sua pergunta, ou falar ou escrever perguntas para acompanhar a imagem.

Leia também:


Recorda-se que o diretor executivo da OpenAI, Sam Altman, falou da necessidade de regulamentar a IA devido aos perigos que pode representar para os seres humanos, mas a sua empresa parece estar a avançar, apesar de alguns pedidos de suspensão.

A solução tem sido utilizada em diversas aplicações, desde atendimento ao cliente automatizado até assistência em pesquisa e educação, desempenhando um papel significativo no avanço da tecnologia de processamento de linguagem natural e na forma como as pessoas interagem com sistemas de IA.

Com este lançamento, a empresa, em anúncio das funcionalidades num blogue, reconhece que se pode abrir espaço para que pessoas de má fé possam-se fazerem passar por figuras públicas ou cometerem fraude. Para garantir que isso não aconteça, o modelo não está disponível para uma utilização alargada, será muito mais controlado e restringido a casos de utilização e parcerias específicas.

Fonte Euro News The Verge

Artigos relacionados

Subscreva-se à nossa newsletter. Fique por dentro da tecnologia!

Total
0
Share