A criadora do ChatGPT, OpenAI, apresentou a sua nova solução com capacidade de ler palavras em voz alta numa versão IA da voz de uma pessoa.
A tecnologia é designada Voice Engine e é capaz de recriar uma voz humana a partir de uma curta gravação de 15 segundos. Também pode recriar a voz de uma pessoa em várias línguas, independente da amostra original.
A tecnologia vem sendo testada pela empresa desde o final de 2023, num trabalho conjunto com um grupo limitado de clientes, segundo o que disse a empresa, citada pelo The Wall Street Journal.
Nesses testes, o Voice Engine tem sido usado para fornecer assistência de leitura para crianças, traduzir conteúdo para outros idiomas e gerar vozes para pessoas que não conseguem falar.
O Voice Engine foi desenvolvido pela OpenAI em 2022 e também tem sido usado para alimentar vozes para ChatGPT e outros programas.
Segundo a OpenAI, a pré-visualização da funcionalidade do Voice Engine destina-se a incentivar as instituições e o público a estarem atentos a práticas de inteligência artificial enganosas.
A OpenAI alerta para o facto de os criminosos poderem utilizar vozes falsas para aceder às informações privadas das pessoas ou contornar medidas de segurança, como as autenticações de segurança baseadas na voz nos bancos.
O lançamento desta funcionalidade tem aumentado os receios quanto aos riscos de deepfake, num dos maiores anos eleitorais ao nível global. Deepfake é uma imagem sintética, um vídeo ou uma gravação de áudio que foi alterada digitalmente para parecer realista, mas que na realidade é artificial.
Outras notícias:
- Elon Musk processa OpenAI, criadora do ChatGPT
- Criadora de ChatGPT lança solução que transforma texto em vídeo
Aliado a isso, a OpenAI revelou que não a divulgaria publicamente até saber mais sobre os potenciais riscos de utilização indevida.
“É importante que as pessoas em todo o mundo entendam para onde essa tecnologia está indo, quer acabemos implantando-a amplamente ou não”,
disse a empresa.
Anteriormente a esta nova tecnologia, a empresa responsável por criar uma das soluções de sucesso na Inteligência Artificial, o ChatGPT, apresentou ao público o Sora, um modelo de Inteligência Artificial com a capacidade de criar vídeos a partir de instruções textuais, com várias personagens e tipos específicos de movimento.
O acesso do Sora ao público é limitado desde o seu lançamento em fevereiro. O Sora foi partilhado com um grupo selecionado de investigadores e académicos para estudo posterior.
Fonte WSJ