fbpx

OpenAI apresenta solução que imita vozes humanas

OpenAI
Logo da OpenAI, criadora do ChatGPT, no telemóvel

A criadora do ChatGPT, OpenAI, apresentou a sua nova solução com capacidade de ler palavras em voz alta numa versão IA da voz de uma pessoa.

A tecnologia é designada Voice Engine e é capaz de recriar uma voz humana a partir de uma curta gravação de 15 segundos. Também pode recriar a voz de uma pessoa em várias línguas, independente da amostra original.

A tecnologia vem sendo testada pela empresa desde o final de 2023, num trabalho conjunto com um grupo limitado de clientes, segundo o que disse a empresa, citada pelo The Wall Street Journal.

Nesses testes, o Voice Engine tem sido usado para fornecer assistência de leitura para crianças, traduzir conteúdo para outros idiomas e gerar vozes para pessoas que não conseguem falar.

O Voice Engine foi desenvolvido pela OpenAI em 2022 e também tem sido usado para alimentar vozes para ChatGPT e outros programas. 

Segundo a OpenAI, a pré-visualização da funcionalidade do Voice Engine destina-se a incentivar as instituições e o público a estarem atentos a práticas de inteligência artificial enganosas.

A OpenAI alerta para o facto de os criminosos poderem utilizar vozes falsas para aceder às informações privadas das pessoas ou contornar medidas de segurança, como as autenticações de segurança baseadas na voz nos bancos. 

O lançamento desta funcionalidade tem aumentado os receios quanto aos riscos de deepfake, num dos maiores anos eleitorais ao nível global. Deepfake é uma imagem sintética, um vídeo ou uma gravação de áudio que foi alterada digitalmente para parecer realista, mas que na realidade é artificial.

Outras notícias:


Aliado a isso, a OpenAI revelou que não a divulgaria publicamente até saber mais sobre os potenciais riscos de utilização indevida.

“É importante que as pessoas em todo o mundo entendam para onde essa tecnologia está indo, quer acabemos implantando-a amplamente ou não”,

disse a empresa.

Anteriormente a esta nova tecnologia, a empresa responsável por criar uma das soluções de sucesso na Inteligência Artificial, o ChatGPT, apresentou ao público o Sora, um modelo de Inteligência Artificial com a capacidade de criar vídeos a partir de instruções textuais, com várias personagens e tipos específicos de movimento. 

O acesso do Sora ao público é limitado desde o seu lançamento em fevereiro. O Sora foi partilhado com um grupo selecionado de investigadores e académicos para estudo posterior. 

Fonte WSJ

Artigos relacionados

Subscreva-se à nossa newsletter. Fique por dentro da tecnologia!

Total
0
Share