A Meta, empresa responsável pelo Facebook, Whatsapp e Instagram, lançou recentemente o MusicGen, uma plataforma que utiliza o algoritmo Transformer da OpenAI para transformar descrições ou textos em áudio.
Enquanto outras ferramentas como DALL-E e Midjourney transformam texto em imagem, o MusicGen leva essa ideia um passo adiante, criando faixas de áudio a partir de descrições.
O segredo por trás do MusicGen está no uso do EnCodec, uma tecnologia permite a criação das faixas utilizando aprendizado de máquina, ou seja, machine learning. A vantagem do MusicGen é que ele é capaz de entregar resultados em um curto período de tempo, tornando-o uma ferramenta eficiente.
Para alimentar sua base de dados, a equipe do MusicGen obteve acesso a mais de 20 mil horas de músicas autorizadas, o que contribui para resultados mais diversificados. Além disso, adicionaram mais de 10 mil gravações de áudio disponíveis na internet, ampliando a variedade de sons que podem ser gerados.
Leia também:
A solução ainda está em fase inicial de desenvolvimento, apesar de já estar disponível para testes e dos testes que se tem realizados, revela-se ser uma plataforma com resultados ainda não tão precisos ou satisfatórios, assim como acontece com outras ferramentas geradoras de imagens.
Em algumas ocasiões, o MusicGen pode fornecer faixas de áudio mais genéricas, que não correspondem completamente ao pedido feito na plataforma. No entanto, essas contribuições ajudam a enriquecer o banco de dados do sistema.
No site da plataforma, são sugeridos alguns pedidos que podem gerar resultados mais precisos para aqueles que desejam entender melhor seu funcionamento. No entanto, todos são livres para experimentar e criar suas próprias composições exclusivas.
A tendência é que o MusicGen se torne mais preciso com o tempo, à medida que mais usuários o testarem e alimentarem o banco de dados com suas contribuições. É possível que, no futuro, a ferramenta ofereça faixas de áudio mais longas e consistentes, aprimorando ainda mais sua utilidade.
Fonte Hardware




