Meta lança plataforma de IA generativa, o AudioCraft, que cria sons e músicas a partir de textos

Nesta quarta-feira (02), a Meta, antiga Facebook, anunciou o lançamento do AudioCraft, uma plataforma de inteligência artificial (IA) generativa que tem a capacidade de criar sons e músicas com base em textos. Inicialmente disponível para fins de pesquisa, a ferramenta será liberada para o público em breve.

O AudioCraft é uma solução versátil que atende a diversos públicos. Músicos profissionais poderão explorar novas composições e batidas, enquanto desenvolvedores de jogos terão a possibilidade de criar efeitos sonoros envolventes. Além disso, empreendedores poderão adicionar trilhas sonoras em suas publicações no Instagram, proporcionando uma experiência mais agradável aos espectadores.

As primeiras amostras de áudio divulgadas pela Meta demonstram a eficácia da tecnologia. O sistema criou áudios de alta qualidade a partir de textos simples, como “Assobiando com vento soprando” e “Sirenes e um zumbido de motor se aproximam e passam”. Os resultados impressionantes mostram a capacidade de traduzir palavras em sons realistas.

Além dos sons naturais, o AudioCraft também pode gerar batidas musicais mais complexas. A Meta compartilhou um trecho de 30 segundos criado a partir do texto “Faixa de dança pop com melodias cativantes, percussões tropicais e ritmos animados, perfeito para a praia”, evidenciando a versatilidade da plataforma.

A empresa enfatizou que a inovação do AudioCraft torna o trabalho com modelos generativos para áudio mais acessível e simples em comparação com iniciativas anteriores, como o Jukebox da OpenAI e o MusicLM do Google. A plataforma permite que os usuários explorem e personalizem os modelos existentes da Meta ou desenvolvam seus próprios, ultrapassando os limites da criação sonora.

O treinamento do AudioCraft foi realizado em três modelos distintos: MusicGen, AudioGen e EnCodec. O primeiro utilizou músicas licenciadas e de propriedade da Meta, capacitando a plataforma a gerar músicas a partir de textos específicos. O AudioGen, por sua vez, foi treinado com efeitos sonoros públicos, permitindo a criação de áudios como cantos de pássaros a partir de prompts de texto.

Quanto ao EnCodec, um decodificador de gravações sonoras, passou por melhorias após seu anúncio no ano passado, possibilitando resultados de alta qualidade mesmo com arquivos comprimidos.

O AudioCraft apresenta um design simplificado que torna a geração e a compactação de música e som mais acessíveis. A plataforma permite que as pessoas construam e reutilizem facilmente os modelos, facilitando o desenvolvimento de melhores geradores de som, algoritmos de compressão e geradores de música.

Além disso, a Meta disponibilizou o código aberto do AudioCraft, incentivando pesquisadores e desenvolvedores a contribuírem para o aprimoramento contínuo da ferramenta. Com o lançamento dessa plataforma, a Meta visa expandir as possibilidades da geração de som e música por meio da inteligência artificial, proporcionando uma experiência mais rica e imersiva para os usuários.