O Google detalhou um bot AI que pode criar música a partir de entradas de texto. Chamado MusicLM, ele pode até gerar músicas inteiras com vocais humanos.
O Google está trabalhando em um bot de IA chamado MusicLM que pode criar música a partir de entradas de texto simples. A IA entrou na consciência pública nos últimos anos, mas as coisas explodiram no ano passado com o lançamento do ChatGPT da Open AI. O chatbot pode fazer uma infinidade de coisas, como escrever histórias, gerar piadas originais, explicar tópicos científicos complexos, resolver problemas de matemática e até oferecer terapia, entre outras coisas.
O Google criou um bot de IA chamado MusicLM que a empresa afirma poder gerar música de alta fidelidade a partir de descrições de texto ou trechos de som e criar músicas com base em gêneros e estilos específicos mencionados pelo usuário. Também pode usar uma melodia cantarolada ou assobiada. Em um trabalho de pesquisadisseram os pesquisadores do Google, “O MusicLM lança o processo de geração condicional de música como uma tarefa de modelagem hierárquica de sequência a sequência e gera música a 24 kHz que permanece consistente por vários minutos.” Os pesquisadores também dizem que o bot pode aderir aos critérios de entrada melhor do que qualquer IA de produção de música existente e até superá-los em termos de qualidade de áudio.
Música gerada por IA
O Google carregou vários trechos de áudio que dizem ter sido criados usando o MusicLM. A IA gerou os clipes de áudio de 30 segundos com descrições que incluem um gênero ou instrumentos específicos. Alguns dos clipes de 5 minutos foram criados inteiramente com base em descrições de uma ou duas palavras, como ‘tecno melódico’, ‘swing’ ou ‘jazz relaxante’. Os resultados provavelmente não farão ninguém esquecer Beethoven ou Mozart, mas soam naturais o suficiente para tornar quase impossível acreditar que compositores humanos não os escreveram.
Juntamente com prompts de texto, o MusicLM também pode receber instruções usando imagens. Os usuários podem definir os níveis de experiência do músico AI para ajustar a qualidade de saída. O bot pode até criar músicas inspiradas em lugares e ser solicitado a criar músicas para atividades específicas, como meditação ou exercícios. O MusicLM pode gerar vocais humanos, mas eles soam distorcidos, com letras em inglês que soam mais como uma salada de palavras do que como uma música real. Ed Sheeran e Taylor Swift não precisam se preocupar com a concorrência iminente ainda.
O MusicLM está longe de ser o primeiro gerador de música AI moderno. Tentativas anteriores incluem Riffusion, Dance Diffusion e OpenAI’s Jukebox, mas nenhuma delas produziu resultados tão impressionantes quanto o MusicLM. Com mais tempo e material de treinamento, a nova IA pode se tornar ainda mais realista e ‘humana’, mas isso também pode colocar o Google em problemas legais com músicos por usarem suas músicas para treinar o modelo de IA. Foi exatamente o que aconteceu recentemente, quando três artistas proeminentes processaram Stability AI, Midjourney e DeviantArt por supostas violações de direitos autorais. Apesar dos possíveis problemas legais, é provável que seja apenas uma questão de tempo até que MusicLM surge com criações que são verdadeiramente indistinguíveis da música criada por compositores humanos.
Fonte: Google/GitHub, arXiv