Criando Música
A criação de música por modelos está se tornando cada vez mais popular e, eventualmente, terá um grande impacto na indústria musical.
Os modelos de geração de música podem criar progressões de acordes, melodias ou músicas completas. Eles podem estruturar e criar música em gêneros específicos e compor ou improvisar no estilo de artistas específicos.
No entanto, apesar do enorme potencial dos modelos de música, atualmente é difícil criar prompts para eles. A saída gerada muitas vezes não é completamente personalizável através do prompt, ao contrário de modelos de geração de imagens ou texto.
Riffusion
Riffusion, uma versão refinada do Stable Diffusion, pode ser controlada com prompts para gerar instrumentos e pseudoestilos, mas tem um número limitado de batidas disponíveis.
Mubert
Mubert interpreta os comandos através da análise de sentimentos que associa estilos musicais apropriados ao comando (não é possível controlar os parâmetros musicais em detalhes através dos comandos). Contudo não está claro quanto da geração resultante é feita por IA.
Outros
Existem tentativas de usar o GPT-3 como uma ferramenta Text-2-Music com prompts reais para elementos musicais no "micro-nível" de notas (ao invés das sugestões de estilo de prompt vagos, como no caso do Mubert e Riffusion)(por exemplo, escreva notas para uma música pop que só use A, B, C#, F#, and G). No entanto, atualmente essas tentativas estão limitadas a instrumentos individuais.
Outras abordagens incluem uma cadeia de modelos que converte qualquer imagem em um som que a represente e utilizando o ChatGPT para gerar código para bibliotecas Python que criam som.
Notas
A criação de música por prompt ainda não está bem desenvolvida... ainda. O MusicLM parece promissor, mas ainda não está disponível para o público.
Sander Schulhoff
Sander Schulhoff is the CEO of HackAPrompt and Learn Prompting. He created the first Prompt Engineering guide on the internet, two months before ChatGPT was released, which has taught 3 million people how to prompt ChatGPT. He also partnered with OpenAI to run the first AI Red Teaming competition, HackAPrompt, which was 2x larger than the White House's subsequent AI Red Teaming competition. Today, HackAPrompt partners with the Frontier AI labs to produce research that makes their models more secure. Sander's background is in Natural Language Processing and deep reinforcement learning. He recently led the team behind The Prompt Report, the most comprehensive study of prompt engineering ever done. This 76-page survey, co-authored with OpenAI, Microsoft, Google, Princeton, Stanford, and other leading institutions, analyzed 1,500+ academic papers and covered 200+ prompting techniques.
Footnotes
-
Forsgren, S., & Martiros, H. (2022). Riffusion - Stable diffusion for real-time music generation. https://riffusion.com/about ↩
