Os modelos de geração de música podem criar progressões de acordes, melodias ou músicas completas. Eles podem estruturar e criar música em gêneros específicos e compor ou improvisar no estilo de artistas específicos.

No entanto, apesar do enorme potencial dos modelos de música, atualmente é difícil criar prompts para eles. A saída gerada muitas vezes não é completamente personalizável através do prompt, ao contrário de modelos de geração de imagens ou texto.

Riffusion

Riffusion¹, uma versão refinada do Stable Diffusion, pode ser controlada com prompts para gerar instrumentos e pseudoestilos, mas tem um número limitado de batidas disponíveis.

Mubert

Mubert interpreta os comandos através da análise de sentimentos que associa estilos musicais apropriados ao comando (não é possível controlar os parâmetros musicais em detalhes através dos comandos). Contudo não está claro quanto da geração resultante é feita por IA.

Outros

Existem tentativas de usar o GPT-3 como uma ferramenta Text-2-Music com prompts reais para elementos musicais no "micro-nível" de notas (ao invés das sugestões de estilo de prompt vagos, como no caso do Mubert e Riffusion)(por exemplo, escreva notas para uma música pop que só use A, B, C#, F#, and G). No entanto, atualmente essas tentativas estão limitadas a instrumentos individuais.

Outras abordagens incluem uma cadeia de modelos que converte qualquer imagem em um som que a represente e utilizando o ChatGPT para gerar código para bibliotecas Python que criam som.

Notas

A criação de música por prompt ainda não está bem desenvolvida... ainda. O MusicLM parece promissor, mas ainda não está disponível para o público.

Footnotes

Forsgren, S., & Martiros, H. (2022). Riffusion - Stable diffusion for real-time music generation. https://riffusion.com/about ↩

Sander Schulhoff

Sander Schulhoff is the Founder of Learn Prompting and an ML Researcher at the University of Maryland. He created the first open-source Prompt Engineering guide, reaching 3M+ people and teaching them to use tools like ChatGPT. Sander also led a team behind Prompt Report, the most comprehensive study of prompting ever done, co-authored with researchers from the University of Maryland, OpenAI, Microsoft, Google, Princeton, Stanford, and other leading institutions. This 76-page survey analyzed 1,500+ academic papers and covered 200+ prompting techniques.

Edit this page

🟢 Truques de Detecção

📙 Vocabulário

Master Generative AI with Our Courses

Need Business GenAI Training?

Contact Sales

Want to keep learning

DIFFICULTY LEVEL

RECOMMENDED COURSES

ChatGPT for Everyone

Introduction to Prompt Engineering

Live Courses

Criando Música

Riffusion

Mubert

Outros

Notas

Footnotes

Sander Schulhoff

Master Generative AI with Our Courses

Contact Sales

Explore Our Full Course Collection

Explore Courses

Resources

Follow Us