Creación de música con IA con ACE Step

Published on:
January 20, 2026
ComfyUI en Promptus Music Workflow es el modelo básico musical ACE-Step v1 en un flujo de trabajo que admite tres formas poderosas de crear y editar música.
Edición M2M (acogedora) ACE Step v1

Los modelos musicales de IA han avanzado rápidamente, pero en realidad usándolos ha sido una historia diferente. Hasta hace poco, los creadores tenían que:

  • Instalación manual Cómoda UI y busca pesos de modelos compatibles.
  • Configurar complejo gráficos de nodos solo para ejecutar un flujo de trabajo simple.
  • Tiene problemas con las piezas que faltan, por ejemplo, querer remezclar voces pero descubrir que no existe ningún nodo.
  • Dedique más tiempo a configuración de ingeniería más que en hacer música.

Para los artistas y productores, esa barrera técnica significaba que menos personas podían experimentar con los últimos avances de la IA.

CosyFlows en Promptus

Impulsar CosyFlows cambia el juego. Envuelve flujos de trabajo complejos de ComfyUI en plantillas con un solo clic puedes abrir directamente en el ComfyUI Canvas dentro de Promptus.

Sin instalación. Sin nodos de cableado. Sin búsqueda de modelos.
Solo tienes que seleccionar un flujo y empezar a crear.

Uno de los ejemplos más destacados es:
👉 Edición M2M (acogedora) ACE Step v1

Este CosyFlow empaqueta el Modelo de base musical ACE-Step v1 en un flujo de trabajo que admite tres formas poderosas de crear y editar música.

¿Qué es ACE-Step?

Antes de sumergirse en el flujo de trabajo, un breve resumen:

  • Un paso es un modelo básico de música de código abierto, construido por Estudio ACE y Diversión escalonada.
  • Está licenciado bajo Apache-2.0 → es gratuito tanto para investigación como para uso comercial.
  • Técnicamente, utiliza un generador basado en difusión, un autocodificador de compresión DCAE y un transformador lineal.
  • Rendimiento: genera hasta 4 minutos de música en unos 20 segundos en una GPU NVIDIA A100.
  • Soportes letras + indicaciones de estilo, generación multilingüe y edición del audio existente.

En otras palabras, está diseñado para velocidad, calidad y capacidad de control — lo que lo hace perfecto para flujos de trabajo creativos.

Cómo funciona CosyFlow en Promptus

Cuando lances Edición M2M (acogedora) ACE Step v1 en Promptus playground, ingresas a un flujo de trabajo de ComfyUI ya precargado con todos los nodos necesarios:

  1. Cargador de modelos ACE-Step → Carga los pesos del modelo previamente entrenados.
  2. Letra Node → Permite escribir o editar letras estructuradas, compatibles con 19 idiomas.
  3. Nodo de etiquetas → Controla el estilo, los instrumentos, el tempo y el género.
  4. Subdivisión de edición M2M → Permite introducir audio existente para la transformación.
  5. Nodos de salida → Obtenga una vista previa del audio directamente y, a continuación, guárdelo o exporte.

Sin cableado. No faltan nodos. Solo aportaciones creativas.

comfyui workflow

Cómo generar música con este flujo de trabajo
1. Conversión de texto a audio (desde cero)

Comience solo con indicaciones de texto:

  • Etiquetas describe el estilo y la instrumentación.
  • Letra define la línea vocal.

🔹 Ejemplo:

  • Etiquetas: «pop de ensueño, sintetizadores etéreos, batería suave, 100 bpm»
  • Letra:
  • [verso]
    En el resplandor de la luz que se desvanece
    Encuentro las estrellas, siento la noche
    [estribillo]
    Llévame a donde canta el silencio
    Hacia el cielo con alas plateadas

El modelo genera una pista de audio completa con voz, melodía y acompañamiento.


2. Conversión de audio a audio (remezcla y edición)

Sube una canción o un clip de audio existente y, a continuación, guía al modelo con nuevas etiquetas y letras.

🔹 Ejemplo:

  • Entrada: una canción pop alegre.
  • Etiquetas: «onda sintetizadora oscura, bajos vibrantes, sensación cinematográfica»
  • Letra: «Las sombras se elevan, el neón brilla, el tiempo se me escapa entre las manos»

La salida conserva el ritmo/melodía del original, pero transforma el estilo y la voz.


3. Edición M2M (transformación de máquina a máquina)

Este es el poder de «edición» del CosyFlow: tome audio externo o generado por un modelo y aplíquelo transformaciones directas de máquina a máquina.

Casos de uso:

  • Cambiar la de una canción lengua manteniendo la melodía.
  • Intercambio género pero mantén la voz.
  • Extiende la música más allá de su longitud original.

🔹 Ejemplo:

  • Entrada: una grabación acústica folclórica.
  • Etiquetas: «guitarra flamenca, ritmo español, aplausos animados»
  • Letra:
  • [es]
    Cantando bajo la luna
    El ritmo vive en mi corazón

El modelo produce la misma estructura de canción, pero con voces en español e instrumentación flamenca.

Flujo de trabajo visual

Esto muestra cómo los tres modos de generación fluyen hacia la misma etapa de salida.

Por qué es importante

  • Problema: Los flujos de trabajo tradicionales de ComfyUI eran demasiado técnicos, difíciles de configurar y fragmentados.
  • Solución: Promptus CosyFlow empaqueta un paso a paso ComfyUI Canvas listo para usar, reduciendo la barrera para que los creadores puedan centrarse en el arte, no en la ingeniería.

Al ofrecer tres formas de generar: desde texto, desde audio o mediante edición M2M — el flujo de trabajo cubre todo el espectro de necesidades creativas: desde la composición desde cero, la remezcla hasta la edición transformadora.

✅ En resumen:
«Edición M2M (acogedora) ACE Step v1» es un área de juegos creativa plug-and-play dentro de Promptus. Toma uno de los modelos musicales de código abierto más avanzados (ACE-Step) y lo hace utilizable para músicos, productores y aficionados sin problemas de configuración.

View more workflows
promptus ai
Simplemente crea tu próximo video de IA con Promptus
Empieza a usar Promptus ➜