Una inteligencia artificial que crea música e imita cantantes solo con texto

Este desarrollo no puede crear patrones musicales grandes sino únicamente clips

Dos desarrolladores crearon un modelo de software que utiliza inteligencia artificial llamado Riffusion, el cual puede generar música a partir del texto y con los instrumentos que pida el usuario.

Seth Forsgren y Hayk Martiros, los creadores de esta inteligencia artificial que recibe su nombre como un tributo a la IA de Stable Diffusion, aseguran en la página web oficial del proyecto que la idea surgió por hobby en un principio, pero se volvió una realidad; en la actualidad puede ser utilizado para generar clips cortos de música que se reproducen automáticamente.

Cómo funciona Riffusion

La página web de la herramienta indica que Riffusion no genera música de forma automática sino que pasa por un proceso que empieza con la creación de una imagen que representa un espectrograma, la representación visual de un sonido. Una vez que se ha creado esta imagen, la inteligencia artificial la traduce a sonido.

Espectrograma generado en  Riffusion que representa a un ritmo de bajo junto a un solo de saxofón de jazz. (Riffusion)

Espectrograma generado en Riffusion que representa a un ritmo de bajo junto a un solo de saxofón de jazz. (Riffusion)

Este desarrollono puede crear patrones musicales grandes, por lo que reproduce el mismo clip varias veces; en muchas ocasiones las notas emitidas están desafinadas y fuera de ritmo.

Una característica relevante es que Riffusion no solo se limita a emular el sonido de instrumentos musicales, sino que puede imitar ciertos aspectos de la voz humana. En caso de que los usuarios soliciten escuchar a un vocalista, la inteligencia artificial se encargará de simular una voz, pero esta no emitirá sonidos inteligibles o que contengan algún significado.

Para iniciar los usuarios solo deben ingresar al sitio web riffusion.com y hacer clic en el botón rojo Play que se ubica en la parte superior derecha de la pantalla donde se empieza a escuchar la música autogenerada. Si se quiere un sonido en particular este se puede escribir (con palabras en inglés) en la barra central.

Generador de música Riffusion. (Captura)Generador de música Riffusion. (Captura)

El sonido solicitado entrará en cola de reproducción y podrá escucharse luego de unos segundos. Sin embargo, si los usuarios desean que sea inmediato, tendrán que hacer clic sobre el texto una vez que haya ingresado a la cola. El espectrograma se generará de inmediato y la reproducción empezará de forma automática.

Otra función dentro de la herramienta se presenta como un botón que se ubica al lado izquierdo de la barra de texto y que tiene la forma de un dado. Este randomizador genera e introduce un texto aleatorio que corresponde a un sonido o música en particular que puede ser generado por la inteligencia artificial.

Este modo aleatorio puede ser utilizado varias veces seguidas y no repite palabras ni frases de forma consecutiva. En el caso de que los usuarios no consigan pensar en una solicitud que puedan hacer a la inteligencia artificial, este botón puede ayudar a tener una idea sobre los sonidos que se pueden generar.

La evolución del sonido en casa

Escuchar música, películas y telenovelas ahora se puede hacer de manera más profesional porque se están adaptando ecosistemas que entregan un sonido más envolvente. Según Logitech, existen herramientas que se están instalando en casas, oficinas y sitios de descanso.

Por ejemplo, hay dispositivos de más de 14 horas de música continua con una carga completa y se puede enlazar 2 parlantes para tener sonido estéreo.

Wonderboom 3 es uno de los que más se habla debido a la opción 360 para espacios abiertos y modo outdoor que pone más alto el audio.

Compartir:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *