Scary latinamerican music

EN
Captura de pantalla del circuito levantado: bitwig, imágenes con las que meditar

Introducción

La sensación de lo inagotable produce un vértigo muy particular.
Todas esas cosas que llevan al infinito llevan al cero.
Está el vértigo dando vueltas en muchos lados.

Me pasó hace una semana, cuando hice andar un par de modelos de Machine Learning text2music: "A partir de ahora podría generar más exploración sonora del grado de complejidad que yo quisiera de la que puedo escuchar por el resto de mi vida".

Es un cambio de escala. Es un cambio de relación con mi computadora. Ahora este ente que lo entendía de cierto modo adquirió una nueva capacidad. Por la manera en que yo me relaciono con ella, si juego bien mis cartas yo también adquiero nuevas capacidades. Obviamente también adquiero problemas y desafíos.


" - Cómo negocio con el infinito?

- Es el mismo infinito de la página en blanco. "


Ahora se siente : hay estrellas nuevas en el cielo.

Y se sigue adelante con la tierra y cielo nuevos.

Meta

Meta (ie facebook) sacó un nuevo modelo para generación de sonidos (le dicen "música"). Venía con esto de entender mi tamaño en relación a la compu pero se aproxima con esto otra medición posible.
Meta quiere hacer música de manera automática.

Y obvio, estoy yo pero hay más cosas que pensar. Es interesante que estos modelos son denominados por les autores como generadores de "música" a secas. Por detrás tienen intenciones "generalistas" en cuanto a "estilos" quienes crean estos modelos - intentan abarcar el abanico de posibilidades dentro de La Industria Música.

Respecto a esto, cuál es el lugar de las expresiones sonoras de latinoamérica en este supuesto generador de "música"?

"A song from latinamerica"

> Audio generado usando el prompt "A song from latinamerica".

De por sí partamos que para interactuar con el modelo hay que escribir prompts en inglés. Ahora voy a explicar un poco qué es un prompt.

Generación (In)Condicional

Hay formas de crear con machine learning en donde no hay manera "fácil" de guiar la generación: hay que ponerse a estudiar cómo los hiperparámetros del modelo afectan al resultado final - y es muy dificil para nosotrxs humanos crear esa intuición. Esta manera no guiada es la que se llama Unconditional Generation, y hay modelos y arquitecturas como lo son RAVE para la creación sonora de esta manera. Otro paradigma diferente es el Conditional generation. musicGen, el último modelo (a la fecha) sacado por Meta (facebook) para la creación sonora es de este paradigma. Es un modelo que se puede "condicionar", "guiar", "conducir". Otro paradigma que atraviesa a musicGen es el paradigma multimodal: toma como entrada (para condicionar) un texto y nos devuelve un audio. musicGen además puede tomar una "melodía", pero no va a ser mi foco esta vez.

lobotomizar, adoctrinar, corregir una tendencia, sugerir nuevos caminos (en orden).

Un prompt es una oración - en lo que decimos "lenguaje natural". Esto que estás leyendo podría ser un prompt. Es una oración que se usa para "guiar" una generación usando machine learning.

Scary

me gusta el prompt "scary". En los modelos text2image con esa palabra sola podés generar cosas realmente horribles - tan grotescas que no me sentiría cómoda mostrando. Rápidamente, con pocas palabras, esos modelos se van a cuerpos desmembrados, mutilaciones, etc.

Me interesa ver cómo se da eso en los modelos text2music, y luego ver cómo conjuga eso con la "música latina" que genera - tan estereotipadamente feliz y tropical. Qué es una cumbia terrorífica? Qué es una chacarera que da miedo? Qué es música latinoamericana terrorífica?

Prompt: "scary music and screaming"

De por sí me costó conseguir que genere cosas realmente ruidosas, del terror o por el estilo. Tiende rápidamente a música corporativa.

progresión imágenes

En paralelo

Sabía que este modelo estaba finetuneado para hacer imágenes "etéreas", así que quería ver cómo manejaba a Leighton. Rápidamente me aburrí de lo hegemónico del resultado, y terminé pensando en formas de producir los errores que me gustan más: demasiados brazos, articulaciones dobladas de formas en que no debería, simetrías circulares, íconos religiosos.
Selección final de imágenes: Captura de pantalla del circuito levantado: bitwig, imágenes con las que meditar
Procesos: Captura de pantalla del circuito levantado: bitwig, imágenes con las que meditar Captura de pantalla del circuito levantado: bitwig, imágenes con las que meditar

progresión sonora

En paralelo

me gusta sentir el ruido soplándome en el oido.
Con mis auriculares se vuelve íntimo.

ts

ts
ts

no termina de formarse la palabra, o hay falta de señal o hay un exceso de información. en la comunicación, el cero pegó la vuelta sobre sí mismo.
Lo siento así. rompo de a capas, apilando filtros y modificadores por arriba de los instrumentos digitales, viendo qué emerge.

Vengo pensando también en lo que se rompe y lo que se arma entre lo roto. Este mes y hace unos diez años. La imagen que pienso es la jungla creciendo entre las ruinas de la catedral. Me imagino los múltiples brazos moviendose entre mis sabánas y arriba de la mesa de experimentos.

Empecé el armado basado en un estudio que había hecho hace unos meses de la sonoridad de arca en su disco homónimo. Es el siguiente:
Saqué los instrumentos que ya no me gustaban y empecé a romper el resto moviendo mi atención por distintas partes de la imagen.
El pecho.
Los dedos y los brazos.
Las tetas.
La cabeza.

Y ahora, en retrospectiva, pensando lo que hice, es imposible no pensarlo como un beso.


versión final

aux: otras versiones

versión 1

versión 2