108. (Agosto 2020) Música y entropía - II
Imprimir
Escrito por Paco Gómez Martín (Universidad Politécnica de Madrid)   
Sábado 01 de Agosto de 2020

1. Modelos musicales

Esta es la segunda entrega de la serie Música y entropía. En el primer artículo [Góm20] examinamos de manera general el concepto de entropía y su relación con la música y el análisis musical. Describimos allí el origen moderno de ese interés —el trabajo de Meyer [Mey56]— así como ideas recientes de la aplicación de la entropía al análisis musical. Consideramos tanto el potencial analítico de la entropía como sus limitaciones. En este artículo vamos a examinar la entropía en el contexto más general de los modelos musicales; en particular, vamos a hacer una recensión del artículo Minimum description length modeling of musical structure [Mav08]. Este artículo contiene una profunda reflexión sobre los modelos musicales, la complejidad de estos (aquí es donde entra la entropía), una propuesta de modelo, los modelos de descripción mínima, y una aplicación de estos al canto litúrgico griego.

1.1. Modelos

El artículo de Mavromatis abre con una frase contundente: ”el problema de la selección de los modelos es de suma importancia en todos los estudios empíricos”. La primera pregunta que surge aquí es: ¿qué es un modelo? El concepto de modelo aparece al final de un camino de conceptos previos que empiezan con el concepto mismo de fenómeno. Un fenómeno es cualquier suceso que puede ser observado. Por observable entendemos sucesos que pueden ser percibidos por los sentidos. Los fenómenos se pueden clasificar de muchos modos, pero hay dos grandes categorías: los fenómenos cuantificables y los fenómenos no cuantificables. Los primeros admiten una descripción numérica y los segundos, no. En el caso de la entropía, los modelos musicales van a ser con frecuencia cuantificables, esto es, se van a construir en base a los aspectos cuantificables de la música tales como la frecuencia de las notas, su altura, la duración, los grados de la escala, entre otros. Los modelos cuantificables suelen ser modelos matemáticos y computacionales. Un modelo matemático consta de los siguientes componentes:

(1) Una entrada, normalmente un conjunto de números, vectores u otras estructuras numéricas;
(2) Un conjunto de variables independientes, que están asociadas con la descripción conceptual del fenómeno bajo estudio. Con frecuencia, se relacionan con las causas del fenómeno en cuestión;
(3) Un conjunto de parámetros, los cuales sirven para refinar y ajustar el modelo;
(4) Un conjunto de variables dependientes, que representan el efecto observado en el fenómeno;
(5) Un conjunto de relaciones, que conectan las variables independientes y las variables dependientes. Estas relaciones se suelen dar en forma de funciones, aplicaciones, transformaciones u operadores;
(6) Una salida son el resultado de una observación particular.

Sin embargo, como dijimos arriba, el modelo matemático es parte de un proceso más general llamado modelización matemática. Los bloques constituyentes de una modelización matemática son:

(1) Formulación del problema. Se escoge un fenómeno de interés y se identifica un problema relativo a él. La formulación del problema también recibe el nombre de pregunta de investigación.
(2) Sistematización. Mediante un proceso de abstracción se seleccionan aquellos objetos y relaciones del fenómeno que son relevantes para el problema en cuestión. Este proceso se llama abstracción.
(3) Creación del modelo matemático. Los objetos y relaciones del apartado anterior se traducen a su vez en objetos y relaciones en el mundo y lenguajes matemáticos. En la creación del modelo matemático se tiene en cuenta el principio de parsimonia. Este establece que un buen modelo minimiza su complejidad y maximiza su poder explicatorio y predictivo. En otras palabras, siempre es preferible la explicación científica más simple que concuerde con la realidad. Este principio se conoce también con el nombre de principio de la navaja de Occam.
(4) Resolución del problema matemático. Uso de métodos matemáticos para resolver los problemas derivados de la modelización del fenómeno.
(5) Interpretación de los resultados y conclusiones en el contexto del fenómeno y del problema planteado.
(6) Evaluación de la validez del modelo por comparación con el comportamiento del fenómeno o bien con la teoría previamente consolidada acerca del mismo. Es de particular importancia la validación del modelo en cuanto a su capacidad de predicción.

Para más información sobre modelos, consultése el artículo de la Wikipedia Conceptual model [Wik20]. La figura de abajo resume la discusión anterior.

PIC

Figura 1: Modelización matemática

1.2. Evaluación de modelos

Normalmente, la calidad o bondad de un modelo se evalúa en función de cuán precisas son sus explicaciones y predicciones hechas a partir de los datos observados. Mavromatis da un paso conceptual hacia delante y propone evaluar la calidad de un modelo en base la capacidad explicativa y predictiva del modelo y además en base a la propia complejidad del modelo (a igual capacidad explicativa y predictiva, son más preferibles los modelos simples a los modelos complejos simplemente por pura aplicación del principio de parsimonia). La manera en que Mavromatis evalúa la complejidad de los modelos tomando prestadas ideas de la teoría de la información. En un modelo musical, la estructura musical está caracterizada por variables simbólicas que representan diversos aspectos de la música tales como la altura de sonido, duración, dinámica, armonía, etc. Un modelo trata de identificar esas variables y su aparición. Esto da lugar a su vez a lo que Mavromatis llama restricciones sintácticas, las cuales dependen del estilo musical. Los valores que toman las variables del modelo se presentan en forma de regularidades estadísticas, las cuales dan lugar a patrones de comportamiento musical. Un campo fecundo de investigación musical es la detección de esos patrones.

Volviendo al concepto de parsimonia, perseguiremos que nuestro modelo sea tan simple como sea posible y al mismo tiempo tenga una buena capacidad explicativa y predictiva. Un buen ajuste entre un modelo y los datos se llama bondad del ajuste. En la figura de abajo tenemos un ejemplo sencillo. Supongamos que en nuestro fenómeno observamos una variable dependiente y, representada en el eje Oy, como función de una variable independiente x, representada en el eje Ox. Los puntos negros son las observaciones; se trata de pares de puntos (x1,y1),…,(xn,yn), suponiendo n observaciones. La siguiente pregunta es qué tipo de relación hay entre las variables x e y (en nuestro ejemplo ambas son numéricas). Un modelo muy simple es el modelo lineal, que supone que hay una relación lineal del tipo y = ax + b (una recta), donde a,b son parámetros a determinar en función de los datos observados. La recta de color azul es la recta que mejor explica los datos, mientras que la recta roja arroja un peor modelo. La bondad del modelo es un valor que en la figura aparece como SSE; el mejor modelo es el que tiene este valor lo más bajo posible. Este valor mide los errores cometidos por el modelo al aproximar los datos y en la figura está dado por las distancias verticales de los puntos a la recta. La figura 3 muestra las tres situaciones.

PIC

Figura 2: Bondad del ajuste en modelos

Es posible construir modelos que se ajusten muy muy bien a los datos demasiado bien, reflejando idiosincrasias insignificantes, a base de añadir variables extra. Esto se llama sobreajuste. Esto ocurre cuando el modelo no acierta con el nivel adecuado de abstracción. Produce modelos excesivamente complejos. Lo contrario se llama subajuste: el modelo es pobre y se pierde características importantes del fenómeno. En la figura 3 (a) tenemos un caso de subajuste. El conjunto de datos, que claramente sugiere una forma curva, es aproximado por una recta. En la figura 3 (b) vemos una curva que pasa por todos los puntos observado y el ajuste es perfecto (comete error cero), pero este modelo requiere un alto número de variables independientes que no son parte esencial del modelo. Por último, la figura 3 (c) muestra un modelo más razonable, con pocas variables independientes y con un error de ajuste razonable.

PIC

Figura 3: Subajuste y sobreajuste (figura tomada de [Mav08])

2. Modelos de longitud de descripción mínima

El modelo propuesto por Mavromatis en su trabajo es un modelo de longitud de descripción mínima (LDM, de aquí en adelante). Este modelo es de tipo inductivo, esto es, se construye a partir de la observación de datos asociados al fenómeno bajo estudio. El modelo LDM no solo evalúa el ajuste de los datos, como los modelos clásicos, sino también evalúa la propia complejidad del modelo. Cualquier regularidad detectada en los datos se puede usar para comprimir ese conjunto de datos. Comprimir aquí significa codificar los datos observados de una manera más corta que si los datos se dejan sin comprimir. Cuantas más regularidades se observen en los datos, más se podrán comprimir estos. Por ejemplo, si los datos se pueden codificar a partir de símbolos del alfabeto A = {a,b,c,d}, la cadena C1 = aaaa se puede comprimir como a4, pero la cadena C2 = aabb se puede comprimir como a2b2, cuya compresión es más larga que a4. En este caso, la codificación de C1 tiene longitud 2 (dos símbolos para a2) y la de C2 tiene 4. El LDM mide la bondad de un modelo por la capacidad de comprimir los datos en base a sus regularidades y por la capacidad de comprimirse a sí mismo.

Un modelo LDM está constituido por varias piezas. Primero, hay un conjunto de datos D, típicamente obtenidos de la observación del fenómeno. En nuestro caso, consistirán en piezas musicales extraídas de algún corpus musical. A continuación, un modelo M que modeliza el fenómeno, en particular, los datos D. Después, una función de una codificación C, que transforma los datos en un cadena de caracteres tomados de un alfabeto (puede ser un conjunto de números, los bits 1 y 0, caracteres alfanuméricos, etc.). A continuación, una función LC que mide la longitud del código C. Por último, una función de descripción, que está dada por

L    (D,M  ) = L  (M )+ L   (D  | M )  total           C1        C2

donde C1,C2 son esquemas de codificación, el primero del modelo M y el segundo de los datos. La expresión D∣M significa la codificación de D según el modelo M. Las codificaciones tienen que tener la propiedad de ser únicas, esto es, dos datos distintos no pueden codificarse por la misma cadena. Esto asegura que se recupera correctamente la información cuando se pasa del código a los datos. En particular, para que esta propiedad se cumpla se requiere que ninguna codificación produzca una cadena que sea prefijo de otra; para más cuestiones técnicas de este tipo recomendamos al lector que consulte el apéndice del artículo de Mavromatis [Mav08].

En general, las mejores codificaciones asignan los códigos más cortos a los símbolos más probables o frecuentes. Esto introduce la idea de probabilidad en el modelo, ya que se hace el recuento de las cadenas más frecuentes en la codificación. Se sabe que siempre hay una codificación óptima que minimiza la esperanza de la longitud de la descripción dada por la distribución de probabilidad P(D∣M). Se llama código de Shannon-Fao. Su función de longitud es

LP(D  | M ) = - log2P (D | M )

En este punto interviene el teorema de Shannon, que establece que la esperanza mínima de la longitud de la codificación para la salida de un modelo probabilístico M con distribución P(x∣M) está dado por

      ∑HM  ≡     (- log2P (x | M ))p(x | M )      x∈X

donde X es el conjunto de símbolos de la codificación. La cantidad HM recibe el nombre de entropía.

La idea de Mavromatis es encontrar una función de codificación que se aproxime lo más posible a la cota impuesta por el teorema de Shannon. La función de codificación de Mavromatis se define como sigue. Sea una distribución de probabilidad pi sobre el conjunto de k símbolos y d un parámetro de truncamiento.

                       (           )             *          (d-+-k-+-1)!LP (pi,d) ≡ L (d) + log2      d!k!

donde L*(d) está definida por

L*(d) ≡ log2c + log2(d + 1)+ log2(log2(d + 1))+ ...

La L*(d) solo se suma sobre los términos positivos y por tanto la suma anterior es finita.

3. Modelos de Markov

A continuación hacemos una revisión breve de las cadenas de Markov, que es un tipo de modelos probabilísticos. Este tipo de modelos son muy comunes en música, como ya hemos glosado en otras entregas de esta columna. Mavromatis los usa en conjunción con su modelo LDM. Una cadena de Markov es un modelo de un fenómeno que tiene los siguientes componentes:

  • Un conjunto finito de estados {s1,…,sn};
  • Un conjunto de probabilidades constantes pij del estado si al estado sj; estas probabilidades reciben el nombre de probabilidades de transición.
  • Falta de memoria: Se cumple la condición de que la probabilidad de ir del estado si al estado sj solo depende del estado actual.

La matriz de transiciones es

s1 s2 s3
T = s1
                                                              (           )
                                                              (0.50.250.25)
                                                                0.3 0.3 0.4
                                                                0.2 0.5 0.3
s2
s3

Por ser los números pij probabilidades, las filas de esta matriz siempre suman 1. En la figura de abajo se ve un esquema que refleja la estructura de una cadena de Markov. Este tipo de diagramas, llamados diagramas de estado, son comunes para describir cadenas de Markov.

PIC

Figura 4: Una cadena de Markov de tres estados

La condición de falta de memoria aparece de manera más general en modelos más abstractos. Se puede pedir que la probabilidad de ir a un estado a otro dependa de un cierto número de estados previos. Por ejemplo, en la figura de abajo a la izquierda se tienen las probabilidades de un conjunto de tres notas entre sí (la, do# y mi♭). En este caso, hablamos de matrices de primer orden. A la derecha de la figura aparecen las probabilidades de continuación de las secuencias de dos notas para otro conjunto de notas diferente (la, do , sol). Ahora la matriz es de orden dos (depende de dos estados previos).

PIC

Figura 5: Cadenas de Markov aplicadas al análisis musical

4. Modelos de Markov de longitud de descripción mínima

Mavromatis aplica los modelos de Markov de longitud de descripción mínima al canto litúrgico griego. Se trata de una música en que letra y melodía se asocian por medio de reglas estilística tanto musicales como prosódicas. En un trabajo anterior [Mav05] Mavromatis demostró la importancia estructural de ciertas fórmulas arquetípicas melódicas o arquetipos melódicos en este tipo de canto litúrgico. Dichas fórmulas son patrones melódicos de entre 6 a 9 notas y que se pueden acomodar a diferentes patrones prosódicos, incluyendo la longitud y los patrones de acentuación de las palabras. En la siguiente figura se muestran esos arquetipos melódicos; en este caso son todas fórmulas cadenciales.

PIC

Figura 6: Fórmulas arquetípicas de la melodía en el canto litúrgico griego (figura tomada de  [Mav08])

En la figura se ha usado la siguiente convención: dos x significa sílaba acentuada y una x sílaba no acentuada.

Asociado a este estilo musical tenemos unas cuantas reglas que rigen la formación y la sintaxis de los arquetipos melódicos (las reglas sintácticas de las que hablábamos arriba):

R1 El sol final del arquetipo cae en sílaba acentuada.
R2 Si la sílaba final está acentuada, entonces se asigna al sol final. Si, por otro lado, la última sílaba acentuada está seguida de sílabas no acentuadas, entonces en general se le asigna al penúltimo fa. En dicho caso, la sílaba no acentuada siguiente se asigna al sol.
R3 Como máximo un sílaba acentuada puede intercalarse entre el sol inicial y la última sílaba acentuada del arquetipo. Si existe tal sílaba, el acento se asigna o bien al fa o al mi.
R4 Una vez que las sílabas acentuadas se han fijado según las reglas R1-R3, el número de sílabas no acentuadas en el medio se puede acomodar mediante inserciones o borradas de las notas necesarias.

El siguiente paso que da Mavromatis es construir la cadena de Markov. Empieza con un único estado s0 y calcula el total de LDM según las fórmulas que vimos antes. A partir de aquí empieza un proceso en que va añadiendo más estados; llega a hacer hasta 14 estados. En cada paso, calcula las probabilidades a partir de las frecuencias que encuentra en el corpus. En la figura siguiente se ve la cadena de Markov para 6 nodos; en la figura xx significa sílaba acentuada y x_ sílaba no acentuada.

PIC

Figura 7: El modelo MDL

En la tabla de abajo se ven los valores de LDM para los datos y el modelo así como el total de la LDM; nS se refiere al número de nodos de la cadena de Markov. El mínimo de la LDM total se alcanza con 10 nodos (marcado con un asterisco en la tabla).

PIC

Figura 8: El modelo MDL

De la ejecución del modelo sobre el corpus de canto litúrgico griego, Mavromatis obtiene las siguientes conclusiones:

  • El modelo de un estado identifica las frecuencias de cada nota.
  • El modelo de dos estados detecta el papel privilegiado de la nota sol como nota de referencia.
  • El modelo de tres estado capta el papel de las notas fa y la como vecinas de sol
  • El modelo de cuatro estados discierne entre el sol final e inicial.
  • El modelo de cinco estados identifica el papel de la nota mi. En este punto cada estado de la cadena de Markov tiene una definición en términos de altura bien definida.
  • El modelo de seis estados implementa la regla R1.
  • El modelo de 7 estados aprende el contorno sol-fa-mi-fa-sol.
  • El resto de los estados hasta el estado de 10 nodos incrementa progresivamente el aprendizaje de las reglas sobre las alturas.

Dado que la LDM mínima se alcanza en 10 nodos, se elige este modelo como el óptimo. Usar más nodos daría lugar a sobreajuste y usar menos nodos a subajuste.

 

Bibliografía

[Góm20] P. Gómez. Música y Entropía - I, julio de 2020.

[Mav05] Panayotis Mavromatis. A hidden Markov model of melody production in Greek church cant. Computing in Musicology, 14:93–112, 2005.

[Mav08] Panayotis Mavromatis. Minimum Description Length Modeling of Musical Structure. Journal of Mathematics and Music, 0:1–21, enero 2008.

[Mey56] Leonard Meyer. Emotion and Meaning in Music. University of Chicago Press, Chicago, 1956.

[Wik20] Wikipedia. Conceptual model, consultada en 2020.

 
Volver