25. (Mayo 2011) Distancia y similitud musical - I
Imprimir
Escrito por Francisco Gómez Martín (Universidad Politécnica de Madrid)   
Sábado 21 de Mayo de 2011

1. El concepto matemático de distancia

Uno de los conceptos fundamentales con que enseguida nos topamos en matemáticas es el de distancia. La distancia matemática no es más que la abstracción del concepto de cercanía y su cuantificación. Ambas, abstracción y cuantificación, son necesarias para objetivar muchos fenómenos que se encuentran en la práctica matemática. Inicialmente, la distancia se refería al término físico de medir una magnitud física. Pero pronto los matemáticos la aplicaron a otros muchos dominios fuera de la física. En este artículo vamos a examinar el concepto de distancia en el campo de la música, en particular, en el campo de la similitud melódica. Veremos que la formalización del concepto de distancia de similitud melódica implica dificultades que hay que tratar con sumo cuidado, siendo la validación perceptual probablemente la de más envergadura.

La generalización de la distancia física en matemáticas recibe el nombre de métrica, especialmente en geometría. Nosotros usaremos ambos términos como sinónimos. Dado un conjunto A, que puede ser lo abstracto y arbitrario que se quiera, una métrica es una aplicación d : A × A → [0,∞), que verifica las siguientes propiedades:

  1. Positividad de la métrica: d(x,y) ≥ 0, para todo par x,yA
  2. d(x,y) = 0 si y solo si x = y.
  3. Simetría: d(x,y) = d(y,x).
  4. Desigualdad triangular: d(x,z) ≤ d(x,y) + d(y,z).

En la sencilla y juguetona recta real ℜ, la distancia entre dos números se reduce al conocido valor absoluto:

d(x, y) = x - y

donde x,y ∈ ℜ. En ℜ2, la distancia es la longitud del segmento que une dos vectores v1 = (x1,y1), v2 = ( x2,y2):

Bien conocido es que está fórmula proviene del teorema de Pitágoras y que la distancia d(v1,v2) es la hipotenusa del triángulo rectángulo formado por los puntos (x1,y1), (x2,y1) y (x2,y2). La generalización de la distancia al pomposo y vertical espacio ℜn, de n dimensiones, de esas que no podemos ver, solo colegir, es:

donde v1 = (x1,…,xn), v2 = (y1,…,yn). En estos espacios de altas dimensiones se suele hablar de distancia euclídea. Pero la fórmula anterior es solo una de las muchas maneras de definir distancias en ℜn. Tenemos las siguientes:

  • La distancia L1: d(v1,v2) = ni=1xi - yi.
  • En general, la distancia Lp: d(v1,v2) = (∑ni=1xi - yip)1∕p.
  • La llamada norma infinito L: d(v1,v2) = limp→∞(∑ni=1xi - yip)1∕p = max(x1 - y1,x2 - y2,...,xn - yn).

La distancia en el espacio euclídeo es la longitud de la trayectoria más corta y este hecho se puede usar para generalizar el concepto de distancia a otros espacios más complicados, como es una esfera, donde la distancia se da por trayectorias geodésicas. En ese caso la distancia se calcula a través de fórmulas de longitud de arco. El concepto de distancia se generaliza a espacios geométricos no euclídeos a través de dichas fórmulas.

Dado que la distancia proviene de un concepto tan general como el de cercanía, aparece en muchísimos más áreas de las matemáticas que la geometría, por más que esta área sea vasta. Tan ubicuo es el concepto de distancia que hay un libro de título Dictionary of distance [DD06], Diccionario de distancias, donde los autores hacen un recorrido por las áreas de la matemática en que la distancia tiene un papel relevante. Lo recomendamos vivamente al lector interesado.

Así que como muestra de la ubicuidad e importancia vamos a enumerar a modo de telegrama, de fogonazo conceptual, de repaso ufano, las áreas en que aparece la distancia defendiendo sus fueros.

DISTANCIAS Y MÉTRICAS

Espacios topológicos, m-métricas, distancias topológicas,

Métricas en conjuntos arbitrarios

NORMAS

Distancias geodésicas, geometría proyectiva y geometría afín, métricas riemannianas

Teoría de la información

Métricas en superficies, métricas intrínsecas,

distancias en nudos, distancias en cuerpos convexos Métricas en grupos, métricas en relaciones binarias, métricas en mallas

Distancias en cadenas, distancias en permutaciones

Métricas en polinomios, métricas en matrices,

métricas en espacios funcionales, métricas en operadores lineales

Distancias entre variables aleatorias, distancias entre distribuciones

Distancias en grafos ponderados, distancias en árboles, distancias entre códigos

Distancias de SIMILITUD, distancias de correlación

Distancias entre planificaciones de movimiento, distancias entre autómatas

Distancias MOEA

Métricas digitales

Distancias de Voronoi, distancias entre imágenes, distancias entre sonidos, distancias entre redes

Distancias entre genes, distancias entre proteínas

Distancias en Química, distancias en Geofísica, distancias en Astronomía

O más gráficamente:


distancias similitud

Figura 1: El concepto de distancia en diversas áreas de las matemáticas.


2. Distancias en la música

Después de observar cuán flexible y ubicuo es el concepto de distancia, nos preguntamos cómo aparece en la música. En general, todo lo que se refiera a distancias perceptuales se sale de la intuición. Abajo tenemos tres sonidos, llamémosles S1, S2 y S3. Pongamos que la frecuencia de S1 son x hercios. Hacemos saber al lector que las frecuencias de S2 y S3 son, respectivamente, 2x y 3x. Tenga ahora el lector la amabilidad de pinchar sucesivamente en los sonidos de la figura de más abajo (súbase el volumen si es necesario).


S1
S2
S3

Figura 2: Tres sonidos diferentes.


¿Le ha parecido al lector que había más distancia entre S1 y S2 que entre S2 y S3? ¿Quizás ha sido al revés? ¿O aún mejor no hay diferencia entre los dos saltos? Al fin y al cabo la diferencia en frecuencia entre cada par es constante.

El lector -acaso un poco confundido- dirá que el salto entre S1 y S2 le ha parecido mayor que entre S2 y S3. Y, en efecto, así es. Nuestro oído, acorde con la famosa ley de Weber-Fechner, percibe la relación entre un estímulo y su percepción siguiendo una función logarítmica. Esto explica que el salto de S1 a S2, de proporción 2 : 1, se perciba como mayor que el de S2 a S3, de proporción 3 : 2, que es menor.

El problema de la similitud musical -y de la obtención de una distancia- es de los más complejos e importantes. Como Pampal [PFW05] describe con acierto “desgraciadamente, el problema de la similitud melódica es muy complejo, multidimensional, fuertemente dependiente del contexto y de muy mala definición”. La similitud musical es un fenómeno que comprende tres niveles diferentes: el físico, el musical y el psicosocial. En el físico se estudian conceptos de acústica, relacionados con los aspectos físicos del sonido, tal como frecuencia fundamental, armónicos, energía, espectros, duraciones, etc. En el musical, se analizan variables como intervalos (como frecuencias percibidas), ritmos, métrica, armonía, conducción de voces, forma musical, fraseo, etc. Por último, en el nivel sociocultural se examinan variables como la emoción, la motricidad, el carácter, así como aspectos socioculturales. Un modelo de similitud melódica que aspire a ser fiel a la similitud humana ha de tener en cuenta estos tres niveles fenoménicos. Aucouturier y Pachet [AF04] advierten de que hay una limitación intrínseca si solo se modeliza la similitud con variables pertenecientes a uno solo de esos niveles; es necesario tener en cuenta todos. Estos autores hacen estas observaciones porque en el pasado se construyeron muchos modelos basados en la pura descripción física del sonido y, a pesar de su creciente complejidad, no conseguían los resultados esperados. Recientemente, se han empezado a incluir variables de los niveles musical y psicosocial.

En esta serie de artículos no vamos a estudiar la similitud musical sino solamente la similitud melódica, que es un problema más pequeño pero no necesariamente más fácil. Perseguimos diseñar una distancia matemática de similitud melódica que refleje lo más fielmente posible la distancia de similitud melódica que tenemos los humanos. Veamos cómo.

3. Similitud melódica

Empezaremos por definir formalmente lo que es una medida de similitud melódica, término que como veremos difiere ligeramente del de distancia de similitud melódica. Seguiremos en parte la exposición de Müllensiefen y Frieler [MF04]. Una medida de similitud melódica se define como una aplicación σ : M → [0, 1], donde M es el espacio de melodías, con las siguientes propiedades matemáticas:

  1. σ(m1,m1) = 1. La similitud de una melodía consigo misma toma el valor 1.
  2. σ(m1,m2) = 1 si y solo si m1 = m2. De hecho, ese valor no se alcanza en ninguna otra situación.
  3. σ(m1,m2) = σ(m2,m1). Propiedad de simetría.

Sin embargo, dado que estamos en presencia de un fenómeno musical, la anterior definición no es del todo satisfactoria. Por ejemplo, dos melodías transpuestas se oyen claramente como la misma. Acorde a la definición anterior, tendría medida positiva, lo cual contradice la intuición musical. Definimos en M, el espacio de melodías, una relación de equivalencia: m1 está relacionada con m2 si y solo si m2 es una transposición por altura, por tiempo o por un cambio de tempo (velocidad) de m1. Transposición por altura quiere decir que las alturas de las notas de m1 y m2 difieren en una constante; transposición por tiempo significa que dos melodías iguales tocadas en instantes diferentes se consideran iguales; cambio de tempo significa que una melodía tocada a diferente tempo se considera la misma que tocada a su tempo original (esto último es dentro de unos límites razonables, pues se sabe que el tempo puede afectar a la percepción melódica).

El espacio de las medidas de similitud es convexo. Dado un conjunto de medidas σ1,…,σn, y un conjunto de pesos ω1,…,ωn tal que ni=1ωi = 1, la función

              ∑n σ *(m  ,m  ) =     w σ (m  ,m )      1   2         i i   1  2               i=1

es una medida de similitud.

Una distancia de similitud cumple las propiedades enunciadas en la sección 1 al principio del artículo. Es bastante frecuente trabajar con distancias que cuentan el número de diferencias entre dos melodías en lugar de las similitudes, que puede ser más abstracto. Estas distancias se llaman de disimilitud. A partir de una distancia de disimilitud d se puede definir una medida de similitud σd sobre cualquier espacio finito de melodías como sigue:

σd(m1,m2) = 1 - d(m1,m2)/δ

donde δ = max{d(a,b)∣a,bM}. Se puede comprobar que si d cumple las propiedades de invariancia musical, entonces σd es una medida de similitud.

Para que el lector sea consciente de la dificultad del problema de la similitud melódica, considérese las conocidas variaciones de Mozart K. 265 sobre el tema popular Ah, vous dirai-je, Maman. La melodía es diáfana, compuesta por intervalos simples y con una estructura sencilla, una subida y una bajada en la primera y dos bajadas en la segunda frase. En la figura 3 se puede ver la partitura; si se pincha en la partitura suena el tema completo, con la mano izquierda.


Figura 3: El tema principal de las variaciones K. 265 de Mozart.

Figura 3: El tema principal de las variaciones K. 265 de Mozart.


La primera variación consiste en una versión ornamentada en corcheas del tema principal. Ahora las subidas y bajadas, casi todas por grados conjuntos, se multiplican y el oyente se da cuenta de esa fragmentación de la dirección melódica. También aparecen pequeñas dominantes secundarias que sugieren refuerzos de los grados V y VI (sol y la). En la figura 4 tenemos la partitura (de nuevo pinchando en la figura se puede oír la variación):


Figura 4

Figura 4: La primera variación del K. 265 de Mozart.


Por último consideremos la variación V, que consiste en cambios de figuración rítmica. Mozart pasa de las dos negras del tema a la figura negra, silencio de corchea y corchea. Más tarde esta figura a un puro contratiempo. Desde el punto de vista de las alturas, aparecen más intervalos cromáticos. Se puede ver la partitura en la figura 5.


Figura 5

Figura 5: La quinta variación del K. 265 de Mozart.


En el siguiente vídeo se puede ver una interpretación de las variaciones completas. En el minuto 2:05 está la quinta variación.

Las preguntas son las siguientes: ¿Cuál de las dos variaciones, la I o la V, es más similar al tema principal? ¿Cómo se cuantifica tal diferencia? ¿En que variables se fundamenta la respuesta, cualquiera que sea el resultado? ¿Cómo obtener un modelo de similitud melódica que sea fiel a la medida humana de similtud?

4. Conclusiones

Concluimos aquí este primer artículo sobre la distancias matemáticas y la similitud melódica. Primero, hemos repasado algunos conceptos matemáticos de distancia. Después hemos expuesto cómo se define en música la distancia de similitud melódica. En el siguiente artículo glosaremos las distancias más importantes y explicaremos cuál es la razón de ser de cada una. En el tercer y último artículo abordaremos la peliaguda cuestión de la validación perceptual de todas esas distancias.

Bibliografía

[AF04] J.-J. Aucouturier and Pachet F. Improving timbre similarity: How high is the sky? Journal of Negative Results in Speech and Audio Sciences, 1(1), 2004.

[DD06] E. Deza and M. Deza. Dictionary of Distances. Elsevier Science, 2006.

[MF04] D. Mullensiefen and K. Frieler. Cognitive adequacy in the measurement of melodic similarity: Algorithmic vs. human judgments. Computing in Musicology, 13:147–176, 2004.

[PFW05] Elias Pampalk, Arthur Flexer, and Gerhard Widmer. Improvements of audio-based music similarity and genre classificaton. In ISMIR’05, pages 628–633, 2005.

 
Volver