3. (Abril 2006) El caso de los despidos de la empresa Westvaco
Imprimir
Escrito por Juan Antonio García Cruz (Universidad de La Laguna)   
Sábado 01 de Abril de 2006

(publicado en Uno. Revista de didáctica de las matemáticas 23, 2000 y Cuadernos del Ateneo de La Laguna 10, 2001)

Mediante un diálogo, en dos actos, se escenifica una situación realista que sirve para ilustrar una forma de hacer estadística que no suele presentarse al alumnado de bachillerato. La situación es ficticia pero no así los datos ni las ideas que surgen durante la escenificación. Una de las mayores dificultades que tienen los alumnos de bachillerato, en inferencia estadística, es la formulación y contraste de una hipótesis. En la mayoría de los libros de texto, incluso en la introducción al tema, se presenta la hipótesis ya formulada y se solicita un contraste con el modelo de azar que proporciona la distribución Normal. Considero que solo resolviendo tales ejercicios, un alumno no será capaz de encontrar las respuestas a preguntas como: ¿Qué es una hipótesis estadística? ¿Cómo se formula? ¿Cómo se valida? ¿Qué es lo que prueba un test de hipótesis? Para todo test de hipótesis se fija un nivel de significación, ¿qué nos indica? ¿Cómo se fija? La usual presentación del tema en los libros de texto, y podríamos concluir que también en las clases de bachillerato, es tal que el alumnado casi nunca tiene que tomar ninguna decisión. Por ejemplo: formular una hipótesis, elegir el nivel de significación y decidir sobre el resultado o conclusión derivada de la aplicación del test.

El siguiente diálogo presenta una situación real que tiene ciertas ventajas frente a las situaciones presentes en los libros de texto. La población de partida tiene pocos datos, las muestras son de tamaño tres y se pueden enumerar una a una. El objetivo es elegir un estadístico, la media muestral, y construir una tabla para la función de distribución de la variable aleatoria asociada. Por último tenemos el nivel de significación del test de hipótesis. Su significado se presenta al final del diálogo mediante un acto que consiste en realizar un sorteo.

Hemos elegido el recurso de un diálogo pues hace mucho más vívida la situación de confrontación que siempre aparece en un test de hipótesis y que no suele explotarse. El modelo de Neyman-Pearson para los test de hipótesis estadísticos, enfrenta dos hipótesis: la nula y la alternativa. La evidencia estadística se utiliza como prueba en contra de la hipótesis nula. Esta teoría matemática tiene como referente más cercano una disputa en una corte de justicia. Sin embargo, en la dramatización se ha elegido un momento anterior, el que corresponde a la preparación de un ataque contra la hipótesis nula tomando como evidencia un dato real, la composición de la muestra de los tres trabajadores despedidos.

 

Primer acto.

Los hechos

A finales de los años 80,
la empresa WESTVACO procedió a una regulación de empleo.
Esta se realizó en dos fases.
Después de la primera fase de la regulación,
las edades de los empleados que permanecieron contratados eran:
25, 33, 35, 38, 40, 55, 55, 55, 56, 64.
En la segunda fase,
la empresa despidió a tres empleados de edades 55, 55, 64.
El comité de empresa argumentó que se había incurrido en discriminación
por edad, en los despidos.
La empresa afirmó que los tres empleados despedidos
habían sido elegidos al azar y no por su edad.
El comité de empresa puso el caso en manos de un bufete de abogados.

En el bufete de los abogados del comité de empresa

Abogado defensor (Ad): Señores, aunque no veo cómo rebatir la afirmación de la empresa, nuestro objetivo será diseñar una estrategia para convencer al jurado que el despido ha sido improcedente.
Ayudante-1 (A1): Estoy de acuerdo y, además creo que tenemos ganado el caso. A la vista de los datos, creo que la mejor estrategia será preparar la defensa basándonos en una prueba estadística.
Ayudante-2 (A2): Explícate, porque no veo tan claro que podamos rebatir la afirmación de la empresa.
A1: Observa la muestra de tres empleados elegidos por la empresa. Son tres de los cinco de más edad.
A2: Me colocaré en la situación de los abogados defensores de la empresa. Prueba de que no hemos hecho discriminación por edad es la propia composición de la muestra. Hay dos de 55 años. En la población, sólo ese valor se repite y además tres veces. Luego tiene más probabilidades de aparecer en una muestra aleatoria que ninguno de los otros valores. De ahí que haya dos en la muestra. Además, 56 no está en esa muestra, y 64... Bueno, 64 tuvo mala suerte.
Ad: Muy bien A2. Me parece A1 que tu enfoque no nos llevará por buen camino. Veamos, recordemos las matemáticas que aprendimos en el instituto. ¿Qué probabilidad hay de elegir la muestra 55, 55, 64?
A2: ¿Pero... es que esas matemáticas servían para algo?
A1: Claro. ¡Ya está!
Ad y A2 miran a A1 con poco convencimiento.
A1: Supongamos que es cierto lo que afirma la empresa. Es decir, demos por hecho que han elegido la muestra al azar.
Ad: Me sorprendes, A1, pero sigue, sigue. Me gusta la hipótesis.
A1: Bien. ¿Cuál es la probabilidad de que bajo tal hipótesis se dé la muestra 55, 55, 64?
A2: Empiezo a sentirme mal, muy mal. Yo estudié el Bachillerato de Ciencias Sociales, y las matemáticas nunca fueron mi fuerte. Más aún, no recuerdo ninguna de las fórmulas...
A1: Claro. Te las aprendiste de memoria.
Ad: Alto. Dejemos los viejos y malos recuerdos a un lado. Volvamos al caso. Para los 60.000 dollares que les pago al año, me están ustedes haciendo un buen trabajo... Creo que el auxiliar fue bastante bueno en matemáticas. Esperemos que recuerde mejor que ustedes las matemáticas que nunca aprendieron.
Entra el auxiliar (Ax), que gana 25000 $ al año, y se le expone el problema. Después de un rato.
Ax: Ya lo tengo. El total de muestras de tres elementos que se pueden extraer de un conjunto de diez elementos viene dado por el número combinatorio

Image

Ad: ¿Tantas?
Ax: Sí. Eso es lo que resulta de aplicar la fórmula.
Ad: Y...¿Está usted seguro que es correcta?
Ax: Bueno. Creo que sí.
Ad: Sigamos. Luego, la probabilidad de elegir la muestra 55, 55, 64 es... ¡UNA entre CIENTOVEINTE! ¿No?
Ax: Pues no.
Ad: ¿Cómo que no?
Ax: Creo que hay..., a ver... , dos. No. Tres muestras con la misma composición.
A2: No, si al final resultará que la empresa tiene razón. ¡Vaya un caso que hemos elegido!
Ad: Paciencia A2. Explícamelo (dirigiéndose a Ax).
Ax: Hay tres empleados con la misma edad, 55 años, y sólo uno de 64 años. ¿De acuerdo?
Ad: Hasta aquí, nada nuevo.
Ax: Supongamos que los tres empleados, con edad 55 años, se llaman Albert, Barnes y Courant.
Ad: No sé que tiene que ver el caso con los nombres de los empleados.
Ax: Espere. Déjeme terminar. Construyamos una muestra como la elegida por la empresa utilizando los nombres, en vez de las edades. ¿De acuerdo?
Ad: Ya empiezo a ver lo que hay de nuevo. Siga.
Ax: Por ejemplo: Albert, Barnes y el señor de 64 años.
A2: ¿Y ese señor no tiene nombre?
Ax: Seguro que sí, pero no viene al caso.
Ad: Por favor, A2, conténgase. Siga, Ax.
Ax: Ya tenemos una. Ahora cambiamos Barnes por Courant y tenemos otra distinta: Albert, Courant y el señor de 64 años. Por último, excluimos a Albert y formamos la muestra con Barnes, Courant y ...
A2: El señor, sin nombre, de 64 años. ¿No?
Ax: Exacto.
Ad: Ya lo veo. ¡TRES DE CIENTO VEINTE! ¿Hay alguna otra muestra que tenga esa frecuencia?
Ax: Pues...creo que no.
A1: No importa, mientras no nombremos a los empleados. Entonces está claro que la probabilidad de elegir al azar 55, 55 y 64 es muy pequeña. Luego la muestra no se ha elegido al azar.
A2: ¿Cuál es la probabilidad de elegir la muestra 25, 33 y 35? UNA DE CIENTO VEINTE, ¿No?. La misma. Un buen contra argumento para la defensa de la empresa.
Ax: No podemos eludir que hay tres posibles muestras como la elegida por la empresa.
Ad: No importa. A2 tiene razón. Nuestro argumento sería rebatido fácilmente por la defensa de la empresa.
A2: Se me ocurre... ¿Y si en vez de mirar la composición de la muestra calculamos su media de edad?
A1: ¿La media? ¿Para qué?
A2: ¿Cuál es la media de edad de los diez empleados?
Ax: (Calculando) 45,6 años. La de la muestra elegida es... 58 años.
A1: ¡Bastante más! Luego...serviría.
Ad: ¿Serviría qué? Tenemos tres muestras con esa misma media. Volvemos a lo de antes.
A1: Espera... ¿Y si aplicamos un test de hipótesis?
A2: ¡No, por favor! Me niego a salir a la pizarra.
Ax: Sí. Creo que sería lo más adecuado.
A1: Necesitamos a alguien que nos ayude. Yo recuerdo algo relacionado con las tablas de la ... Normal, creo.
Ax: Sí, algo así. Pero creo que aquí no serviría...
Ad: Yo estudié el BUP y estoy totalmente perdido. Necesitamos un asesoramiento profesional.
Ax: Un amigo mío es matemático. Podría servir.
Ad: ¿Profesor universitario?
Ax: No. Trabaja en una fábrica de cerveza.
Ad: ¿En una fábrica de cerveza? ¿Qué hace un matemático en una fábrica de cerveza?
Ax: Creo que controla la calidad.
Ad: Un hombre práctico... Creo que nos servirá.
Ax: Tendría que ponerme en contacto con él y ver cuándo nos puede ayudar.
Ad: De acuerdo Ax. Pero esto corre prisa. Que sea lo antes posible.

Segundo acto.

Dos días después...

En el bufete esperan los mismos personajes del acto anterior. Suena el timbre y entra el matemático.
Ad: Buenos días. ¿Señor ...?
Matemático(S): El Estudiante. Por favor, llámeme El Estudiante .
Ad: ¿El Estudiante? Pero ¿no es usted Licenciado en Matemáticas?
(S): Sí, pero mi empresa no me deja utilizar mi verdadero nombre en tareas de asesoramiento externo.
Ad: El Estudiante. Está bien. De acuerdo. Me imagino que ya conoce el caso. ¿Es así?
S: Sí. Así es. Ax me ha puesto al corriente.
A1: Señor Estudiante, he repasado las matemáticas y creo que, aplicando un test de hipótesis como el que me enseñaron en el instituto, resolveremos el problema.
S: El test que le enseñaron en el instituto utiliza la distribución Normal. Aquí no vale.
A2: Ya me extrañaba a mí que lo que me enseñaron en el instituto sirviera para algo.
A1: ¿Cómo que no? ¿Entonces...?
Ad: Muy fácil me parecía a mí. Menos mal que Ax ha llamado a su amigo.
A1: Pero espere, llevo dos días haciendo cálculos con la ayuda del hijo de un amigo que está estudiando 2º de Bachillerato de CCSS. Primero construimos todas las muestras y calculamos todas las medias. Como la variable tiene muchos valores distintos, los agrupamos por intervalos. Mire este gráfico. Es como una Normal. Tiene forma de campana. ¿No?

Image

S: Sí, tiene forma de campana. La forma acampanada es necesaria, pero no es suficiente para garantizar que la distribución sea una distribución Normal. Mejor dicho, para que se pueda aproximar a una distribución Normal.
A2: ¿Entramos en clase de lógica?
Ax: Yo también hice cálculos y el gráfico de la distribución, sin agrupar por intervalos, no se parece en nada a la Normal.

Image

S: Claro. Manipulando adecuadamente los datos se puede confundir a un auditorio sin conocimiento.
Ad: Un momento. Imagine que la defensa de la empresa muestra el gráfico de Ax. Los argumentos de A1, aunque no los entiendo, se irían al garete. ¿O no?
S: Totalmente.
A2: Definitivamente yo me retiro.
Ad: Queda usted suspendido de empleo y sueldo A2. ¿Qué podemos hacer S?
S: El trabajo que ha hecho A1 se puede aprovechar.
A2: ¿Sí, no me diga?
S: Sí. Se puede aprovechar.
Ad: Sea más explícito por favor.
S: Tenemos una población: las edades de los empleados. Tenemos la distribución de medias muestrales de tamaño tres. Tenemos la media y la desviación típica de esa distribución. Sin embargo, tal distribución nos es desconocida. ¿De acuerdo? Pues bien. ¡Construyamos una tabla de números críticos!
A2: ¿Crí... qué?
Ad: A2 usted se había retirado.
A2: Estoy de vuelta.
Ad: Sin empleo y sin sueldo.
S: En el instituto, dado que utilizaban la Normal como modelo probabilístico teórico para el contraste de hipótesis, nos proporcionaban una tabla con los valores críticos y probabilidades correspondientes, la tabla Normal tipificada. Pero aquí no vale. Entre otras cosas, la población es discreta y tiene muy pocos elementos.
A2: ¡Ah! Con que esos son los números críticos. En situación crítica me encontraba yo cada vez que tenía que utilizarla. Me vuelvo a ir y esta vez para siempre.
Ad: Sí por favor, váyase de una vez para siempre. Siga, S, por favor.
S: ¿Tienen un ordenador con hoja de cálculo?
A2:¿Creía que a los matemáticos les bastaba sólo con el papel...?
Ax: En mi mesa tengo un ordenador.
S: Manos a la obra.

Algo más tarde...Vuelven S y Ax con una tabla

Image

S: Veamos, señores. Primero les explicaré la tabla. He utilizado colores para que la explicación sea mucho más clara.
A2: ¿Colores en matemáticas? Siempre pensé que los matemáticos contemplaban el mundo en blanco y negro.
S: Los números en negro corresponden a los valores que puede tomar la media muestral de tamaño tres. Son los calculados por A1, sin agrupar por intervalos. La distribución de medias muestrales tiene una media igual a 45,6. Los números en azul, llamados valores críticos, corresponden a la distancia (tomando como unidad de medida la desviación típica), entre cada media muestral y de valor promedio 45,6. Los números negativos, como pueden ver, corresponden a valores menores y los positivos a mayores. Por último los números en rojo representan la probabilidad acumulada. Es decir, para 31 (media muestral) tenemos 0,01, que es la probabilidad de extraer una muestra cuya media de edad sea igual que 31; para 32 la probabilidad es también 0,01, pero sumando las dos tenemos 0,02. Así, en la tabla, cada probabilidad corresponde a un valor de la media muestral menor o igual al número correspondiente, en negro, a la derecha.
A2: No me veo, ni veo a nadie de este bufete, explicando la tabla al jurado.
S: Espere. Déjeme continuar. Vamos a elegir un número más avanzado de la tabla. A 40 (valor media muestral) corresponde una probabilidad (acumulada) de 0,21. En otras palabras, la probabilidad de extraer, al azar, una muestra cuya media sea menor o igual que 40 años es 0,21 ( o también 21 de 100).
Ad: Me gusta. Pero A2 tiene razón. ¿Cómo vamos a utilizar la tabla en el juicio?
S: No será necesario utilizar la tabla en el juicio. No desespere. Déjeme terminar la explicación y, al final, les diré lo que creo que deben hacer. Recuerden que se trata de sembrar la duda, entre el jurado, sobre si la empresa eligió o no al azar la muestra 55, 55, 64.
Ad: Adelante.
S: La muestra elegida por la empresa tiene de media 58 años. ¿De acuerdo? La pregunta clave es: ¿Cuál es la probabilidad de elegir una muestra cuya media sea menor que la elegida por la empresa? Leamos en la tabla..., 0'95.
Ad: Ya lo veo. Y lo que veo me gusta.
A1 y A2 (al unísono): A mí también.
S: Es decir, 95 veces de cada 100 que extraigamos, al azar, una muestra de la población dada, es de esperar que su media sea menor que la media de la muestra elegida por la empresa. O también, una muestra con media mayor o igual a la elegida por la empresa sólo la obtendríamos 5 veces de cada 100 que realicemos el experimento. En resumen, 1 vez de cada 20.
Ad: Bien. Muy bien. Empiezo a ver lo que haremos en la sala del juicio.
S: ¿Está usted pensando lo mismo que yo?
Ad: Prepararemos 20 bolsas. Cada una contendrá diez papelitos y en cada papelito una de las diez edades de los empleados de la empresa y pediremos a 20 asistentes que extraigan, a ciegas, tres números de su bolsa.
S: Exacto. En el peor de los casos, el valor de la media de las muestras extraídas será igual o mayor que 58 sólo una vez.
Ad: ¿Podría ocurrir más de una vez?
S: Sí. Con la Estadística no hay nada totalmente seguro. Pero es bastante improbable que se dé ese caso.
Ad: El espectáculo está garantizado. Esta será nuestra estrategia para probar que la empresa no eligió al azar la muestra. Muchas gracias señor Estudiante. Le estamos profundamente agradecidos. Si ganamos el caso, repartiremos los beneficios con usted.

Una vez se ha ido El Estudiante

Ad: Interesante el personaje. ¿Cómo es que no se dedica a las matemáticas? A propósito Ax, en cuanto al personaje... ¿cómo es que lo conoce?
Ax: Estudiamos juntos, pero yo no pasé de primero en la Facultad de Matemáticas. Además, El Estudiante sí se dedica a las matemáticas, pero en una fábrica de cerveza. Para algunos de sus colegas es un matemático que pierde el tiempo fabricando cerveza, mientras que para otros es un fabricante de cerveza que hace matemáticas.
Ad: De cualquier forma, nos ha dado una buena lección de cómo aplicar la Estadística.
A2: En el instituto nunca vi nada parecido. Aquello sí que no tenía sentido, fórmulas y más fórmulas. Si fabrica cerveza tan bien como hace matemáticas... ¡La cerveza debe ser excelente!

FIN

Epílogo

W.S. Gosset (Student) tenía un gran problema. A su cargo estaba el control de calidad de la cerveza que producía la fábrica Guinnes en Dublin. ¿Cómo mejorar la calidad? Esa era la principal preocupación de la empresa que le había contratado como químico que era, además de matemático. Disponía de observaciones de un gran número de muestras pequeñas pero, estos valores no se ajustaban a la distribución Normal. Además no conocía la desviación típica de la distribución de medias muestrales. La variación observada en los valores de una muestra a otra era muy grande. ¿Cuál es la distribución del estadístico Image? fue la pregunta clave que se hizo. Sus investigaciones posteriores le condujeron a formular y calcular la tabla de números críticos de la distribución que, más tarde, sería conocida como la t de Student.

El método estadístico proporciona las técnicas que sirven para su aplicación a problemas prácticos. Pero las técnicas por sí solas, sirven de poco si no se dispone de un buen conocimiento del método. Sólo con las técnicas se puede construir un curriculum. Entonces la labor del profesor será enseñarles las técnicas a los alumnos y proponerles ejercicios para verificar la adquisición de las mismas. Si las técnicas son pocas, la memoria puede almacenarlas por un período de tiempo suficiente, quizás hasta el próximo examen del tema, pero no mucho más. Si las técnicas son muchas, y para los alumnos muchas es todo aquello que pase de dos, la memoria no resiste tal esfuerzo en la mayoría de los casos. Así, se confunde una estimación de la media muestral con un intervalo de confianza de la media poblacional o también se utiliza el valor de la media de una muestra como valor de la hipótesis nula en un test de hipótesis. Total que más da. ¿Acaso no son medias también? Sí, todas son medias pero cada una tiene un significado diferente, aclararía el profesor. Los alumnos saben, por experiencia propia, que porque lo diga el profesor no se aclara casi nada. Un problema, un auténtico problema, pone a prueba las técnicas y los significados de los términos que se utilizan en las técnicas. Un problema como el que sirve de pretexto para este artículo tiene todas esas ventajas, siempre que el profesor no se dedique a contar la historia. Hay que recrearla en clase. Los alumnos deben hacer los cálculos y discutir los significados. ¿No tengo tiempo? A Student una respuesta como esa le habría costado el puesto de trabajo. Para la creatividad siempre hay tiempo y más si es a costa de suprimir rutina. Sobre todo porque es mucho más gratificante. ¿Que la clase se puede convertir en un caos? Sí, con toda seguridad. Sólo conozco un lugar donde no suele haber ruido y todo está perfectamente ordenado, pero por desgracia no suele haber nadie vivo. ¿Y el rigor? En su sitio. El rigor es algo inventado por los matemáticos para la comunicación entre matemáticos no para el acto de creación. Euler una vez dijo "Si dispusiera de los enunciados de los teoremas que debo probar, ¡que fácil sería la tarea!"

Notas

1. J.Arbuthnot (1667-1735) utilizó este tipo de razonamiento causal para probar la hipótesis de que la providencia divina gobierna el sexo de los recién nacidos. Sea H la hipótesis contraria, el azar gobierna el sexo, entonces H se rechaza al ser p(S/H) muy pequeña, siendo S un suceso para el que tenemos evidencia empírica. La evidencia empírica la proporcionó el registro de bautizados de la ciudad de Londres, durante 82 años seguidos. En tal registro, Arbuthnot encontró que, durante aquellos 82 años, siempre habían nacido más varones que hembras.

2. W.S. Gosset (1876-1937) trabajaba en la fábrica de cervezas Guinnes de Dublin cuando construyó la primera tabla de números críticos para una distribución desconocida de probabilidad. La empresa no le autorizó a publicar sus investigaciones con su propio nombre y se vio obligado a utilizar un seudónimo. Desde entonces tal distribución se conoce con el nombre de la distribución t de Student.

3. McMullen ( en William Sealy Gosset, 1876-1937. E S Pearson and M G Kendall, Studies in the History of Statistics and Probability (London, 1970), 355-404) hace la siguiente observación: Para muchos, en el mundo de la estadística, se consideraba a Student como un consejero estadístico de la destilería Guinnes, para otros parecia ser un destilador que dedicaba su tiempo libre a la estadística... aunque hay algo de verdad en las dos afirmaciones, ambas omiten el punto central, que es la íntima conexión entre su investigación estadística y los problemas prácticos en los que se involucró. Student desarrolló una gran cantidad de trabajo rutinario así como su trabajo estadístico en la destilería, y añadido a todo esto preparó sus muy variadas publicaciones.

 
Volver