Posts Tagged ‘infanta’

h1

P-valores, infantas y tests de hipótesis

junio 19, 2013

Publica hoy Ignacio Escolar un artículo hoy sobre “las probabilidades matemáticas de que lo de la infanta sea un error“, que firma junto a José Manuel Rey (nota al margen: cabe preguntarse por qué hace falta un doctor en matemáticas para meter en una calculadora 100.000.000⁴). No me voy a centrar mucho en el contenido de los errores (Ricardo Galli ha publicado un artículo donde hace un buen resumen), sino en la forma del error. Es decir: ¿cómo podemos interpretar correctamente el número que da Escolar?

Para responder a nuestra pregunta, vamos a plantear el problema de decidir si la “teoría del error de los registradores” es cierta como un test de hipótesis. En estadística frecuentista, este tipo de problemas se suele desarrollar con el siguiente método (me salto las partes con más interés técnico pero menos interés informativo):

  • Se plantea una hipótesis nula: en este caso, nuestra hipótesis nula es “Ha sido un fallo de los registradores”.
  • Se formula la hipótesis alternativa como el complementario de la hipótesis nula: es decir, de entre todas las “posibilidades”, la hipótesis alternativa comprende todas las que no forman parte de la hipótesis nula.
  • Se calcula un p-valor, una cifra que mide cómo de probable es, bajo la hipótesis nula, que los “datos” (en nuestro caso, la coincidencia) sean tan o más extremos como los observados. En nuestro caso, mediría cómo de probable sería un fallo de los registradores: es decir, la cifra que calcula Escolar.
  • Se compara ese p-valor con un valor crítico (una regla muy extendida es usar 0.05, pero en muchos casos relevantes es necesario corregirlo)
  • Si el p-valor es más grande, diremos que los resultados observados no son evidencia significativa contra la hipótesis nula, ya que consideramos que el resultado observado sería probable bajo la hipótesis nula.
  • Si el p-valor es más pequeño, diremos que los resultados observados son evidencia significativa contra la hipótesis nula, ya que estamos observando resultados que son muy poco probables si asumimos la hipótesis nula.

El primer error del artículo de Escolar es que llama a su p-valor “las probabilidades matemáticas de que lo de la infanta sea “un error””, es decir, la probabilidad de que la hipótesis nula sea cierta. Esto es un error básico de estadística, un error contra el que te advierten prácticamente en la portada de cualquier libro de inferencia estadística. El p-valor NO mide la probabilidad de que la hipótesis nula sea cierta, sino la probabilidad de encontrar un resultado al menos tan inusual como el observado si asumimos que la hipótesis nula es cierta. Es una interpretación errónea que te mandaría a septiembre en la primera asignatura de Estadística de cualquier carrera técnica.

El segundo error fundamental es más sutil. Rechazar la hipótesis nula no es lo mismo que aceptar una hipótesis alternativa en concreto. Es decir, si tenemos que decidir entre las teorías A, B y C, escogiendo A como hipótesis nula, y nuestro p-valor es pequeño, entonces deberíamos aceptar el complementario de A, es decir, B o C. En nuestro caso, la hipótesis nula es que “es un error y la única posibilidad de error es el humano y es igual de probable equivocarse con el 14 que con cualquier otro número y otras premisas”. Por lo tanto, lo que deberíamos concluir a la luz de la magnitud del p-valor no es, como Escolar hace, que “no es un error”, sino que “no es un error o ha sido un error no humano o no es igual de probable equivocarse con el 14 que con otro número o no se cumple alguna otra premisa”. Incluso algún comentarista de El Diario se han percatado de este hecho.

Lo que quiero resaltar de esta cuestión no es el error concreto de Escolar (qué teoría alternativa no ha tenido en cuenta), sino lo erróneo de su interpretación de la estadística. Uno no sólo tiene que saber cómo hacer números, sino qué significan esos números; y si esto es importante para cualquier ciudadano, lo es todavía más para un periodista. No es pecado equivocarse (honestamente) en un artículo de opinión, pero sí lo es emplear argumentos erróneos.

Anuncios