28 ago 2022

«Las estadísticas no mienten...»

«Las estadísticas no mienten...»Juan Díez Nicolás es académico de número en la Real de Ciencias Morales y Políticas.

El DEBATE, 28/Ago/2022;

Cuando los políticos necesitan justificarse suelen recurrir a las estadísticas. Pero cualquiera familiarizado con los números, con las estadísticas, sabe que «las estadísticas no mienten... somos nosotros los que a veces mentimos con estadísticas». Las estadísticas son neutrales, pero a veces se utilizan para mentir, y con mucha más frecuencia, para engañar. España ha sido siempre uno de los países más desarrollados con mejor sistema estadístico. El INE tiene prestigio internacional, pues siempre ha contado con magníficos profesionales y una muy buena organización nacional, y todos debemos colaborar para que ese prestigio se mantenga.

Los que tengan una edad avanzada recordarán que en los años 50 del siglo pasado los políticos «tecnócratas», además de popularizar conocimientos básicos de economía, pusieron de moda la utilización de estadísticas. Pero como no todos las utilizaban correctamente, se contaban anécdotas no siempre ciertas. Recuerdo una que no he podido confirmar, pero que corrió abundantemente por los corrillos de la época. Se decía que alguien, al dar cuenta de las estadísticas sobre delincuencia, afirmó que «el cien por cien de los violadores en España durante el año anterior eran de una profesión». Lo cierto es que solo se trataba de un violador, y por tanto no se mentía, pero se engañaba, pues al hacer esa afirmación se sugería que todos los de esa profesión eran violadores. Por cierto, no es recomendable utilizar porcentajes cuando la base es inferior a 100, como en este ejemplo.

Siempre que se utilice un porcentaje hay que dejar claro «qué es 100», para saber cuál es la base sobre la que se calcula la proporción, si son todos los españoles, todos los universitarios, todas las mujeres, todos los menores de 30 años. Eso es muy importante, y por eso hay una gran diferencia entre «el porcentaje de españoles católicos» y «el porcentaje de católicos españoles». Es evidente que el número de los católicos españoles y el de los españoles católicos es el mismo, pero los porcentajes citados no lo son, pues en el primer caso la base para el cálculo son todos los españoles, mientras que en el segundo la base son todos los católicos del mundo. La utilización de tasas (como la de mortalidad), proporciones (como el porcentaje de españoles menores de 15 años), o las razones (número de automóviles en España por cada 1.000 habitantes en España), deben utilizarse correctamente para describir y comparar realidades, pues de otro modo se puede incurrir en mentiras o, al menos, en engaños.

Muchos políticos, muchos analistas, muchos informadores, siguen sin diferenciar entre el porcentaje de «electores» (los que tienen derecho a votar) y el porcentaje de «votantes» (los que han votado de forma válida) que han votado a un determinado partido político, y complican las comparaciones cuando en unos casos utilizan el primer porcentaje y en otros el segundo. Como se dice vulgarmente, se comparan uvas con melones.

Desde el inicio de la pandemia, en España, casi cualquier información va acompañada de algún tipo de dato estadístico, pero con demasiada frecuencia se utilizan mal, pues o bien no definen correctamente la realidad o inducen a engaño. El ejemplo más frecuente ha sido el de utilizar cifras absolutas en lugar de relativas. Así, cuando se informa de que en Estados Unidos ha habido este año más muertos por covid-19 que en España este mismo año, no se miente, pero se está sugiriendo que la pandemia provoca mayor mortalidad en Estados Unidos que en España, pero al utilizar cifras relativas podría encontrarse que el número de muertos por 1.000 habitantes en un país y en el otro son iguales, o es mayor en un país que en el otro, o a la inversa. Al utilizar cifras absolutas se está induciendo al engaño, pues en Estados Unidos, casi por definición, habrá más de todo que en España, más calvos, más universitarios, más automóviles, etc., porque ese país tiene casi diez veces más población que España. Por supuesto, los errores son aún mayores cuando se comparan cifras de un mes en un país y de otro mes diferente en el otro país. Y el error se multiplica cuando en un caso se habla de muertos por la pandemia y en el otro de diagnosticados. No es posible en un breve artículo hacer una relación de todos los errores, suponemos que involuntarios, que se han producido en relación con muchos datos y comparaciones que vemos a diario en toda clase de informaciones.

Otra cuestión que induce a error frecuente es la sugerencia de «relación de causalidad entre dos fenómenos». Los que saben estadística saben muy bien que «el hecho de que dos fenómenos varíen juntos no significa que covaríen, es decir, que uno sea causa del otro». Uno de los ejemplos más conocidos, citado en casi todos los libros de estadística, es el hallazgo, cierto en prácticamente todos los núcleos de población de todos los países, sobre todo en los siglos XIX y XX, de la alta correlación entre la tasa de natalidad (número de nacimientos por 1.000 habitantes), y el número de cigüeñas (también por 1.000 habitantes). El alto coeficiente de correlación era cierto, pero la conclusión era obviamente falsa, pues no parece aceptable creer que las cigüeñas traigan a los niños de París. La explicación era sencilla, la natalidad era tradicionalmente más alta en los núcleos rurales que en los urbanos, y también es cierto que suele haber más cigüeñas por habitante en los núcleos rurales que en los urbanos. Lo mismo se habría encontrado si en lugar de cigüeñas calculásemos la correlación con el número de automóviles por habitante. Y tampoco creemos que los niños vengan en automóvil a los hogares.

Otra forma de engañar es la de utilizar casos aislados para generalizar. Si se quiere demostrar que hay una disminución del precio de un producto en el mundo, por ejemplo, siempre habrá algún pueblo en España donde encontraremos ese bajo precio, y si no se encuentra en ninguno de los más de 8.000 municipios que hay en España, seguro que se encontrará en alguno de los cientos de miles de pueblos de todo el mundo.

Finalmente, se abusa también con frecuencia del argumento de la autoridad. Se afirma algo, sobre la economía, o sobre la pandemia, o sobre cambios meteorológicos, e inmediatamente se busca el respaldo de la autoridad. Pero no es lo mismo apoyarse en lo que dice «un profesional cualquiera», que en lo que diga un director de un centro de investigación o de una reconocida autoridad en esa especialidad profesional. Por no hablar de respaldar la afirmación sobre cualquier hecho social preguntando a varias personas en la calle, cuya opinión se pretende que es unánime o mayoritaria. La información es algo muy serio, y todos debemos esforzarnos por tratar de decir la verdad, y por no inducir a error. Por todas estas razones, puede afirmarse que en la actualidad el exceso de información estadística puede estar produciendo desinformación.


No hay comentarios.:

Hoy es el recorrido de "La novia de Culiacán"

Guadalupe Leyva, o mejor conocida como «Lupita, la novia de Culiacán» es una leyendas de de la capital del estado.  Este domingo 22 de dicie...