Si desea evitar un accidente de tráfico fatal, ¿qué debe hacer? ¿Conducir más despacio? ¿Evitar beber alcohol? Roberts y Winters han encontrado esta correlación entre los accidentes de tráfico y las acacias.

Gráfico que demuestra la correlación entre las acacias y los accidentes fatales
Número medio anual de muertes en carretera por cada 100,000 habitantes dentro de un país en función de la presencia de Acacia nilotica. Imagen Roberts y Winters (2013)

Entonces, ¿qué está pasando? ¿Alguien está plantando árboles de acacia en los cruces y bloqueando la vista? ¿Dejan caer las hojas de las acacias de manera sorprendente y causan accidentes? No esperaría que una hoja que cae provoque un accidente, pero tal vez sea esa sorpresa lo que causa el problema. ¿El trabajo de leñadores selectivos hará que las carreteras sean más seguras? La correlación es real y eso es lo que es: una correlación.

El hecho de que un resultado se correlacione con otro no significa que pueda trazar una línea que implique causalidad. En mi caso, he insinuado que las acacias causan accidentes de tránsito. ¿Podría ser al revés? ¿Los accidentes fatales causan árboles de acacia? Tal vez la gente plante acacias en memoria de los que han muerto. A menudo hay una razón más profunda para una conexión.

Papel de Roberts y Winters, Diversidad Lingüística y Accidentes de Tránsito: Lecciones de Estudios Estadísticos de Rasgos Culturales está dirigido a personas que buscan correlaciones en datos lingüísticos y culturales, pero sus advertencias se aplican a cualquier persona que trabaje con datos complejos, especialmente si no define una pregunta de investigación cuando comienza su estudio.

Una característica que destacan es el accidente histórico. Encuentran una correlación entre los árboles de acacia y los lenguajes tonales. ¿Uno causa el otro? Los idiomas tonales se encuentran más comúnmente en África, y los idiomas tienden a agruparse porque tienen raíces históricas comunes. Las acacias se encuentran (principalmente) en África. No hay una gran idea de la correlación, simplemente que tienes dos cosas en común en África. Si piensa en la seguridad comparativa de las carreteras en África, queda claro por qué existe una correlación entre las Acacias y los accidentes de tráfico.

Otra característica de hacer conexiones entre conjuntos de datos es que las correlaciones pueden ocurrir por casualidad. Puede cuantificar la probabilidad de que un resultado se deba al azar, pero eso por sí solo dice poco sobre el significado del resultado. Si un resultado tiene solo un 1 % de probabilidad de que se deba al azar, pero ha realizado 100 pruebas, debe esperar alrededor de un resultado anormal. Cuantas más cosas mires, más posibilidades hay de encontrar resultados falsos. El documento original tiene una cita útil de Nassim Nicholas Taleb: “Esta es la tragedia de los grandes datos: cuantas más variables, más correlaciones pueden mostrar significado. La falsedad también crece más rápido que la información; es no lineal (convexo) con respecto a los datos”.

Así es como Roberts y Winters pueden armar una cadena de correlaciones espurias. Es un documento valioso para consultar, la próxima vez que se enfrente a un documento que produce resultados peculiares. Tú también puedes lea su publicación de blog sobre el papel.

Solía ​​pensar que la correlación implicaba causalidad. Luego tomé una clase de estadística. Ahora ya no, pero no sé si la clase de estadística lo causó.
Correlación. Imagen de Randall Munroe/xkcd.

Referencias

Roberts S. y Winters J. (2013). Diversidad lingüística y accidentes de tránsito: lecciones de estudios estadísticos de rasgos culturales.,

Más uno,

DOI:

Imágenes

Número medio anual de muertes en carretera por cada 100,000 XNUMX habitantes dentro de un país en función de la presencia de Acacia nilotica. Imagen de Seán Roberts y James Winters. [cc]por[/cc]
La correlación. Imagen de Randall Munroe/xkcd. [cc]por-nc[/cc]