Data Morph: un cuento con moraleja sobre las estadísticas de síntesis

Authors

Speaker Image

Description

La estadística no es intuitiva para los seres humanos, que siempre intentan encontrar formas sencillas de describir cosas complejas. Ante un conjunto de datos complejo, pueden sentir la tentación de utilizar simples estadísticas de resumen como la media, la mediana o la desviación típica para describirlo. Sin embargo, estos números no sustituyen a la visualización de la distribución. Para ilustrar este hecho, los investigadores han generado muchos conjuntos de datos que son muy diferentes visualmente, pero que comparten los mismos estadísticos de resumen. En esta charla, hablaré de [Data Morph](https://github.com/stefmolin/data-morph), un paquete de código abierto que se basa en investigaciones anteriores que utilizan el recocido simulado para perturbar un conjunto de datos de entrada arbitrario en una variedad de formas, preservando al mismo tiempo la media, la desviación estándar y la correlación con varios decimales. Mostraré cómo funciona, hablaré de los retos a los que se enfrentó durante su desarrollo y exploraré las limitaciones de este enfoque.