Para resumir, generalmente si la distribución de datos está sesgada hacia la izquierda, la media es menor que la mediana, que a menudo es menor que la moda. Si la distribución de los datos está sesgada hacia la derecha, la moda suele ser menor que la mediana, que es menor que la media.
¿Por qué la mediana se ve menos afectada por los datos sesgados?
¿Por qué la mediana se ve menos afectada por los datos sesgados que la media? Sin embargo, a medida que los datos se vuelven sesgados, la media pierde su capacidad de proporcionar la mejor ubicación central para los datos porque los datos sesgados los alejan del valor típico.
¿Por qué la mediana es mejor para datos sesgados?
Para las distribuciones que tienen valores atípicos o están sesgadas, la mediana suele ser la medida de tendencia central preferida porque la mediana es más resistente a los valores atípicos que la media… Tenga en cuenta que la media se tira en la dirección de la asimetría (es decir, la dirección de la cola).
Cuando se sesga a la derecha, ¿la media es la mediana?
Para una distribución sesgada a la derecha, la media suele ser mayor que la mediana Observe también que la cola de la distribución en el lado derecho (positivo) es más larga que en el lado lado izquierdo. Del diagrama de caja y bigotes también podemos ver que la mediana está más cerca del primer cuartil que del tercer cuartil.
¿Cómo afecta la asimetría a los datos?
Efectos de la asimetría
Si hay demasiada asimetría en los datos, muchos modelos estadísticos no funcionan, pero ¿por qué? Entonces, en datos sesgados, la región de la cola puede actuar como un valor atípico para el modelo estadístico y sabemos que los valores atípicos afectan negativamente el rendimiento del modelo, especialmente los modelos basados en regresión.