Estadística Descriptiva

Medidas de Tendencia Central

Las Medidas de Tendencia Central son parámetros estadísticos que informan sobre el centro de la distribución de una muestra o población. Estas se consideran “herramientas clave” de la estadística descriptiva para resumir conjuntos de datos.

1. La Media (x\bar{x} o μ\mu)

Es el promedio aritmético y se interpreta como el “centro de gravedad” de los datos.

Datos No Agrupados: Se obtiene sumando todos los valores y dividiendo entre el número total de datos (nn)

\bar{x} = \frac{\sum x_{i}}{n}

Datos Agrupados: Se utiliza la Marca de Clase (xix_{i}), que es el punto medio de cada intervalo y actúa como su representante

\bar{x} = \frac{\sum (x_{i} \cdot f_{i})}{n}

2. La Mediana (x~\tilde{x})

Es el valor que divide el conjunto de datos exactamente a la mitad: el 50% de los datos son menores o iguales a ella, y el 50% son mayores o iguales.

Datos No Agrupados:

  1. Se ordenan los datos de menor a mayor.
  2. Si nn es impar, es el dato central.
  3. Si nn es par, es el promedio de los dos datos centrales.

Datos Agrupados: Se busca la “clase mediana” usando la Frecuencia Acumulada (FiF_{i}) para localizar dónde cae el dato n/2n/2

\tilde{x} = L_{i} + \left( \frac{\frac{n}{2} - F_{i-1}}{f_{i}} \right) \cdot A

Donde: LiL_{i} es el límite inferior de la clase, Fi1F_{i-1} es la frecuencia acumulada anterior y AA es la amplitud del intervalo.

3. La Moda (x^\hat{x})

Es el valor o categoría que ocurre con mayor frecuencia en el conjunto de datos.

Datos No Agrupados: Es simplemente el valor que más veces se repite. Un conjunto puede ser unimodal, bimodal o multimodal.

Datos Agrupados: Se identifica la “clase modal” (la que tiene la Frecuencia Absoluta (fif_{i}) más alta).

Representa el punto de mayor concentración de datos en la distribución.

\hat{x} = L_{i} + \left( \frac{f_{i} - f_{i-1}}{(f_{i} - f_{i-1}) + (f_{i} - f_{i+1})} \right) \cdot A

Nota sobre interpretación: La Media es sensible a valores extremos (outliers), mientras que la Mediana es más robusta y describe mejor el centro cuando los datos están muy dispersos o sesgados.

Diferencias entre el parámetro (poblacional) y el estadístico (muestral)

Existen diferencias importantes entre el parámetro y el estadístico, aunque estas se centran más en la notación (símbolos) y en el propósito estadístico que en el procedimiento matemático básico.

1. La Media: Cambio de Símbolo y Denominador

Si bien en ambos casos sumas todos los datos y los divides entre el total, la estadística hace una distinción rigurosa para saber de qué estamos hablando:

  • En la Población (Parámetro): Se usa la letra griega μ\mu (mu). El denominador es NN (tamaño total de la población). Se considera un valor “verdadero” y fijo.
  • En la Muestra (Estadístico): Se usa la letra latina x\bar{x} (x-barra). El denominador es nn (tamaño de la muestra). Se considera una “estimación” del valor real.

2. Mediana y Moda: La diferencia es el Alcance

Para la Mediana y la Moda, el método de obtención es idéntico (ordenar datos o buscar la mayor frecuencia). Sin embargo, la interpretación cambia:

  • Población: La mediana poblacional describe el centro exacto de todo el universo de estudio.
  • Muestra: La mediana muestral es solo un indicador que usamos para inferir dónde podría estar el centro de la población.

3. ¿Por qué es importante distinguir si es Muestra o Población?

La diferencia más crítica no ocurre en estas medidas de tendencia central, sino en las de dispersión (como la varianza), pero es vital entenderlo desde ahora por dos razones:

  1. Inferencia Estadística: el objetivo de calcular una media en una muestra (x\bar{x}) no es solo conocer ese grupo, sino usarlo para “estimar” el parámetro poblacional (μ\mu).
  2. Grado de Error: Al trabajar con una muestra, siempre aceptamos un margen de error. Al trabajar con la población completa (Censo), el error de muestreo desaparece, pues tenemos el valor real.

Un comentario en “Medidas de Tendencia Central

Los comentarios están cerrados.