Estadística Descriptiva

Medidas de Localización: cuantiles

Las Medidas de Localización (también llamadas cuantiles) son una extensión del concepto de la mediana. Mientras que la mediana divide los datos en dos partes iguales, estas medidas los dividen en muchas más partes para darnos una ubicación exacta de un dato dentro del total.

1. Definición e Interpretación

Estas medidas solo tienen sentido si los datos están ordenados de menor a mayor.

  • Cuartiles (QQ): Dividen la distribución en 4 partes iguales (cada parte es el 25%).
    • Q1Q_1: Deja el 25% de los datos por debajo.
    • Q2Q_2: Deja el 50% (es igual a la Mediana).
    • Q3Q_3: Deja el 75% por debajo.
  • Deciles (DD): Dividen la distribución en 10 partes iguales (cada parte es el 10%). Van del D1D_1 al D9D_9.
  • Percentiles (PP): Dividen la distribución en 100 partes iguales (cada parte es el 1%). Van del P1P_1 al P99P_{99}. Son los más usados en informes internacionales y pediatría.

2. Método de obtención: Datos No Agrupados

Para encontrar cualquier cuantil, primero debemos hallar la posición (PosPos).

Fórmula general de posición:

Pos = \frac{k \cdot n}{m}
  • kk: El número del cuantil que buscamos (ej: si buscas el cuartil 3, k=3k=3).
  • nn: Número total de datos.
  • mm: Número de divisiones (4 para cuartiles, 10 para deciles, 100 para percentiles).

Regla de interpretación de la posición:

  1. Si el resultado es un número entero, el cuantil es el promedio entre el dato en esa posición y el siguiente.
  2. Si el resultado tiene decimales, se redondea al siguiente número entero y ese es el dato buscado.

3. Método de obtención: Datos Agrupados

Al igual que con la mediana, aquí no tenemos los datos sueltos, por lo que usamos una fórmula de interpolación dentro de una tabla de frecuencias.

Pasos:

  1. Calcular la posición: Pos=knmPos = \frac{k \cdot n}{m}.
  2. Buscar en la Frecuencia Acumulada (FiF_i) el primer intervalo que contenga esa posición.
  3. Aplicar la fórmula (usaremos el ejemplo para Percentiles, que es la más común):
P_k = L_i + \left( \frac{\frac{k \cdot n}{100} - F_{i-1}}{f_i} \right) \cdot A
  • LiL_i: Límite inferior de la clase donde cayó la posición.
  • Fi1F_{i-1}: Frecuencia acumulada del intervalo anterior.
  • fif_i: Frecuencia absoluta del intervalo actual.
  • AA: Amplitud del intervalo.

4. ¿Existe diferencia entre Muestra y Población?

En cuanto al procedimiento matemático, la respuesta corta es no; la fórmula es la misma. Sin embargo, hay tres matices importantes que conocer:

  1. Notación:
    • Si es una Población, el tamaño total se escribe con NN (mayúscula).
    • Si es una Muestra, el tamaño total se escribe con nn (minúscula).
  2. Propósito:
    • En una población, el percentil es un parámetro (un valor exacto y real).
    • En una muestra, el percentil es un estadístico que sirve para estimar dónde estaría ese punto en la población total.
  3. Software estadístico (Dato avanzado): Algunos programas (como Excel, R o SPSS) utilizan ligeras variaciones en la fórmula de posición para muestras muy pequeñas (n1n-1 en lugar de nn) para corregir posibles sesgos, pero en la estadística académica tradicional se utiliza la misma lógica para ambos casos.

Ejemplo rápido de interpretación:

Si un alumno está en el Percentil 90 (P90P_{90}) de una prueba de matemáticas, la interpretación correcta es:

“Este alumno obtuvo una calificación igual o superior al 90% de todos los estudiantes, y solo un 10% de los estudiantes obtuvo una nota mejor que él”.