Datos No Agrupados vs. Datos Agrupados: Tablas de Frecuencias
Datos No Agrupados
Son los datos tal cual se recolectan, en bruto, sin ningún orden específico o en una lista simple.
- Cuándo se usan: Cuando la muestra es pequeña (generalmente ) o cuando hay pocos valores diferentes.
- Ejemplo: Edades de 5 estudiantes: 18, 21, 18, 19, 22.
Datos Agrupados
Son datos organizados en categorías llamadas “clases” o “intervalos“.
- Cuándo se usan: Cuando la muestra es grande o la variable es continua (como el peso o la estatura), lo que genera demasiados valores distintos para listarlos uno por uno.
- Ejemplo: En lugar de listar 100 estaturas, decimos: “Hay 15 personas entre 1.60m y 1.70m”.
La Distribución de Frecuencias
Es una tabla que organiza los datos agrupados para mostrar cuántas veces aparece cada valor o rango de valores.
Elementos de la Tabla:
- Clase (o Intervalo): Es cada uno de los renglones o grupos de la tabla. Por ejemplo:
[10 - 20). - Límites de Clase: Cada clase tiene dos extremos:
- Límite Inferior (): El valor más pequeño del intervalo.
- Límite Superior (): El valor más grande del intervalo.
- Amplitud ( o ): Es la diferencia entre el límite superior e inferior de una clase. Es el “ancho” del intervalo.
- Fórmula:
- Marca de Clase ( o ): Es el punto medio de cada intervalo. Representa a toda la clase para los cálculos.
- Fórmula:
Tipos de Frecuencias:
Imagina que estamos analizando el uso de horas de IA a la semana en un grupo:
| Clase (Horas) | Frec. Absoluta () | Frec. Acumulada () | Frec. Relativa () | Frec. Relativa % () |
| [0 – 5) | 10 | 10 | 0.50 | 50% |
| [5 – 10) | 6 | 16 | 0.30 | 30% |
| [10 – 15) | 4 | 20 | 0.20 | 20% |
| Total | n=20 | – | 1.00 | 100% |
Frecuencia Absoluta (): Es el número de veces que se repite un dato o cuántos datos caen en esa clase. (Ej: 10 personas usan la IA entre 0 y 5 horas).
Frecuencia Acumulada (): Es la suma de las frecuencias absolutas desde la primera clase hasta la actual. Sirve para saber cuántos datos hay “hasta ese punto”. (Ej: 16 personas usan la IA menos de 10 horas).
Frecuencia Relativa (): Es la proporción que representa la frecuencia absoluta respecto al total.
- Fórmula:
Frecuencia Relativa Porcentual (): Es la frecuencia relativa expresada en porcentaje (se multiplica por 100).
Ejemplo de creación de la tabla de frecuencias
Imagina que eres un administrador de TI y has registrado el tiempo de respuesta (en milisegundos) de un servidor ante 20 solicitudes aleatorias. Estos son tus datos no agrupados:
15, 12, 22, 18, 15, 13, 21, 16, 24, 17, 19, 15, 12, 16, 20, 14, 18, 17, 23, 16
Paso 1: Organizar y determinar el Rango
- Ordenar de menor a mayor: 12, 12, 13, 14, 15, 15, 15, 16, 16, 16, 17, 17, 18, 18, 19, 20, 21, 22, 23, 24.
- Identificar el Rango (): .
Paso 2: Determinar número de clases () y amplitud ()
Para este ejercicio, definiremos 4 clases para que la tabla sea manejable.
- Amplitud (): . Cada intervalo tendrá un ancho de 3 unidades.
Paso 3: Construcción de la Tabla de Frecuencias
Aquí aplicamos todos los conceptos que mencionaste:
| Clase (Intervalo) | Marca de Clase () | Frec. Absoluta () | Frec. Acumulada () | Frec. Relativa () | Frec. Porcentual () |
| [12 – 15) | 13.5 | 4 | 4 | 0.20 | 20% |
| [15 – 18) | 16.5 | 8 | 12 | 0.40 | 40% |
| [18 – 21) | 19.5 | 4 | 16 | 0.20 | 20% |
| [21 – 24] | 22.5 | 4 | 20 | 0.20 | 20% |
| Total | 1.00 | 100% |
- Clase: Por ejemplo, la segunda clase es [15 – 18). Esto significa que incluye el 15, 16 y 17, pero el 18 “salta” a la siguiente clase.
- Marca de Clase (): Para la primera clase: (12+15)/2=13.5. Es el representante del grupo.
- Frecuencia Absoluta (): En el intervalo [15 – 18) hay 8 datos (tres 15s, tres 16s y dos 17s).
- Frecuencia Acumulada (): En la tercera fila es 16. Esto nos dice que 16 de las 20 solicitudes tardaron menos de 21 ms.
- Frecuencia Relativa Porcentual: El 40% de las solicitudes se concentran en el rango de 15 a 18 ms.
Determinación del número de clases ()
1. La Regla de Sturges (La más utilizada)
Es la fórmula estándar en estadística cuando los datos tienen una distribución relativamente normal.
k=1+3.322\times\log_{10}(n)Ejemplo: Si tienes datos: . Se recomienda usar 5 o 6 clases.
2. La Regla de la Raíz Cuadrada
Es un método rápido y sencillo, ideal para muestras pequeñas o cuando no tienes una calculadora científica a la mano.
k=\sqrt{n}- Ejemplo: Si tienes datos: Se recomienda usar 4 o 5 clases.
3. Regla de Velleman (o Regla de 2 a la )
Se basa en encontrar el menor número entero tal que 2 elevado a esa potencia sea mayor o igual al número de datos.
2^k≥n
- Ejemplo: Si tienes datos:
- =16 (Es menor que 20, no sirve).
- =32 (Es mayor que 20, este es el valor).
- Resultado: .
El criterio para elegir el método depende principalmente de dos factores: el tamaño de la muestra () y la precisión que requiera tu análisis. No existe una regla única obligatoria, pero sí convenciones que ayudan a que los datos “hablen” mejor.
1. Usa la Regla de Sturges cuando:
- El tamaño de la muestra es moderado ().
- Buscas un estándar académico o profesional. Es la fórmula más aceptada en software estadístico y publicaciones científicas.
- Tus datos siguen una distribución normal (forma de campana).
- Limitación: Si es muy grande (ej. 50,000 datos), Sturges tiende a dar muy pocas clases, “suavizando” demasiado la gráfica y ocultando detalles importantes.
2. Usa la Regla de la Raíz Cuadrada cuando:
- Necesitas rapidez. Es ideal para cálculos manuales rápidos o exámenes donde no tienes una calculadora con funciones logarítmicas.
- Muestras pequeñas (). Suele dar resultados muy similares a Sturges en estos rangos.
- Es un método puramente empírico, menos “robusto” matemáticamente, pero muy práctico para una exploración inicial de datos.
3. Usa la Regla de 2 a la k () cuando:
- Quieres asegurarte de que cada clase tenga una probabilidad razonable de contener datos.
- Es muy común en control de calidad industrial y procesos de manufactura.
- Es un criterio conservador que evita tener demasiadas clases vacías.


Criterios de Oro (Sentido Común Estadístico)
Más allá de la fórmula, el analista debe aplicar estos criterios prácticos:
- El Rango de Clases: Independientemente de la fórmula, intenta que el número de clases sea entre 5 y 15.
- Menos de 5: Se pierde el patrón de la distribución (todo se ve como una sola masa).
- Más de 15: La tabla se vuelve difícil de leer y el histograma se ve “dentado” o con muchos huecos.
- La Amplitud manejable: Si Sturges te dice que uses 5.3 clases y eso te da una amplitud de 3.22, a veces es preferible ajustar a 6 clases para que la amplitud sea un número entero (como 3 o 5), lo cual facilita la lectura de la tabla.
- El objetivo del gráfico: Si estás buscando detectar anomalías pequeñas (como errores en una línea de producción), te conviene usar un poco más de clases de las que sugiere la fórmula para no “esconder” los errores dentro de intervalos muy anchos.
Ejemplo de Decisión
Si tienes un dataset de 1,000 usuarios de una red móvil:
- Sturges te daría 11 clases.
- Raíz Cuadrada te daría 32 clases.
¿Cuál elegir? Para una presentación ejecutiva, 11 clases (Sturges) es mucho más claro. 32 clases sería demasiado ruido visual.