Técnicas de Muestreo

Las Técnicas de Muestreo son la piedra angular de la Estadística Inferencial, ya que el método define la validez de las conclusiones.

1. Muestreo Probabilístico

El muestreo probabilístico es aquel donde todos los elementos de la población tienen una probabilidad conocida, distinta de cero, de ser seleccionados para la muestra. Es el único método que permite hacer inferencia estadística y generalizar resultados a la población con un nivel de confianza cuantificable.

Tipo de Muestreo	Descripción	Aplicación Principal
Aleatorio Simple (MAS)	Cada elemento de la población tiene la misma probabilidad de ser seleccionado. Es como sacar nombres de un sombrero (con reposición).	Poblaciones pequeñas y homogéneas donde se tiene una lista completa de todos los elementos.
Sistemático	Se selecciona el primer elemento al azar, y luego se elige cada $k$ -ésimo elemento a partir de ese. $k$ es el coeficiente de elevación ( $k = N / n$ ).	Ideal cuando la población está ordenada (ej. lista de clientes, línea de producción). Es fácil de implementar.
Estratificado	La población se divide en subgrupos mutuamente excluyentes y homogéneos llamados estratos (ej. por género, edad, región). Luego se selecciona una muestra aleatoria simple de cada estrato.	Cuando se necesita asegurar que subgrupos específicos (estratos) estén representados en las proporciones correctas.
Conglomerados	La población se divide en subgrupos heterogéneos llamados conglomerados (ej. ciudades, barrios). Se seleccionan algunos conglomerados al azar, y todos los elementos dentro de los conglomerados elegidos forman la muestra.	Ideal para poblaciones geográficamente dispersas, ya que reduce costos de viaje y logísticos.

a) Grupos Mutuamente Excluyentes (Disjuntos)

En Estadística y Probabilidad, dos o más grupos o eventos son mutuamente excluyentes si no pueden ocurrir al mismo tiempo o si un elemento no puede pertenecer a más de uno de esos grupos simultáneamente.

Criterio: La intersección de los conjuntos es vacía ( $A \cap B = \empty$ ).
Contexto de Grupos: Se usa para dividir una población de tal manera que cada individuo caiga en una sola categoría.

Característica	Ejemplo
Evento	Lanzar un dado: El evento “sacar un 2” y el evento “sacar un 5” son mutuamente excluyentes en un solo lanzamiento.
Grupos	Clasificación por Género (Femenino o Masculino). Una persona no puede ser clasificada en ambos grupos a la vez.
Muestreo	La división de la población en Estratos para el Muestreo Estratificado (un individuo pertenece a un único estrato).

b) Grupos Homogéneos (Similares Internamente)

Un grupo o conjunto de datos es homogéneo cuando todos los elementos dentro de él comparten características muy similares o sus valores de variables muestran muy poca variabilidad (dispersión).

Criterio Estadístico: La Varianza o la Desviación Estándar de los elementos dentro del grupo es muy baja, o idealmente, cero.
Contexto de Muestreo: La homogeneidad es el objetivo principal al dividir la población en Estratos (Muestreo Estratificado).

Característica	Ejemplo
Datos	Un grupo de personas donde todas tienen exactamente 30 años.
Muestreo	Un Estrato de “Estudiantes de primer año de Ingeniería”. Se espera que compartan características académicas y de edad similares.
Objetivo	Reducir la muestra necesaria, ya que al ser similares, estudiar uno es casi como estudiar a todos.

c) Grupos Heterogéneos (Diversos Internamente)

Un grupo o conjunto de datos es heterogéneo cuando los elementos dentro de él son diversos y presentan una gran variabilidad o diferencia en sus características.

Criterio Estadístico: La Varianza o la Desviación Estándar de los elementos dentro del grupo es alta.
Contexto de Muestreo: La heterogeneidad es una característica que se busca en los Conglomerados (Muestreo por Conglomerados).

Característica	Ejemplo
Datos	Una muestra de edad de 18, 35, 50, 78 años. Hay mucha dispersión interna.
Muestreo	Un Conglomerado de “Todas las viviendas en el Barrio X”. Se espera que dentro del barrio haya una mezcla heterogénea de edades, ingresos y ocupaciones.
Objetivo	Que un solo grupo (el conglomerado) represente la diversidad de la población total.

2. Muestreo No Probabilístico

En este tipo de muestreo, la selección de los elementos no se basa en el azar, sino en el criterio del investigador o en la facilidad de acceso.

Desventaja: No se puede calcular el error de muestreo ni se puede garantizar que la muestra sea representativa de la población. Las conclusiones no pueden generalizarse estadísticamente.
Usos: Estudios exploratorios, estudios de casos o cuando no se tiene acceso a una lista completa de la población.

Tipo de Muestreo	Descripción
Por Conveniencia	Se selecciona a los individuos que están fácilmente disponibles o que son más fáciles de contactar.
Por Juicio o Criterio	El investigador utiliza su experiencia para seleccionar a los individuos que cree que son los más adecuados para el estudio.
Por Cuotas	La población se divide en grupos (como el estratificado), pero el investigador llena las cuotas de cada grupo de manera no aleatoria (por conveniencia o criterio).
Bola de Nieve	Se contacta a unos pocos individuos clave, y estos, a su vez, identifican a otros que cumplen con los criterios del estudio.

3. Proceso del Diseño de una Muestra

El diseño de una muestra es un proceso sistemático que garantiza que el estudio sea válido y los resultados sean fiables.

Fases del Diseño de la Muestra

Fase	Tarea Principal	Relevancia Estadística
1. Definición de la Población	Definir claramente a quién se quiere estudiar (Unidad de Análisis, Alcance Geográfico, Marco Temporal).	Determina el Parámetro de interés ( $\mu$ , $P$ ).
2. Definición de la Variable y Tipo	Identificar la Variable Estadística a medir y determinar su Tipo (Nominal, Ordinal, Discreta, Continua).	Define el tipo de análisis que se puede realizar (ej. calcular la media solo es válido para Cuantitativas).
3. Selección de la Técnica de Muestreo	Elegir entre un método Probabilístico (si se necesita inferencia) o No Probabilístico (si es exploratorio).	Define la validez y generalización de los resultados.
4. Determinación del Tamaño de Muestra ( $n$ )	Calcular el número mínimo de elementos necesarios para que el Estadístico estimado sea preciso (es decir, esté cerca del Parámetro).	Se basa en el nivel de confianza, margen de error y variabilidad esperada de la población.

Fórmula del Tamaño de Muestra

Para el muestreo probabilístico, el cálculo del tamaño de muestra ( $n$ ) se basa en la Estadística Inferencial. Una fórmula común para estimar una proporción ( $P$ ) en poblaciones grandes es:

n = \frac{Z^2 \times P \times (1 - P)}{E^²}

Donde:

$n$ : Tamaño de la muestra.
$Z$ : Nivel de confianza (ej. $Z = 1.96$ para 95% de confianza).
$P$ : Proporción poblacional estimada (se usa 0.5 si es desconocida), representa la proporción (o probabilidad) del evento de interés que se espera encontrar en la población total.
$E$ : Margen de error aceptable.

Para muestras de población finita:

\begin{align*} n_0 & = \frac{Z^2 \times P \times (1 - P)}{E^²} \\ n & = \frac{n_0}{1 + \frac{n_0}{N}} \end{align*}

La fórmula de tamaño de muestra para poblaciones infinitas es:

n = \frac{Z^2 \times \sigma^2}{E^2}

Donde:

$n$ : Tamaño de la muestra requerido.
$Z$ : Valor Z asociado al Nivel de Confianza (ej. 1.96 para 95%).
$\sigma^2$ : Varianza poblacional (el cuadrado de la Desviación Estándar Poblacional, σ).
$E$ : Error Máximo Aceptable (la precisión deseada, expresada en las mismas unidades de la variable, ej. 2 años, 500 pesos).

Como la desviación estándar poblacional ( $\sigma$ ) generalmente es desconocida antes de realizar el estudio, hay tres formas comunes de estimarla:

Estudios Piloto: Se realiza una pequeña muestra preliminar y se calcula la desviación estándar muestral ( $s$ ) para usarla como una estimación de $\sigma$ .
Estudios Previos: Se utiliza la desviación estándar reportada en investigaciones similares recientes.
Rango Estimado (Estimación Conservadora): Se estima el rango ( $R$ ) de valores posibles de la variable y se utiliza la regla empírica: $\sigma \approx \frac{\text{Rango}}{4}$ o $\sigma \approx \frac{\text{Rango}}{6}$ (dependiendo de la distribución esperada).

Proceso con Información Incompleta

Paso 1: Definir el Parámetro y Usar el Caso Más Conservador

Lo primero es definir si tu estudio busca una media ( $\mu$ ) o una proporción ( $P$ ):

A. Si buscas una Proporción ( $P$ )

Solución: Usa el valor que maximiza la varianza: $P = 0.5$ .
Justificación: Usar $P = 0.5$ garantiza que el tamaño de muestra calculado ( $n_0$ ) sea el más grande posible para cualquier proporción, asegurando que el error $E$ se cumpla con el nivel de confianza $Z$ .

B. Si buscas una Media (μ)

Solución: Debes estimar la desviación estándar (σ\sigma o σ2\sigma^2). Como σ\sigma es desconocida, usas un método de estimación conservadora: el método del rango.
σ=Rango Estimado4\sigma = \frac{\text{Rango Estimado}}{4}
1. Estimar el rango (R): Determina el valor máximo (Máx) y el valor mínimo (Mín) posible o razonable para tu variable de estudio (ej. edad, salario, tiempo de espera).
  $\text{Rango} (R) = \max – \min$
2. Estimar $\sigma$ : Divide el rango entre 4 (esta es una regla empírica conservadora basada en la distribución normal).

Paso 2: Aplicar la Fórmulas para Población Infinita ( $n_0$ )

Paso 3: Aplicar la Corrección por Población Finita

Determinación del valor de $Z$

El valor de $Z$ (el puntaje $Z$ o valor crítico $Z$ ) es un elemento fundamental en la Estadística Inferencial y en el cálculo del tamaño de muestra, ya que está directamente ligado al Nivel de Confianza que deseamos para nuestro estudio.

El valor de $Z$ se obtiene de la Tabla de la Distribución Normal Estándar (también conocida como la tabla $Z$ ) y representa el número de desviaciones estándar que una observación está por encima o por debajo de la media.

El Nivel de Confianza (NC) es la probabilidad de que el intervalo que construyamos contenga el verdadero parámetro poblacional.

El valor $Z$ que utilizamos es el valor crítico que define las fronteras de esa área de confianza en la distribución.

Pasos para Obtener el Valor de Z

El proceso se basa en la simetría de la distribución normal y en el error que estamos dispuestos a aceptar.

1. Definir el Nivel de Confianza (NC):

Es el porcentaje de certeza que queremos (ej. 90%, 95%, 99%).
Se expresa como un valor decimal (ej. 0.90, 0.95, 0.99).

2. Calcular el Nivel de Significación ( $\alpha$ ):

El Nivel de Significación ( $\alpha$ ) es el complemento del Nivel de Confianza. Representa la probabilidad de error.
$\alpha = 1 – \text{NC}$
Ejemplo para 95%: $\alpha = 1 – 0.95 = 0.05$

3. Determinar el Área en las Colas (α/2):

Como la prueba es bilateral (la media podría estar en cualquier lado de la muestra), el error $\alpha$ se divide en dos “colas” (extremos) de la distribución.
$\alpha /2$
Ejemplo para 95%: 0.05 / 2 = 0.025 (área en cada cola).

4. Buscar el Área Acumulada:

Para encontrar el valor $Z$ en la tabla, necesitamos el área desde el extremo izquierdo de la curva hasta el valor crítico $Z$ .
$\text{Area Acumulada} = 1 – \alpha / 2$
Ejemplo para 95%: 1− 0.025=0.9750

5. Encontrar el Valor $Z$ Crítico:

[Tabla de la Distribución Normal]

Se busca el valor 0.9750 dentro del cuerpo de la tabla $Z$ y se identifican las coordenadas ( $Z_{\text{fila}}$ y $Z_{\text{columna}}$ ).

Valores Z Críticos Más Comunes

En la práctica, los valores de $Z$ para los niveles de confianza más habituales se memorizan o se consultan rápidamente:

Nivel de Confianza (NC)	Nivel de Significación ( $\alpha$ )	Valor Crítico $Z$
90%	0.10	1.645
95%	0.05	1.96
99%	0.01	2.58

Ejemplo Detallado para 95%

NC = 0.95
α=0.05
α/2=0.025
Área a buscar: 1−0.025=0.9750
Al buscar 0.9750 en la tabla Z, encontramos que corresponde a la fila 1.9 y la columna .06.
Por lo tanto, el valor crítico Z para 95% es 1.96.

Ejemplos de Cálculo de Tamaño de Muestra

Ejemplo 1: Encuesta de Opinión Pública (Máxima Incertidumbre)

Se desea realizar una encuesta para estimar la proporción de ciudadanos que aprueban la gestión de un alcalde.

Nivel de Confianza (NC): 95% →Z=1.96
Margen de Error (E): 5% (0.05)
Proporción Esperada (P): Desconocida, por lo que se utiliza P=0.5 (máximo conservador).

\begin{align*} n & = \frac{Z^2 \times P \times (1 - P)}{E^²} \\ & = \frac{1.96^2 \times 0.5 \times (1 - 0.5)}{0.05^²} \\ & = 384.16 \end{align*}

Respuesta: Se necesita una muestra de 385 personas (redondeando hacia arriba).

Ejemplo 2: Estudio de Mercado (Mayor Precisión)

Una empresa quiere estimar la proporción de clientes que comprarán un nuevo producto, con una mayor precisión que en el ejemplo anterior.

Nivel de Confianza (NC): 95% →Z=1.96
Margen de Error (E): 3% (0.03)
Proporción Esperada (P): Desconocida, se usa P=0.5.

\begin{align*} n & = \frac{Z^2 \times P \times (1 - P)}{E^²} \\ & = \frac{1.96^2 \times 0.5 \times (1 - 0.5)}{0.03^²} \\ & = 1067.11 \end{align*}

Respuesta: Se necesita una muestra de 1,068 personas. Nota: Una reducción del error (0.05 a 0.03) aumenta significativamente el tamaño de muestra.

Ejemplo 3: Calidad de Producto (Alto Nivel de Confianza)

Se quiere estimar la proporción de productos defectuosos en una línea de ensamblaje con una alta certeza.

Nivel de Confianza (NC): 99% →Z=2.58
Margen de Error (E): 4% (0.04)
Proporción Esperada (P): Desconocida, se usa P=0.5.

\begin{align*} n & = \frac{Z^2 \times P \times (1 - P)}{E^²} \\ & = \frac{2.58^2 \times 0.5 \times (1 - 0.5)}{0.04^²} \\ & = 1040.06 \end{align*}

Respuesta: Se necesita una muestra de 1,041 productos. Nota: Un aumento del nivel de confianza (95% a 99%) aumenta la muestra.

Ejemplo 4: Estudio con Proporción Conocida

Un estudio anterior indicó que la proporción de personas que usan transporte público en una ciudad es del 70%. Queremos validar este dato.

Nivel de Confianza (NC): 90% →Z=1.645
Margen de Error (E): 5% (0.05)
Proporción Esperada (P): 0.70

\begin{align*} n & = \frac{Z^2 \times P \times (1 - P)}{E^²} \\ & = \frac{1.645^2 \times 0.70 \times (1 - 0.70)}{0.05^²} \\ & = 227.306 \end{align*}

Respuesta: Se necesita una muestra de 228 personas. Nota: Usar una proporción conocida, si está lejos de 0.5, reduce el tamaño de muestra.

Ejemplo 5: Pequeño Margen de Error (Proporción Conocida)

Se estima la proporción de gamers en una población, con una proporción inicial del 20%, buscando un error muy bajo.

Nivel de Confianza (NC): 95% →Z=1.96
Margen de Error (E): 2% (0.02)
Proporción Esperada (P): 0.20

\begin{align*} n & = \frac{Z^2 \times P \times (1 - P)}{E^²} \\ & = \frac{1.96^2 \times 0.20 \times (1 - 0.20)}{0.02^²} \\ & = 1536.64 \end{align*}

Respuesta: Se necesita una muestra de 1,537 personas.

Ejemplo de Solución (Estimando la Media $\mu$ )

Escenario: Quieres estimar el salario promedio ( $\mu$ ) de los empleados de una empresa que tiene $N = 800$ empleados.

NC: 95% →Z=1.96
E (Error Aceptable): ±$1,000

Problema: No conoces la Desviación Estándar (σ) de los salarios.

Estimar σ (Método del Rango):
- Asumes que el salario más bajo (Mín) es $2,000.
- Asumes que el salario más alto (Máx) es $14,000.
- $R=14000-2000 = \text{\$12000}$
- $\sigma_\text{estimada} = \frac{R}{4} = \frac{120000}{4}=\$3000$
Calcular n0 (Población Infinita):
$n_0=\frac{1.96^2\times 3000^2}{1000^2}=\frac{3.8416 \times 9000000}{1000000}=3.8416 \times 9$
$n_0 \approx 34.58$
Ajuste por Población Finita (N=800):
$n=\frac{34.58}{1+\frac{34.58}{800}} \\ n=\frac{34.58}{1+0.043225} \\ n=\frac{34.58}{1.043225} \approx 33.15$

Resultado: Necesitarías una muestra de 34 empleados para estimar el salario promedio de la empresa con un error de ±$1,000 y una confianza del 95%.

Make your ideas shine!

Destacados!!!

Manual Pasaporte TICs 2026 (UTVAM)

Técnicas de Muestreo

1. Muestreo Probabilístico

a) Grupos Mutuamente Excluyentes (Disjuntos)

b) Grupos Homogéneos (Similares Internamente)

c) Grupos Heterogéneos (Diversos Internamente)

2. Muestreo No Probabilístico

3. Proceso del Diseño de una Muestra

Fases del Diseño de la Muestra

Fórmula del Tamaño de Muestra

Proceso con Información Incompleta

Determinación del valor de $Z$

Pasos para Obtener el Valor de Z

Valores Z Críticos Más Comunes

Ejemplo Detallado para 95%

Ejemplos de Cálculo de Tamaño de Muestra

Ejemplo 1: Encuesta de Opinión Pública (Máxima Incertidumbre)

Ejemplo 2: Estudio de Mercado (Mayor Precisión)

Ejemplo 3: Calidad de Producto (Alto Nivel de Confianza)

Ejemplo 4: Estudio con Proporción Conocida

Ejemplo 5: Pequeño Margen de Error (Proporción Conocida)

Ejemplo de Solución (Estimando la Media $\mu$ )

Make your ideas shine!

Destacados!!!

Manual Pasaporte TICs 2026 (UTVAM)

1. Muestreo Probabilístico

a) Grupos Mutuamente Excluyentes (Disjuntos)

b) Grupos Homogéneos (Similares Internamente)

c) Grupos Heterogéneos (Diversos Internamente)

2. Muestreo No Probabilístico

3. Proceso del Diseño de una Muestra

Fases del Diseño de la Muestra

Fórmula del Tamaño de Muestra

Proceso con Información Incompleta

Determinación del valor de ZZ

Pasos para Obtener el Valor de Z

Valores Z Críticos Más Comunes

Ejemplo Detallado para 95%

Ejemplos de Cálculo de Tamaño de Muestra

Ejemplo 1: Encuesta de Opinión Pública (Máxima Incertidumbre)

Ejemplo 2: Estudio de Mercado (Mayor Precisión)

Ejemplo 3: Calidad de Producto (Alto Nivel de Confianza)

Ejemplo 4: Estudio con Proporción Conocida

Ejemplo 5: Pequeño Margen de Error (Proporción Conocida)

Ejemplo de Solución (Estimando la Media μ\mu)

Determinación del valor de $Z$

Ejemplo de Solución (Estimando la Media $\mu$ )