Sampling Procedure
DISEÑO MUESTRAL
a. TIPO DE MUESTREO
Teniendo en cuenta los objetivos de la encuesta, se optó por un diseño muestral probabilístico, estratificado, de conglomerados y multietápico.
Probabilístico
Cada elemento del universo de estudio tiene una probabilidad de selección conocida y superior a cero. Esta información permite determinar a priori la precisión deseada en las estimaciones y posteriormente, calcular la precisión de los resultados obtenidos a partir de la información recolectada.
Estratificado
Es la clasificación de las unidades de muestreo del universo en grupos homogéneos, en función de variables independientes, altamente asociadas con los indicadores de estudio y poco correlacionadas entre sí, con el objeto de maximizar la precisión de los resultados. Este método asegura una mejor precisión de la muestra, al disminuir la varianza de las estimaciones.
Los criterios de estratificación son:
A nivel macro, el país se clasifica en dos subuniversos: el primero corresponde a las 24 ciudades con sus áreas metropolitanas y el segundo, al resto del país constituido por las demás cabeceras municipales, y sus correspondientes zonas rurales centros poblados y rural disperso.
Cada capital o área metropolitana es autorrepresentada y tiene probabilidad de selección 1. Para la estratificación y selección de la muestra, el marco de cada municipio se organizó según la nomenclatura cartográfica establecida, sectores, secciones y manzanas, con la información del número de viviendas y hogares y el estrato socioeconómico.
Para el segundo subuniverso, el proceso de selección contempló la previa estratificación de las Unidades Primarias de Muestreo - UPM. Adicionalmente, la selección de las UPM a partir de los estratos elaborados se realizó con la Técnica de Selección Controlada (Goodman, and Kish L. 1950) que es un proceso extendido de estratificación, que optimiza aún más la selección.
Las UPM se estratificaron de acuerdo con los siguientes criterios:
• Geográficos, a nivel de departamento.
• Socioeconómicos, a nivel municipal, con los siguientes indicadores:
- Tamaño poblacional del municipio o UPM.
- Nivel de urbanización, en términos de la cantidad de población de las cabeceras municipales.
- Estructura urbano-rural de la población municipal (% de población en cabecera).
- Proporción de la población con necesidades básicas insatisfechas (NBI), que a su vez se clasificó en 4 intervalos: A [0-29,8%); B [29,8%-42,7%); C [42,7%-57,3%); y D [57,3%-100%].
Cada municipio con 7.000 o más habitantes en su población total, se constituyó en Unidad Primaria de Muestreo (UPM). Los de menor población se agruparon con un vecino para constituirse en UPM.
Las UPM cuyo tamaño era similar al tamaño promedio de los estratos, se constituyeron en estratos de certeza; para efectos probabilísticos tuvieron probabilidad 1. Las demás UPM se agruparon en estratos de no certeza, aplicando las variables de estratificación en el orden de prioridad especificado antes.
De conglomerados
Corresponde a la unidad final de muestreo, que es la medida de tamaño o segmento; es el área que contiene un promedio de diez viviendas, en la que se investigan todas las viviendas, todos los hogares y todas las personas.
La concentración de la muestra en conglomerados presenta grandes beneficios en el nivel operativo, pues reduce, en forma considerable, los tiempos y los costos, y facilita la supervisión.
Multietápico
Unidades Primarias de Muestreo (UPM). Hay UPM de inclusión forzosa y de inclusión probabilística:
- Son de inclusión forzosa las áreas metropolitanas y el resto de capitales departamentales que son autorrepresentadas, pues su tamaño muestral permite estimaciones trimestrales separadas para cada una de ellas, y aquellos municipios de tamaño intermedio cuya población es similar o mayor que el tamaño promedio de los estratos de su departamento.
- Son de inclusión probabilística las UPM seleccionadas con PPT de los estratos conformados por dos o más UPM (estratos de no certeza). La técnica de selección controlada utilizada permitió mediante un procedimiento probabilístico incrementar las probabilidades de selección de las combinaciones preferidas de UPM que podían ser seleccionadas en un departamento, adicionalmente a lo obtenible con un muestreo estratificado corriente.
En el caso de la Muestra Maestra la selección controlada proporcionó un mejor balance interregional en las características de las UPM seleccionado. El resultado final de este ejercicio fue lograr la máxima reducción posible en el error estándar de estimación de los resultados.
Unidades Secundarias de Muestreo (USM). En las cabeceras municipales y centros poblados, las USM son grupos de manzanas contiguas del mismo municipio, que contienen un mínimo de 12 medidas de tamaño (MT) con un promedio de 10 viviendas, y en la zona rural dispersa, la USM es una sección o sector censal. El tamaño de la USM permite un control adecuado de la distribución y rotación de la muestra en cada etapa. Para la selección de las USM se aplica el siguiente procedimiento (PPT):
- Conformación, delimitación y listado de las USM por estrato socioeconómico (solo cabeceras municipales) de cada municipio seleccionado, siguiendo el orden de la nomenclatura de la cartografía censal: sector, sección y manzana.
- Cálculo del número de medidas de tamaño (MT), dividiendo por 10 (el número de viviendas) y aproximando a un valor entero.
- Cálculo de intervalo de muestreo (IM), dividiendo el total de MT existentes en una zona por el número de USM requeridas en la muestra de la zona.
- Selección de un número de arranque entre 1 y el valor del intervalo, el cual indica la primera USM de la muestra de la zona; y selección del resto de USM de la zona, sumando sucesivamente el IM al número de arranque.
Unidades Terciarias de Muestreo (UTM). El tercer paso es la selección dentro de cada USM de una o más UTM, dependiendo de las requeridas, del tamaño y cantidad de USM preseleccionadas en cada municipio.
Cada UTM es un segmento con un promedio de 10 viviendas contiguas (5 a 14 viviendas), es decir, una medida de tamaño (MT). En un paso intermedio, se seleccionan manzanas en las cabeceras municipales, centros poblados y segmentos de sección rural claramente delimitados, con límites naturales (quebradas, ríos, etc.) o sociales (carreteras, caminos, etc.). Los segmentos de los sectores rurales se conforman previamente con base en fotografías aéreas y en lo posible, se procura que tengan un promedio de 10 viviendas; sin embargo, por insuficiente detalle cartográfico, los segmentos pueden tener dos o más MT.
La selección se hace con probabilidad proporcional al número de MT (PPT), así una manzana o segmento rural puede contener una o más MT, y las que tienen menos de 5 viviendas se juntan con una manzana vecina del mismo estrato socioeconómico.
Las áreas urbanas no urbanizadas se anexan al área o manzana vecina muy cercana con una o más viviendas con el objeto de que tengan probabilidad de selección y para que puedan captar cualquier proceso futuro de urbanización. Si solo se requiere una MT y la manzana o porción solo tiene una MT, la muestra queda constituida por todas las viviendas y hogares existentes. Si la manzana o segmento rural tienen dos o más MT se procede al recorrido y delimitación de segmentos de una MT, en el terreno.
Finalmente, se hace la asignación aleatoria del orden en que entrarán los segmentos al proceso de rotación.
Unidades Cuartas de Muestreo (UCM). Cada UCM es un segmento de 10 viviendas contiguas (5 a 14 viviendas), es decir una medida de tamaño MT y su selección es aleatoria.
Finalmente se hace una asignación aleatoria del orden en que entrarán los segmentos al proceso de rotación. En este proceso de selección por etapas, solo se requiere una actualización cartográfica detallada de las áreas seleccionadas.
Para el subuniverso del resto de cabeceras, centros poblados y rural disperso se seleccionó:
- En una primera etapa, la UPM, utilizando la técnica de selección controlada dentro de cada estrato.
- Para la segunda etapa se seleccionó en la cabecera y centros poblados la manzana, y en el rural disperso la sección o sea la USM.
- En la tercera etapa se seleccionó el segmento o UTM.
En este proceso de selección por etapas sólo se requiere una actualización cartográfica detallada de las áreas seleccionadas.
b. ROTACIÓN DE LA MUESTRA
Dado el carácter continúo de la GEIH y con el fin de controlar la repetición de la encuesta a los mismos hogares en periodos cortos de tiempo, lo cual puede generar rechazos y la reducción en la cobertura y calidad de la encuesta, se definieron siguientes los procedimientos que se resumen a continuación:
En las capitales de departamento se conformaron grupos de MT, mínimo 12, para asegurar que por lo menos en tres años no se repitiera un segmento.
En las UPM probabilísticas la encuesta se aplica en segmentos diferentes, aunque se repiten anualmente el mismo mes; este proceso de rotación es cuidadosamente controlado y se realiza con un trimestre de anticipación.
Se verifican las manzanas y las secciones censales donde se agotan las medidas de tamaño.
Se elabora un recuento de viviendas para conformar nuevos segmentos para el desarrollo de la encuesta.
c. DEFINICIÓN TAMAÑO DE LA MUESTRA
Inicialmente el tamaño de la muestra mensual de la Encuesta Nacional de Hogares (ENH) correspondía aproximadamente a 23.000 hogares. En el 2000 con la implementación de la ECH la muestra maestra fue ampliada de 165 municipios a más de 240; con 30.000 hogares en 13 áreas y 7.500 en el resto de cabeceras, centros poblados y rural disperso. Durante 2004 se amplió la muestra maestra, con un total de 44.400 hogares, con 30.000 hogares en 13 áreas y 14.400 en el resto de cabeceras, centros poblados y rural disperso. Para el año 2006 con la implementación de la GEIH, se amplió la muestra a 11 ciudades más; con 17.600 hogares adicionales, para un total de 62.000 hogares. Con el marco generado por el censo 2005, la nueva muestra implementada desde 2009 está conformada por 437 municipios y anualmente se visitan aproximadamente 248.028 hogares, concentrados en 22.548 segmentos. La muestra mensual es de 20.669 hogares, 18.790 viviendas y 1.879 segmentos en las capitales de los nuevos departamentos se visitan anualmente 1.272 segmentos.
Los tamaños de muestra se calculan con una precisión deseada de la variable tasa de desempleo no superior a un error estándar relativo del 5% y una tasa de desempleo del 10%. Los cálculos se realizan con las fórmulas correspondientes al tipo de diseño muestral. Se ajustan con base en el efecto de los conglomerados en el diseño (deff) el cual es una relación para cada dominio, entre la varianza real de este diseño de conglomerados y la que se obtendría con un diseño aleatorio simple de elementos.