Sampling Procedure
DISEÑO E IMPLEMENTACION DE LA MUESTRA PROBABILISTICA
La Encuesta de Calidad de Vida 1997, se llevó a cabo en una submuestra de la nueva Muestra Maestra de Población de Propósitos Múltiples del DANE, utilizada por primera vez en 1994 para la Evaluación de la Cobertura del Censo de Población de 1993, e incorporada a partir de 1996 al Sistema de Encuestas Nacionales de Hogares.
A. LA MUESTRA MAESTRA
Tiene un tamaño total de 70.000 hogares, distribuidos en 219 Unidades Primarias de Muestreo (básicamente municipios), y 3.500 segmentos, de 20 hogares en promedio con una composición urbano-rural similar a la de la población total. El Marco de Muestreo utilizado para la selección se basó en los materiales del Precenso 1993, para los 60 principales centros urbanos del país, y en una combinación de materiales del Censo de 1985 y del Catastro Nacional, en las zonas rurales y centros urbanos menores. La representación de la muestra por variables geográficas y socioeconómicas se ajusta para cada encuesta en función de los resultados y proyecciones del Censo de Población de 1993.
El diseño muestral es probabilístico, de conglomerados, estratificado y polietápico. Toda la superficie del universo poblacional (que excluye solamente las zonas rurales dispersas de la Orinoquía y la Amazonía), tuvo probabilidad de selección. En consecuencia, las zonas despobladas de las áreas rurales y de los centros urbanos, fueron anexadas a un área vecina que tuviera alguna población, con el objeto de garantizar, dentro de un enfoque de muestreo de áreas, la captación dinámica de los cambios poblacionales que se fueran presentando en el futuro.
La selección probabilística de las diferentes unidades de muestreo (conglomerados) estuvo siempre precedida de algún tipo de estratificación, en función de variables altamente correlacionadas con la mayoría de los fenómenos sociales y económicos del país. Las unidades primarias (municipios) se estratificaron dentro de cada departamento, con base en el tamaño de las cabeceras municipales (nivel de urbanización), su composición urbano-rural, y el indicador de necesidades básicas insatisfechas (NBI); las unidades secundarias (secciones censales o manzanas), según su localización urbana o rural, y cuando se disponía de información, según el estrato socioeconómico en que estaban clasificadas.
Para la selección de las unidades primarias se aplicó la técnica de "Selección Controlada" (ver Goodman y Kish, 1950), que permite, dentro de un esquema totalmente probabilístico, una óptima composición de la muestra según las variables de estratificación, con el fin de garantizar la máxima reducción posible en el error de muestreo de cualquier tipo de estimación, que es el objetivo genérico perseguido por los procesos de estratificación.
Para la precisa delimitación y partición de las áreas últimas de muestreo de las zonas urbanas no incluidas en el precenso y de las zonas rurales, se llevó a cabo la denominada “segmentación”. Este proceso, consistió en la visita de las citadas áreas últimas seleccionadas a nivel central, con el objeto de recorrerlas minuciosamente, ubicar las viviendas existentes, e identificar con precisión sus límites externos y todas las particularidades físicas internas que pudieran ser utilizadas para su partición en segmentos múltiples, de acuerdo con su tamaño total.
B. LA SUBMUESTRA PARA LA ENCUESTA DE CALIDAD DE VIDA
Estuvo constituida por 10.016 hogares, concentrados en 1.026 segmentos, y en 75 unidades primarias; con una distribución urbano-rural ligeramente diferente, 621 segmentos en cabeceras y 405 en resto; el menor tamaño en la zona rural está dado en función de la menor heterogeneidad de esta. De esta forma se garantizan a ambas zonas las mismas posibilidades analíticas y de desagregación de resultados, con aproximadamente el mismo nivel de precisión. Por definición, este enfoque genera desiguales probabilidades de selección, que obligan el uso de ponderaciones en los resultados, equivalentes al recíproco de las probabilidades, o a factores equivalentes.
La selección de la submuestra descrita, se hizo también con un diseño probabilístico que dividió la muestra total de unidades primarias en tres submuestras equivalentes, todas ellas representativas a nivel nacional, de grandes regiones, de algunas subregiones, y de los mayores centros urbanos, los mayores municipios del país se repiten en cada submuestra, pero con diferentes segmentos. En la clasificación de las tres submuestras se aplicaron los mismos criterios de estratificación utilizados en el diseño total.
La cobertura, obtenida como resultado de dividir el número de encuestas completas (9.121) entre el número de hogares seleccionados fue de 91.1%, lo que equivale a una tasa de no respuesta del 8.9%.
REPRESENTATIVIDAD DE LA MUESTRA
El número posible de subgrupos de análisis o desagregaciones en los que se pueden presentar los resultados de la Encuesta, depende del tamaño muestral, la precisión deseada en las estimaciones (error estándar relativo, Esrel), los efectos de los conglomerados deff (municipios, segmentos, hogares) y la frecuencia de los fenómenos estudiados.
Con el tamaño de muestra estudiado (9.000 hogares aproximadamente), fenómenos de muy baja frecuencia, por ejemplo 0.5%, sólo pueden ser estimados para el conjunto del universo de estudio, con precisión regular, es decir, con errores estándar relativos (Esrel) entre 8 y 10%; fenómenos de baja frecuencia, por ejemplo de 1 a 3%, se pueden estimar al mismo nivel global, con buena precisión, o sea Esrel de alrededor del 5%; fenómenos de 10% de frecuencia, pueden estimarse con error aceptable para un número variable de 5 a 8 particiones del universo.
En síntesis, a mayor frecuencia del fenómeno, mayor precisión relativa en las estimaciones, y mayor número de particiones o desagregaciones para efectos de presentación y análisis.
TIPO DE MUESTREO
Probabilística, de conglomerados, polietápica y estratificada.