COLOMBIA - Encuesta Nacional de Trabajo Infantil - ENTI 2011
ID del Estudio | DANE-DIRPEN-ENTI-2011 |
Año | 2011 |
País | COLOMBIA |
Productor(es) | Dirección de Metodología y Producción Estadística - DIMPE |
Financiamiento | Departamento Administrativo Nacional de Estadística - DANE - Instituto Colombiano de Bienestar Familiar - ICBF - Ministerio de Trabajo - MINTRABAJO - |
Colección(es) | |
Metadatos |
![]() |
Creado el
Sep 03, 2015
Última modificación
Sep 25, 2017
Visitas a la página
140549
Formatos disponibles: |
sav , txt
|
|
- Descripción de la operación estadística
- Descripción de Variables
- Materiales Relacionados
- Obtener Microdatos
Muestreo
Procedimiento de muestreo
MARCO MUESTRAL
Hogares con niños, niñas y adolescentes entre 5 y 17 años que conforman la GEIH de octubre a diciembre de 2011.
DISEÑO DE LA MUESTRA
Para el diseño muestral de la ENTI, se utilizó la misma metodología de la GEIH 2011, teniendo en cuenta para su adaptación, el aprovechamiento de la información, así como el mantenimiento de la rigurosidad técnica. Se consideraron diversos aspectos socioeconómicos y demográficos de la población objetivo, y lo relacionado con la población infantil trabajadora.
Por lo tanto, el diseño muestral de la ENTI 2011 es probabilístico, de conglomerados desiguales, estratificado y polietápico, según las siguientes definiciones:
** PROBABILÍSTICO: Significa que cada unidad del universo de estudio tiene una probabilidad de selección conocida y superior a cero. Este tipo de muestra permite establecer anticipadamente la precisión deseada en los resultados principales, y así calcular la precisión observada en todos los resultados obtenidos.
** DE CONGLOMERADOS: Son grupos de las unidades de observación de la investigación, que se han dado en forma natural por razones geográficas, demográficas y socioeconómicas.
El muestreo de conglomerados permite minimizar los costos de la recolección, a costa de un moderado incremento en el error estándar de las estimaciones. El efecto de la conglomeración de las unidades de muestreo en la precisión de los resultados está asociado con la correlación intraconglomerado (intraclásica) de las variables de resultado, con el tamaño y con el número de los conglomerados seleccionados.
En un diseño óptimo, a mayor correlación intraclásica, menor el tamaño del conglomerado o la submuestra dentro de este; y mayor el número de conglomerados, y viceversa (cf. Kish, 1965).
Las estimaciones provenientes del muestreo de conglomerados desiguales son sesgadas, pues los valores de la distribución de muestreo no son iguales a los valores poblacionales o del universo de estudio. El sesgo se reduce considerablemente estratificando por tamaño los conglomerados. Las siguientes son las categorías de conglomerados de la GEIH:
- Unidades Primarias de Muestreo (UPM): se denominan así los municipios de 7.000 y más habitantes. Los municipios de menor tamaño se combinan con algún vecino de similares características, para completar un tamaño mínimo de 7.000 habitantes, y poder así garantizar los requerimientos de tamaño muestral a este nivel.
- Unidades Secundarias de Muestreo (USM): son grupos de manzanas en la zona urbana de aproximadamente 120 viviendas, y secciones en la zona rural.
- Unidades Terciarias de Muestreo (UTM): son las manzanas seleccionadas en la USM urbanas.
- Unidades Cuartas de Muestreo (UCM): son los segmentos o medidas de tamaño MT (áreas de 10 viviendas en promedio) en la zona urbana y rural, con límites naturales fácilmente identificables, en los cuales se encuestan todos los hogares.
** ESTRATIFICADO: Es la clasificación de las unidades de muestreo del universo en grupos homogéneos, en función de variables independientes, altamente asociadas con los indicadores de estudio y poco correlacionadas entre sí, con el objeto de maximizar la precisión de los resultados.
La estratificación es la técnica de optimización por excelencia, su efecto en la magnitud del error estándar de estimación depende del grado de homogeneidad interna de los estratos y de su heterogeneidad entre sí (cf. Kish, 1965).
A nivel macro, el país se clasificó en dos sub-universos: el primero corresponde a las 24 ciudades con sus áreas metropolitanas; el segundo, al resto del país, constituido por cabeceras municipales y sus correspondientes zonas rurales.
Cada capital o área metropolitana es autorrepresentada y tiene probabilidad de selección 1. Para la estratificación y selección de la muestra, el marco de cada municipio se organizó según las definiciones cartográficas establecidas en sectores, secciones y manzanas, con la información del número de viviendas y hogares y el estrato socioeconómico.
Para el segundo sub-universo, el proceso de selección contempló la previa estratificación de las UPM, y dentro de las seleccionadas, la previa estratificación de USM y UTM.
Adicionalmente, la selección de las UPM a partir de los estratos elaborados se hizo con la Técnica de Selección Controlada, que es un proceso extendido de estratificación, que optimiza aún más la selección.
** POLIETÁPICA: Para lograr la selección de las unidades de observación (viviendas, hogares o personas), se seleccionaron secuencialmente las unidades de muestreo de cada tipo (UPM, USM, UTM y UCM), con probabilidades de selección en función del número de viviendas. La probabilidad final de selección de viviendas, hogares y personas, es el producto de las probabilidades de las cuatro etapas.
TAMAÑO DE LA MUESTRA
Muestra esperada de los hogares y niños y niñas de 5 a 17 años, por departamentos
Departamento: Antioquia
Suma de HOGARES:2001
Suma de NIÑOS:2580
Departamento:Atlántico
Suma de HOGARES:1826
Suma de NIÑOS: 2560
Departamento:Bogotá D.C.
Suma de HOGARES:1630
Suma de NIÑOS:2062
Departamento:Bolivar
Suma de HOGARES:1690
Suma de NIÑOS:2371
Departamento:Boyacá
Suma de HOGARES:1414
Suma de NIÑOS:1863
Departamento:Caldas
Suma de HOGARES:1244
Suma de NIÑOS:1561
Departamento:Caquetá
Suma de HOGARES:2099
Suma de NIÑOS:2973
Departamento:Cauca
Suma de HOGARES:1975
Suma de NIÑOS:2583
Departamento:Cesar
Suma de HOGARES:1959
Suma de NIÑOS:2752
Departamento:Choco
Suma de HOGARES:1376
Suma de NIÑOS:1941
Departamento:Córdoba
Suma de HOGARES:1410
Suma de NIÑOS:1959
Departamento:Cundinamarca
Suma de HOGARES:644
Suma de NIÑOS:857
Departamento:Huila
Suma de HOGARES:1707
Suma de NIÑOS:2235
Departamento:La Guajira
Suma de HOGARES:1792
Suma de NIÑOS:2596
Departamento:Magdalena
Suma de HOGARES:1979
Suma de NIÑOS:2770
Departamento:Meta
Suma de HOGARES:1735
Suma de NIÑOS:2365
Departamento:Nariño
Suma de HOGARES:1463
Suma de NIÑOS:1909
Departamento:Norte de Santander
Suma de HOGARES:1652
Suma de NIÑOS:2245
Departamento:Quindío
Suma de HOGARES:1259
Suma de NIÑOS:1593
Departamento:Risaralda
Suma de HOGARES:1333
Suma de NIÑOS:1700
Departamento:San Andrés
Suma de HOGARES:1002
Suma de NIÑOS:1238
Departamento:Santander
Suma de HOGARES:1290
Suma de NIÑOS:1686
Departamento: Sucre
Suma de HOGARES:1676
Suma de NIÑOS:2385
Departamento: Tolima
Suma de HOGARES:1464
Suma de NIÑOS: 1904
Departamento:Valle del Cauca
Suma de HOGARES:1808
Suma de NIÑOS:2382
Total general
Suma de HOGARES:39428
Suma de NIÑOS:53070
Tasa de respuesta
ERRORES DE MUESTREO
Las características poblacionales son estimaciones que se calculan a partir de los elementos que incluye la muestra. Esta estimación depende del diseño de la muestra y de la combinación particular de los elementos que resultarán seleccionados. Estas estadísticas obtenidas están sujetas a dos clases de error: los errores ajenos al muestreo y los errores debidos al muestreo.
Errores ajenos al muestreo: también llamados errores no muestrales, se presentan porque los procedimientos de observación son imperfectos. Esta clase de errores es inherente a toda investigación estadística. Establecer su magnitud supone el uso de procesos complicados de replicación, con otros encuestadores, otras formas de preguntas, etc. que permitan comprobar la variabilidad de las respuestas frente al operativo utilizado.
Errores debidos al muestreo: también llamados errores muestrales, se presentan debido a que solo se investiga una fracción de la población total. La muestra seleccionada es una de un número de combinaciones de N elementos tomados en grupos de n posibles muestras que hubieran podido ser seleccionadas. La variación en los resultados que habrían dado estas muestras, debido al azar, forman el error de muestreo. El cálculo de estos errores se puede hacer a partir de los resultados obtenidos y permite evaluar la calidad del diseño utilizado, siempre y cuando pertenezca a la categoría de los diseños aleatorios. Para medir la magnitud de la variabilidad de la distribución muestral del estimador, denominado error muestral, se usa frecuentemente la desviación estándar y el coeficiente de variación.
La desviación estándar de una estimación se llama error estándar y está definido como la raíz cuadrada de la varianza.
En la práctica no se conoce la varianza del estimador, entonces se aproxima por su estimador y su estimación; así con la muestra seleccionada se tiene la desviación estándar de la distribución de muestreo de una estimación o error estándar de la estimación.
La varianza es la magnitud de la variabilidad de la distribución muestral debida al azar: entre menor sea la magnitud de esta variabilidad, mejor será la precisión de la estimación del parámetro de interés, siempre que no haya sesgo. Esta magnitud depende del método utilizado para seleccionar la muestra, de la variabilidad natural de la variable estudiada, del tamaño de la muestra, de la frecuencia con que se presente el hecho estudiado y del parámetro a estimar, ya que para una misma muestra, es diferente si se desea estimar un total, un promedio, una razón, etc.
El coeficiente de variación se define como la relación porcentual del error estándar a la estimación central, esto es, el cociente entre el error estándar del estimador y el valor esperado del estimador, multiplicado por 100.
El valor de este coeficiente, expresado en porcentaje, permite evaluar rápidamente la calidad de un procedimiento de estimación. Por lo general no se conoce la varianza real del parámetro y tampoco su esperanza; estas son expresiones con las que se hacen comparaciones y se toman decisiones sin necesidad de disponer de un valor numérico. Por lo tanto, aunque no sea precisamente la misma medida, se utiliza el coeficiente de variación estimado cve, con la muestra particular obtenida.
En consecuencia, se suele considerar que el resultado de una estimación es bueno cuando su coeficiente de variación es menor del 5%, aceptable entre 5% y 10%; apenas regular entre 10% y 15%; y no deseable si es mayor que el 15%.
Aunque la magnitud de la variabilidad de la distribución muestral del estimador es medida por la varianza, el error estándar y el coeficiente de variación, este último tiene la ventaja de dar dicha medida en términos porcentuales, por lo cual es una medida común para las estimaciones.
Los datos obtenidos permiten evaluar además la eficiencia del diseño de la muestra utilizada. Se trata del efecto de diseño (deff). Este se define como el cociente entre la varianza del estimador de r en un diseño p(s) cualquiera y la varianza de una muestra aleatoria simple de la misma cantidad de elementos.
Expansores / Ponderadores
FACTORES DE EXPANSIÓN
Los resultados de la muestra son representativos de la población total del universo investigado, por lo tanto, estos se expanden a partir de cada segmento seleccionado con el fin de producir estimaciones a dicho universo.
FACTOR BÁSICO DE EXPANSIÓN (F):
Es el recíproco de la probabilidad final de cada vivienda y persona estudiadas. Aplicado a los datos muestrales, da a cada elemento de la muestra el peso o representación que le corresponde en el universo investigado. En consecuencia, mediante su aplicación, se estiman numéricamente, en forma aproximada, las características de dicho universo.
En las muestras con probabilidad final desigual, este peso, o un factor equivalente, debe aplicarse obligatoriamente con el fin de producir estimaciones insesgadas.
PESO DE SUBMUESTREO (Phj):
Está dado por segmento y es teóricamente igual a 1 para todos ellos, en razón a que representan una medida de tamaño. Sin embargo, el desarrollo dinámico del marco de muestreo puede hacer que este peso sea mayor o menor que 1, de acuerdo con la densidad de viviendas del segmento en el momento de hacer la encuesta y por tal motivo modifica el factor básico de expansión en el segmento.
AJUSTE DE COBERTURA POR NO RESPUESTA (Rhj):
Se da cuando las tasas de no-respuesta varían en los subgrupos de la población de diferentes características (ejemplo, en los estratos socioeconómicos). En este caso, la no-corrección, daría lugar a estimaciones sesgadas para el conjunto de la población estudiada. El ajuste habitual es asignar a los hogares y personas no encuestadas, el promedio de las características de los encuestados en el mismo segmento. Esto se logra, corrigiendo el factor básico de expansión por un nuevo factor resultante de la razón entre número de hogares seleccionados en un segmento y el número de hogares encuestados en el mismo segmento.
EL FACTOR FINAL DE EXPANSIÓN (Wha):
Es el producto de los anteriores y se aplica a cada segmento de la ciudad o área investigada.
Los efectos de las deficiencias del marco de muestreo censal, y las imprecisiones en la estructura del universo de población general estimada a partir de la muestra expandida, se corrigen al máximo con base en un factor de ajuste estructural y de totales, calculado con las cifras del Censo General 2005 proyectadas a la fecha de cada encuesta. En este caso, se utiliza la información auxiliar por grupos de sexo y edad. Este proceso se realiza a través de los Métodos de Calibración (cf. Lundström, S. y Särndal, C.E., 2005), que son procedimientos que utilizan información auxiliar relacionada con las variables de estudio, con el fin de mejorar la precisión y reducir los sesgos en las estimaciones. A continuación se describe la técnica utilizada.
<