Cleaning Operations
Para la conformación del ingreso per cápita de la unidad de gasto, insumo fundamental de la medición de pobreza monetaria, se aplican los siguientes procedimientos a partir del agregado anual de las encuestas de hogares (ECH y GEIH):
1. Definición de las fuentes de ingreso.
2. Definición de valores faltantes.
3. Detección de valores extremos.
4. Detección de 'falsos ceros'.
5. Imputación de valores faltantes, extremos y 'falsos ceros' (Método Hot-Deck).
6. Empalme de ingresos ECH-GEIH y GEIH-NUMA.
7. Imputación de ingreso por vivienda para propietarios y usufructuarios.
Para conocer el detalle metodológico de estos procedimientos remitirse al documento Algoritmo Conformación de Ingresos 2002-2010
CORRECCIÓN POR OMISIÓN E IMPUTACIÓN DE FALSOS CEROS Y VALORES EXTREMOS: "HOT DECK"
Los casos que se imputarán son: los casos declarados como outliers, los casos clasificados como "falsos ceros", y los faltantes originales o que venían en la encuesta. Para realizar este procedimiento se utiliza un modelo de imputación "Hot Deck".
Esta metodología clasifica los datos relevantes para cada fuente de ingresos de acuerdo con categorías que los diferencien. Por ejemplo, el ingreso monetario primera actividad es diferente si las personas que lo perciben pertenecen a grupos que difieren por sexo, nivel educativo, posición ocupacional, dominio de la encuesta, estrato socio-económico, jefatura de hogar o grupos de edad.
Los individuos en una fuente de ingresos cualquiera son clasificados como "donantes" y "receptores" . Los donantes son las personas que informaron su ingreso y que en los dos pasos anteriores no fueron declarados "outliers" o "falsos ceros" (solamente en el caso de IMPA). Los receptores son individuos que no declararon ingreso en la encuesta, o fueron declarados "outliers" o "falsos ceros" (solamente en el caso de IMPA).
El ingreso de los donantes es el insumo para imputar el de los receptores. El procedimiento es el siguiente:
Los donantes y los receptores se distribuyen en las diferentes celdas definidas a partir de variables que diferencian el ingreso. Si en una celda cualquiera el número de donantes es mayor que el número de receptores, se escogerá aleatoriamente sin repetición un número de donantes igual al número de receptores, y se les asigna a estos últimos los valores de ingreso de los donantes seleccionados. Por el contrario, si el número de donantes es menor que el de receptores la muestra aleatoria de ingresos proveniente de los donantes será seleccionada con repetición. Si en alguna celda se encuentran receptores más no donantes, el criterio de clasificación se relajará al omitir una variable en la clasificación, y se procederá a repetir el proceso de asignación aleatoria anteriormente descrito.
Una vez que han sido imputados los casos que así lo requieren, se procede a la construcción del agregado de ingreso a nivel de la unidad de gasto.
Como se indicó anteriormente, una vez que se han corregido algunos de los posibles sesgos de las distintas fuentes de ingreso, se agregan para obtener el ingreso corriente disponible de la unidad de gasto (IUG).
Posterior a la estimación del IUG, se debe identificar el estatus de tenencia de vivienda por parte del hogar para determinar si es necesario realizar una imputación por propiedad de la misma.
IMPUTACIÓN POR PROPIEDAD DE LA VIVIENDA
El pago por alquiler o por cuota de amortización, diferencia el ingreso disponible de un hogar que efectúa estos pagos frente al de uno que es propietario o vive en usufructo. El proceso de imputación por propiedad es una homogenización del ingreso que hace posible las comparaciones entre hogares con diferente estatus de ocupación de la vivienda.
Adicionalmente, teniendo en cuenta que en el cálculo de la incidencia de la pobreza intervienen dos elementos, el valor de la línea de pobreza y el ingreso per cápita de la unidad de gasto, cada uno de estos debe hacer referencia a los mismos rubros. Dentro de los rubros de gasto considerados para la construcción de línea de pobreza se incluye un monto por arriendo imputado. Por esta razón se hace necesario que dentro del ingreso de los hogares también se considere la inclusión del monto por imputación de arriendo para propietarios con el fin de garantizar consistencia al momento de estimar el porcentaje de personas en condición de pobreza.
Dependiendo del tipo de tenencia, se efectúa una imputación al IUG por concepto de propiedad de la vivienda. Las unidades de gasto a las cuales se les efectúa esta imputación son las que reportan las siguientes categorías de ocupación de la vivienda:
1. Vivienda propia totalmente pagada
2. Vivienda propia la están pagando
3. Vivienda en usufructo
De acuerdo con la etapa de la Encuesta de Hogares, se establecieron dos alternativas para asignar un valor por propiedad de la vivienda para las categorías anteriormente mencionadas:
1. Para la Encuesta Continua de Hogares (ECH) 2002 a 2005 se utilizó un modelo Hot Deck.
2. Para la Gran Encuesta Integrada de Hogares (GEIH) 2008 a 2010 se utilizó la pregunta del módulo de Datos del Hogar Si tuviera que pagar arriendo por esta vivienda, ¿cuánto estima que tendría que pagar mensualmente?
Las etapas de la ECH no incluyen la pregunta sobre arriendo esperado, razón por la cual se utilizó la metodología Hot Deck para asignar un valor imputado por propiedad. Adicionalmente, en las 13 áreas metropolitanas la ECH 2002 a 2005 únicamente incluye información del módulo de vivienda en el tercer trimestre. Para los dominios Otras Cabeceras y Rural la información del módulo de vivienda se recolectó para los 4 trimestres del año.
La GEIH por su parte incluye información de dicho módulo para todos los trimestres y para los tres dominios geográficos (13 áreas, otras cabeceras y rural).
La ausencia del módulo de vivienda en las 13 áreas en los trimestres I, II y IV de las ECH 2002 a 2005 implicó utilizar un modelo logístico multinomial para predecir la probabilidad de pertenencia a cada categoría de tenencia de vivienda en dichos trimestres .
Con la información completa sobre tenencia de la vivienda en cada una de las etapas y dominios de las Encuestas de Hogares, se procedió a realizar la imputación por propiedad de la vivienda de acuerdo con las dos alternativas mencionadas anteriormente. El procedimiento en cada caso se describe a continuación.
MODELO HOT DECK PARA IMPUTACIÓN POR PROPIEDAD DE LA VIVIENDA EN LAS ECH 2002-2005
La metodología Hot Deck divide la población en dos sub grupos, los donantes y los receptores. La información de los donantes se utiliza como insumo para predecir la de los receptores. En el caso de la imputación por propiedad de la vivienda los donantes son aquellos registros identificados como arrendatarios. Los receptores son los casos que en la pregunta sobre tenencia de la vivienda contestaron: Vivienda propia totalmente pagada, Vivienda propia pagándola y Vivienda en usufructo.
En el presente ejercicio se definieron como criterios de clasificación de donantes y receptores los siguientes: el área metropolitana, el estrato y el número de cuartos. Al combinar los diferentes criterios se generan celdas homogéneas en su interior y heterogéneas entre sí. Las celdas resultantes diferencian los valores en los cánones de arrendamiento de manera significativa y permiten minimizar los sesgos al construir la distribución de datos completos.
A partir del método Hot Deck, los registros se ubican dentro de las celdas generadas. A continuación se compara el número de donantes y de receptores por celda. Si hay más donantes que receptores, se realiza una selección aleatoria sin reemplazo para asignar el valor del arriendo que le corresponderá a cada receptor. Si el número de donantes es menor al de receptores, se lleva a cabo una selección aleatoria con reemplazo. Por último, si hay celdas sin donantes se procede a relajar el nivel de clasificación y se vuelve a repetir el proceso con estos casos.
En cada celda el valor del arriendo imputado que se le asigna a los receptores (propietarios y usufructo) será equivalente al de los donantes (arrendatarios) que tienen características similares (área metropolitana, el estrato y el número de cuartos).
VALOR DEL ARRIENDO ESPERADO PARA IMPUTACIÓN POR PROPIEDAD DE LA VIVIENDA EN LA GEIH 2008-2010
En la GEIH a los propietarios se les pregunta por el canon de arrendamiento que pagarían si fueran arrendatarios. Esta información fue utilizada en el ejercicio para imputar el valor por arriendo a las categorías de propietarios (vivienda propia totalmente pagada y pagándola) y a los hogares en usufructo31. El hecho de que este monto provenga de los propietarios, lo convierte en una solución idónea para el ajuste del ingreso.