Cleaning Operations
DISEÑO DE SISTEMAS DE CAPTURA
El formulario electrónico es una herramienta tecnológica implementada por el DANE, con el fin de recoger la información de la Encuesta Anual de Servicios. Este sistema permite el ingreso de las fuentes a diligenciar la información y realiza verificaciones de consistencia en línea. Igualmente permite al personal de crítica y coordinación de la encuesta en el DANE, monitorear el diligenciamiento por parte de las fuentes, y en general el desarrollo del operativo.
Diligenciamiento formularios: Corresponde a las fuentes y comprende la actualización de carátula única, directorio de establecimientos y diligenciar la información de los diferentes módulos del formulario, como personal ocupado y gastos, ingresos, costos y gastos, activos, información departamental, TIC, entre otros.
Coordinador (a): Le corresponde la administración del sistema, entre sus funciones. Tiene acceso a los formularios diligenciados, para hacer seguimiento al diligenciamiento por parte de las fuentes. También debe administrar la lista de personas usuarias del sistema, puede crear y modificar personas usuarias y asignar las fuentes que va a trabajar cada una de las personas
usuarias.
Otra de las funciones de la Coordinación es la consulta de operativo, por medio de esta función puede monitorear el desarrollo del operativo.
Existen dos niveles de coordinación, la de DANE Central con acceso total sobre las fuentes y personas usuarias de la encuesta, y la de territoriales, con acceso limitado únicamente a personas usuarias y fuentes de su sede correspondiente.
Personal de crítica: Tienen la responsabilidad de realizar la revisión y avalar los formularios diligenciados por las fuentes, hacer el seguimiento y prestar soporte a las fuentes que se encuentran diligenciando. También debe realizar el monitoreo del avance del operativo que tiene a su cargo.
Diligenciamiento formularios: Corresponde a las fuentes y comprende la actualización de carátula única, directorio de establecimientos y diligenciar la información de los diferentes módulos del formulario, como personal ocupado y gastos, ingresos, costos y gastos, activos, información departamental, TIC, entre otros.
Coordinador (a): Le corresponde la administración del sistema, entre sus funciones. Tiene acceso a los formularios diligenciados, para hacer seguimiento al diligenciamiento por parte de las fuentes. También debe administrar la lista de personas usuarias del sistema, puede crear y modificar personas usuarias y asignar las fuentes que va a trabajar cada una de las personas usuarias.
Otra de las funciones de la Coordinación es la consulta de operativo, por medio de esta función puede monitorear el desarrollo del operativo. Existen dos niveles de coordinación, la de DANE Central con acceso total sobre las fuentes y personas usuarias de la encuesta, y la de territoriales, con acceso limitado únicamente a personas usuarias y fuentes de su sede correspondiente.
Personal de crítica: Tienen la responsabilidad de realizar la revisión y avalar los formularios diligenciados por las fuentes, hacer el seguimiento y prestar soporte a las fuentes que se encuentran diligenciando. También debe realizar el monitoreo del avance del operativo que tiene a su cargo.
Modelo entidad relación
El sistema le ofrece las herramientas necesarias para el desarrollo de estas tareas.
Transmisión de datos
La transmisión de los datos es en línea. Una vez se ingresan los datos por parte de la fuente, estos, entran al sistema. No obstante, la disponibilidad de la información depende del rol en que se encuentre la información. Así mientras la fuente está diligenciando los datos (aparece en digitación), estos pueden ser vistos por cualquiera de los roles, pero solo está disponible para la fuente que una vez termine de diligenciar el cuestionario, en ese momento debe enviarlos. Luego pasa al crítico, rol que debe revisar la consistencia de la información, la completitud del formulario, la coherencia de los datos (estado en revisión), solicitar aclaraciones a la fuente. Cuando el crítico termina su actividad con el formulario, el Coordinador lo envía a DANE Central. Lo toma Logística para el análisis (en análisis). Este rol, verifica la información y puede devolverla con observaciones o aprobarla (estado aprobado). De acuerdo al cronograma establecido para el desarrollo del operativo, periódicamente el DANE Central, a través de Logística de servicios, realiza cortes parciales para los cuales las Direcciones Territoriales deben lograr el porcentaje de avance solicitado en el cronograma para las fechas determinadas.
DISEÑO DE PROCESAMIENTO
Durante el tiempo que se va desarrollando el operativo, se realizan cierres parciales para realizar análisis de la información desde las áreas de temática y logística. Para llegar a tener la información y realizar dichos análisis, se descargan las bases desde el aplicativo de captura; son 27 archivos en excel que contienen 13 módulos de la EAS (para el año actual y el año anterior) y que corresponden a: activos fijos, variables agregadas, archivo control, costos generales, costos de educación, directorio, ingresos por CPC, ingresos por tipos de ingresos, ingresos del sector salud, novedades, personal, personal de educación, distribución por departamentos y tecnologías de la información. A partir de esta información y mediante un proyecto elaborado en SAS, el equipo de diseños muestrales genera archivos de cruces, valores atípicos, valores agregados negativos alertas de operativos para las territoriales y un archivo donde se puede ver la información a publicar con la estructura y con la evolución basada en la metodología tipo panel.
CONSOLIDACIÓN DE ARCHIVO S DE DATOS
Desde el momento de captura de la información el aplicativo automáticamente consolida los diferentes archivos que conforman la base de datos de la operación estadística. Además, permite a las Direcciones Territoriales monitorear la calidad de la información recolectada y la cobertura por Territorial y Subsede.
Para desarrollar la fase de análisis y verificación de la información que envían las Sedes y Subsedes, por parte del equipo Logística, el Administrador del aplicativo debe realizar las descargas periódicas de los archivos donde se almacenan los datos de los formularios. Los archivos que se descargan se encuentran en uno de los servidores que respaldan la información de la operación estadística como lo es el Systema44, en la siguiente ruta \\systema44\SERVICIOS\EAS\Logistica\ENTREGA BASES EAS 2018\BD A DICIEMBRE 2. En este caso, se encuentran los archivos descargados para el procesamiento de la información correspondiente al periodo 2018, descarga del mes de diciembre. Algunos de los archivos descargados son: eas_control, eas_directorio, eas_costos, eas_ingresos, eas_novedades, eas_personal, Estos archivos (en formato Excel) son tomados por el Grupo Interno de Trabajo (GIT) Diseños, integrado por personal con formación en estadística, quienes mediante la utilización del programa estadístico SAS, realizan la consolidación de la base de datos.
Esta base está integrada por tres archivos principales: uno denominado “Directorio”, otro “Formulario” y el archivo “varcua” que contiene las calculadas, los cuales integran las variables del formulario y del operativo que se utilizan en las fases posteriores.
• El archivo “Directorio” contiene variables de identificación de la fuente, ubicación, tipo de organización, código de la actividad económica, generación de energía, periodo de operación, entre otras.
• El archivo “Formulario” contiene variables de personal, ingresos, costos, gastos, activos fijos, que caracterizan la estructura económica de la fuente de información.
• En el archivo “varcua” se consolidan las variables calculada con base en las especificaciones entregadas por el GI de Temática, de acuerdo a las necesidades de información definidas previamente. Las principales variables calculadas son producción bruta, consumo intermedio, valor agregado, coeficiente técnico, personal remunerado, personal ocupado, entre otras.
La información de cada uno de estos archivos se integran a través de una llave, que para este caso es la variable “idnoremp”, que es un código único que utiliza el DANE para identificar las fuentes en cada una de las operaciones estadísticas.
Diseños muestrales, en el procesamiento de los datos de los archivos descargados del aplicativo, también genera otros archivos de trabajo para el análisis de la información como son:
• Los archivos comparan_EAS-EMS, compara_eas_MMH compara_EAS_MTA, contienen información que compara la información reportada en la Encuesta Anual de Servicios- EAS con la información reportada en la Encuesta Mensual de Servicios EMS, la Muestra Mensual de Hoteles MMH y la Muestra Trimestral de Agencias de Viaje MTA, respectivamente, de las variables de ingreso y personal ocupado, en los 12 meses del año de referencia de la EAS. Una vez dispuesta la información en estos archivos, son utilizados por el equipo de Logística para realizar análisis de verificación y consistencia.
• El archivo “rev_idaio”, contiene información relacionada con el año de inicio de operaciones y los meses que operó durante el año de referencia de la EAS. Este permite analizar si la fuente operó durante el año de referencia y si se debe incluir en los cuadros de salida de la información.
• El archivo “list_panel vs cuadro_29_11_19_CIUU4.XLSx”, se construye con información proveniente de los archivos “Directorio”, “Formulario” y “varcua”, e integra variables de los dos últimos periodos (año de referencia y anterior), con el fin de contar con información en una sola tabla de análisis que permita comparar los resultados de las mismas variables en los dos años, facilitando el análisis a nivel de microdato. Este formato también permite en el análisis la construcción de tablas dinámicas agregadas para obtener resultados preliminares a nivel de Actividad, División, Grupo de la CIIU Rev 4.
• El archivo “list_panel vs cuadro_29_11_19_seccion_L_NEW_METH.XLSx”, cuenta con la misma estructura del archivo precedente, y contiene información de las fuentes correspondientes a una sola Sección dela CIIU Rev 4. Con este cuadro se realiza análisis de la consistencia a nivel de microdato para cada Sección que se estudia en la EAS.
Diseños Muestrales también genera los archivos que son utilizados para la preparación de los comités internos de trabajo y para la elaboración de los productos para la publicación de resultados (cuadros de salida), con base en las especificaciones diseñadas para este tipo de cuadros por parte del GIT Temática, y que se encuentran en el Sistema Documental de la OE.
La base consolidada, junto con los archivos “rev_idaio”, “compara_EAS_MMS”, “compara_EAS_MMH”, “list_panel vs cuadro_29_11_19_CIUU4”, y “list_panel vs cuadro_29_11_19_seccion_L_NEW_METH”, son utilizados para realizar diferentes actividades por parte del equipo de Logística. Esta es una actividad que se lleva a cabo de forma paralela durante el periodo de recolección de la información y que continúa una vez esta se termina, hasta la aprobación de resultados en los comités internos. Dentro de las actividades que adelanta el equipo Logístico, se encuentran:
• Realiza descargues de los reportes de información diseñados en el aplicativo. Dentro de los reportes más frecuentes están: novedades, variaciones, observaciones formulario, histórico de novedades, año de inicio de operaciones, operativo, entre otras. Adicional a los reportes, realiza la descarga de los archivos en formato Excel para que el GIT Diseños, inicie el procesamiento de la información. En el cronograma de actividades de la EAS cada año se programan cuatro cierres, que corresponden a las descargas de información, al finalizar cada uno de los meses de operativo, que en total son cuatro. Además de estos cuatro cierres, se realizan otros no programados que hacen parte de la rutina de la fase de análisis y verificación de la información, dados los requerimientos que surgen en los comités internos.
• Revisión de cobertura de información de la Encuesta Anual de Servicios. Verifica que todas las sedes y subsedes hayan realizado el cierre del operativo (cumplimiento de cronograma) y procede a revisar la cobertura y consistencia de la información. Además revisa el indicador de calidad del proceso de crítica.
• Realiza consultas, aclaraciones y correcciones de ser necesarias de acuerdo con las inconsistencias encontradas, además realiza las correcciones respectivas en el sistema de captura – depuración de la operación.
• Revisa novedades del directorio: revisa y valida las observaciones de las empresas de la EAS para establecer situaciones de no diligenciamiento del formulario y que representen pérdida de muestra como son: 1 (Liquidada), 19 (mala clasificación), 13 (Absorción). Por último, se revisan las empresas con novedad 3 (inactiva) y 4 (sin localizar). En todos los casos revisa los soportes en informes para la asignación de la novedad correcta según el anexo del manual de crítica y los procedimientos establecidos en el manual de novedades.
• Genera listados de deudas (fuentes que operaron en el periodo de referencia y no rindieron información): Revisada la información enviada de las direcciones territoriales y subsedes y revisadas las empresas con novedad, se actualiza el directorio y se genera el listado de empresas en deuda para ser entregado al equipo de diseños muestrales.
Otras actividades que realiza el equipo de Logística dentro del procesamiento y análisis de la información están:
• Revisión y adición de la información imputada. Se incorpora la información a la base de datos de la Encuesta Anual de Servicios, ingresándola directamente en el aplicativo de captura, actualizando novedades y estados. A su vez, revisa la imputación en la base de datos, y se validan una a una el cargue y las variaciones de las fuentes imputadas.
• Revisa cuadros de información consolidada (preliminares o definitivos). Analiza el comportamiento de las variables principales de las empresas, para validar la información se revisan las empresas que más contribuyen a las variaciones o en los comportamientos atípicos de cada variable.
• Para la revisión de la consistencia de los datos reportados por las fuentes, en la fase de procesamiento se elaboran diferentes cálculos entre variables del mismo módulo o de módulos diferentes, para poder observar la coherencia que existe entre variables. Un dato se considera consistente cuando cumple ciertas características. Por ejemplo, los datos que dan respuesta de información cualitativa, tales como los reportados en el módulo I, referidos a la identificación, ubicación e información general de la empresa, son consistentes cuando lo reportado en el año actual es muy similar a lo reportado en años anteriores. Cuando se presentan cambios en estos datos, se solicita observación a la fuente para que aclare la situación. Para los datos de variables cuantitativas, como las reportadas en los módulos de personal ocupado e ingresos, costos y gastos, se analiza la consistencia de éstos a través de las variaciones de un periodo a otro, al igual que se contrasta con valores de otras variables relacionadas que han sido reportadas por la empresa. Finalmente, se analiza la coherencia entre variables relacionadas.
Para verificar la consistencia de las variables del módulo de personal, primero se revisan las variaciones. Seguidamente, se calcula la remuneración percapita, que es el resultado de relacionar el valor de las remuneraciones con el promedio de personas ocupadas. Se calcula el coeficiente prestacional, que relaciona la suma de las prestaciones sociales frente al total de las remuneraciones, para cada categoría de personal contratado por la fuente, durante el periodo de referencia, permitiendo observar la coherencia entre estados dos variables. También se hace comparación con la información reportada por la misma fuente en otras operaciones coyunturales como la MMS, la MMH y la MTA, que permite analizar la consistencia entre los datos reportados en las dos operaciones. Además, se hace un contraste entre el comportamiento de las variables de personal y remuneraciones con el comportamiento de los ingresos y los costos; normalmente deben ir en la misma dirección. Cuando se presentan incoherencias entre los resultados las variables, sin que se tenga explicación, se devuelve la información a las Sedes y Subsedes, para que soliciten la observación aclaratoria o el ajuste por parte de la fuente directamente.
La revisión de la consistencia de la información del módulo de ingresos y gastos, se realiza analizando las variaciones de cada una de las variables de este módulo ingresos por servicios, ingresos por venta de mercancías, otros ingresos, total de ingresos, la producción bruta, costos relacionados con la prestación del servicio, y cada uno de los componentes de los gastos. Con la información de los costos y gastos, se calcula la variable consumo intermedio, que incluye todos los costos y gastos que se constituyen en insumos para la generación de la producción, excluyendo los impuestos y los gastos de depreciación. Se calcula el coeficiente técnico (se presenta en la ficha de análisis), para cada periodo. Este indicador es el cociente entre el consumo intermedio y la producción bruta, y muestra de manera general la estructura de costos de la empresa; se espera que esta estructura se mantenga estable de un periodo a otro, por ende, si se presentan cambios se debe solicitar aclaración a las fuentes para que explique las razones. Esto lo hace la Sede o Subsede que recogió la información.
• Para las variables del módulos de activos fijos, se la consistencia se realiza a través de las variaciones de cada tipo de activos para cada una de las variables. Se espera que el comportamiento de los datos de este módulo sea estable, cuando se presentan cambios, deben ser consistentes con el comportamiento de las variables de personal e ingresos. Las variaciones grandes requieren explicación de parte de la fuente.
Los datos del módulo de información por departamentos, debe ser consiste en primer lugar con lo reportado en los módulos de personal ocupado y de ingresos. También se analiza la consistencia de la información a nivel de departamento, debe ser coherente con lo reportado en el periodo anterior. Por ejemplo, si en el periodo anterior reportó información en Bogotá y en el periodo actual no reporta en Bogotá sino en Cundinamarca, si esto ocurre, se solicita explicación o corrección a la fuente, a través de la Sede o Subsede responsable de la información.
En segunda medida, los archivos procesados son utilizados por parte del GIT Temática de Servicios para la generación de agregados económicos, indicadores sectoriales, análisis de consistencia, análisis de contexto macroeconómico, los cuales se llevan a comités internos para discusión y aprobación. Dentro delas actividades adelantadas por el GIT Temática, también se incluyen:
• Imputación de información: Se lleva a cabo el proceso de imputación de la cifra realizando un análisis en el cual tiene en cuenta entre otros los siguientes aspectos: en primer lugar, se identifican las fuentes a imputar. Un primer grupo conformado por empresas que presentan novedades como: liquidadas, sin localizar con opción de cierre, inactivas, liquidadas, en el momento del operativo, pero que para el año de referencia presentaron actividad económica. De este grupo las que cuentan con información en la MMH, EMS o MTA, para dicho periodo, se toma la información de ingresos y del personal y se realiza la imputación basados en esta información. Las demás fuentes se imputan con los métodos descritos en el numeral 2.3.4. Recolección de la información. Con los datos analizados se imputa el dato faltante generando un archivo de imputación para todas las variables, la cual es entregada al equipo de logística para su incorporación al formulario.
• Con información de las bases de la EAS y el archivo “list_panel_vs_cuadros_CIIU4”, realiza análisis horizontal a través de las variaciones, y vertical a través de las participaciones y contribuciones de cada fuente al total de la Sección, para cada las diferentes variables, agregadas para cada una de las secciones estudiadas en la operación.
• Revisa los cuadros de salida: en los cuales se encuentran los datos para las secciones investigadas. Se revisan las variaciones de las principales variables respecto al año anterior, observando aquellas en las que el incremento es o muy alto o muy bajo. De acuerdo con esto, se analizan los factores que lo expliquen o justifiquen, tanto a nivel de la empresa, o la sección o la economía en general o si por lo contrario, se trata de errores en el procesamiento de la información, que no fueron detectados oportunamente.
Estas bases, cuando se ha adelantado todo el proceso de revisión, análisis y verificación de la información, se han realizado las actualizaciones y ajustes necesarios, y se ha realizado la aprobación en comités internos de los resultados agregados, se constituyen en insumo para la elaboración de productos para la difusión.