Estimates of Sampling Error
DISEÑO DEL ANÁLISIS
En esta sección se describen los diferentes análisis que se realizan para garantizar la consistencia de la información.
MÉTODOS DE ANÁLISIS DE RESULTADOS
ANÁLISIS DE CONSISTENCIA: Se realiza comparando los datos a nivel de variable año a año a nivel fuente tomando como referencia las tendencias de los años comparados de acuerdo con la actividad que desarrollan.
Este análisis permite determinar si el dato rendido para el año de referencia es consistente con el nivel de los datos rendidos anteriormente por la empresa, también se realiza un análisis cruzado entre variables, es decir, comparar los niveles y comportamiento de una variable con el comportamiento de otras asociadas y que teóricamente reaccionan unas al comportamiento de las otras. Este análisis se realiza en diferentes niveles así:
- ANÁLISIS DE CAMPO: realizado por los critico-monitores, a partir de un proceso de revisión de la información reportada por las empresas, se realiza para cada formulario previo a los cierres virtuales (que equivalen al envío de la información) al DANE central. Allí el personal de campo realiza la revisión de las justificaciones consignadas y las variaciones de las variables principales.
- ANÁLISIS DE CONSISTENCIA POR PARTE DEL EQUIPO LOGÍSTICO: en el equipo logístico los analistas de información revisan la información de las empresas comparando la coherencia interna del formulario de cada mes, así como la coherencia con la información histórica de la misma empresa.
- ANÁLISIS DE CONSISTENCIA POR PARTE DEL EQUIPO DE TEMÁTICA ECONÓMICA : teniendo en cuenta que no es suficiente realizar el análisis a nivel de microdatos, el equipo temático realiza la revisión de las empresas que más contribuyen al comportamiento de las variables a publicar, generando un requerimiento de revisión que se hace llegar al equipo logístico para su revisión. Adicionalmente se revisa la coherencia de las salidas a nivel agregado de las principales variables por actividad económica CIIU para el total nacional y departamentos.
- ANÁLISIS DE CONTEXTO : Con el fin de analizar los resultados de la EAC se revisa a nivel de micro dato la serie histórica disponible de las empresas, para cada una de las variables y las justificaciones al comportamiento de sus variables principales, durante el proceso de diligenciamiento y análisis de los datos. Esta información se contrasta con el comportamiento del sector, los eventos y actividades realizados en el periodo estudiado; también se contrasta con otras operaciones estadísticas y otras entidades que realizan operaciones estadísticas relacionadas con el tema; entidades gubernamentales; gremios, la cual permite analizar la coherencia de los datos a divulgar.
Se realiza indagación en medios de prensa, donde se retoma la información relacionada con el contexto económico general y con el sector comercio. De esta manera se contraponen las notas de prensa con los
resultados de la operación estadística.
ANÁLISIS DE COMPARABILIDAD : Las salidas de la Encuesta Anual de Comercio – EAC se comparan y contrastan con las operaciones estadísticas coyunturales de comercio con periodicidad mensual o trimestral generadas por el DANE, tales como la Encuesta Mensual de Comercio y el Producto interno bruto.
En esta fase, dentro del marco de los comités técnicos se verifica la consistencia de las salidas de la Encuesta Anual de Comercio – EAC, con las salidas coyunturales ya publicadas en el DANE teniendo en cuenta las nomenclaturas, clasificaciones, conceptos y aspectos metodológicos definidos para cada operación estadística.
En todo el proceso de análisis se documentan e implementan reuniones o mesas de trabajo a nivel interno y externo que contextualizan, analizan y validan la información obtenida.
ANÁLISIS ESTADÍSTICO: Se realiza análisis descriptivo que contiene, el cálculo de todos los indicadores medidos a través de las variables de la operación estadística, las cuales determinan la estructura económica sectorial y describen las características de la población observada.Se calculan los indicadores por dominios de estudio.
Se analiza la estructura de la información a partir de la distribución de frecuencias y se detectan valores atípicos.
ANÁLISIS UNIVARIADO : Se hace por medio de frecuencias absolutas, se revisan las variables de manera independiente como el número de empresas, ventas, personal ocupado, producción bruta, remuneraciones y se identifican las empresas que realizan el mayor o menor aporte al comportamiento de la variable al total nacional, a través de las variaciones y contribuciones importantes para cada una de las desagregaciones que tiene la operación estadística; las empresas que se encuentren fuera del promedio y se evidencia un dato atípico se indaga con mayor profundidad en las observaciones enviadas por la fuente la razón de esta desviación.
ANÁLISIS BIVARIADO : Se utiliza para revisar coherencia del comportamiento de la información de una variable en relación a otras a las cuales están relacionadas, en la Encuesta Anual de Comercio, este análisis se realiza con las variables calculadas, valor agregado, coeficiente técnico, relación costo ventas, márgenes comerciales y productividad o entre variables que tienen relación.
Análisis del comportamiento de las ventas frente al personal, este tipo de análisis, por ejemplo, en las empresas dedicadas al comercio al por menor se presenta mayor correlación entre el comportamiento de las ventas y el personal, teniendo en cuenta que al tratarse de ventas al público en general se requiere de mayor número de personas para atención directa de los clientes.En cambio, en el comercio al por mayor o comercio de vehículos una sola persona puede cerrar transacciones comerciales de altos niveles, limitando la correlación entre las ventas y el personal ocupado.
Así mismo se evalúan los indicadores comparando el costo de las ventas con el valor de las ventas, este es un indicador que permite a las empresas y detectara nivel de cifras cuales son las actividades con mayor o menor margen comercial.
ANONIMIZACIÓN DE MICRODATOS
La anonimización se hace usando diferentes técnicas para encriptar la información de las fuentes que se consideren identificables después de realizar un estudio de riesgo. El DANE publica en su página web bases anonimizadas con periodos de referencia de 2003 en adelante. A partir de la encuesta del año 2016, la base anonimizada se publica el mismo año de publicación de la información estadística.
El proceso de anonimización de la EAC consiste en 3 macro-procesos los cuales están contenidos en el proyecto de SAS Enterprise: aislamiento y armonización de la base de datos, identificación de escenarios de riesgo, donde se contemplan todos los escenarios donde puede tener riesgo la información de las empresas y aplicación de técnicas de anonimización.
Los métodos de anonimización utilizados en la Encuesta Anual de Comercio corresponden a I) microagregación , que consiste en una técnica de perturbación propuesta por Eurostat como forma de divulgación estadística para variables numéricas. La idea es reemplazar un valor observado con la media calculada sobre un pequeño grupo de unidades (agregado pequeño o micro-agregado), incluido el investigado. Consiste en agrupar los registros individuales en pequeños grupos antes de su publicación, manteniendo los resultados al aplicar las operaciones estadísticas. II) Otro método utilizado corresponde al de perturbación, a partir del cual se ajusta la información de algunas empresas para restringir su identificación por ser empresas ampliamente conocidas y fácilmente identificables por los usuarios.
VERIFICACIÓN DE LA ANONIMIZACIÓN DE MICRODATOS
Una vez se realiza el proceso de anonimización y se exporta la base en formato Excel se realiza la revisión a través de cruces de información para garantizar y proteger la privacidad de las fuentes preservando el aprovechamiento de los datos.
Los usuarios de la información pueden acceder a los datos en la sala de procesamiento especializado en la cual encuentran bases a nivel de microdato sin variables de localización ni identificación. Con estas bases, quienes usan la información, generan las salidas que requieren y pueden disponer de los resultados, únicamente a nivel agregado, con el fin de cumplir con los parámetros de reserva estadística. Igualmente, pueden encontrar los microdatos anonimizados en el portal Archivo Nacional de Datos (ANDA) https://microdatos.dane.gov.co/index.php/catalog/central/about
COMITÉS DE EXPERTOS
En la EAC, se realiza análisis de los resultados al interior de la misma operación sobre toda la información disponible, para ver su evolución frente a la economía.
Luego en un comité interno se da paso a la participación además de representantes del equipo de trabajo a personas de otras áreas de la entidad como la Dirección de Síntesis y Cuentas Nacionales – DSCN, Dirección de Regulación, Normalización y Estandarización Estadística – DIRPEN, Dirección de Difusión, Mercadeo y Cultura Estadística – DIMCE, representante de la Dirección de Metodología y Producción Estadística - DIMPE y asesores de la Dirección de la entidad.
Como resultado de estas reuniones surgen ejercicios que permiten y explicar a profundidad los resultados.
Una vez avaladas las cifras en la institución se socializan en un comité externo, al cual asisten representantes de instituciones como Departamento Administrativo Nacional de Planeación (DNP); Ministerio de Comercio, Industria y Turismo, Ministerio de Hacienda y Crédito Público, Banco de la República Secretaria de Desarrollo Económico, y gremios como Federación Nacional de Comerciantes (FENALCO), entre otros.
NOTAS EXPLICATIVAS ACERCA DE LAS MEDIDAS DE CALIDAD DE LA OPERACIÓN ESTADÍSTICA:
Tasa de cobertura: 95,7%
Fórmula de la tasa de cobertura:
Directorio - (Empresas sin localizar con probabilidad de traslado + Empresas en deuda + Empresas sin localizar con probabilidad de cierre - Empresas imputadas) / Directorio *100
Tasa de no respuesta: 3,0%
Fórmula de la tasa de no respuesta:
(Empresas imputadas + Empresas en deuda) / (Empresas inactivas + Empresas en deuda + Empresas nuevas + Empresas que rinden + Empresas imputadas) *100
Tasa de imputación: en número de empresas 2,9%; en ventas 2,3%; y en personal ocupado 3,0%.
Fórmula de la tasa de imputación para el número de empresas, las ventas y el personal ocupado:
(Empresas imputadas + Empresas en deuda) / Directorio *100