Estimates of Sampling Error
DISEÑO DEL ANÁLISIS
En esta sección se describen los diferentes análisis que se realizan para garantizar la consistencia de la información.
Métodos de análisis de resultados
Análisis de consistencia: se realiza comparando los datos a nivel de variable año a año, tomando como referencia las tendencias de los años comparados de acuerdo con la actividad que desarrollan. Este análisis permite determinar si el dato rendido para el año de referencia es consistente con el nivel de los datos rendidos anteriormente por la empresa. Adicionalmente, se realiza un análisis cruzado entre variables, es decir, comparar los niveles y comportamiento de una variable con el comportamiento de otras asociadas y que teóricamente reaccionan unas al comportamiento de las otras. Este análisis se realiza en diferentes niveles, así:
Análisis en campo: llevado a cabo por los monitores, a partir de un proceso de revisión de la información reportada por las empresas, se realiza para cada formulario previo a los cierres virtuales (que equivalen al envío de la información) al DANE Central. Allí el personal de campo realiza la revisión de las justificaciones consignadas y las variaciones de las principales
variables.
Análisis de consistencia por parte del equipo logístico: los analistas de información comparan la coherencia interna del formulario del año de referencia, así como la coherencia con la información histórica de la misma empresa.
Análisis de consistencia por parte del equipo de temática económica: teniendo en cuenta que no es suficiente realizar el análisis a nivel de microdato, el equipo temático realiza la revisión de las empresas que más contribuyen al comportamiento de las variables a publicar, generando un requerimiento de revisión que se hace llegar al equipo logístico para su revisión.
Adicionalmente, se revisa la coherencia de las salidas a nivel agregado de las principales variables por actividad económica CIIU para el total nacional y departamental.
Análisis de contexto: con el fin de analizar los resultados de la EAC, se revisa a nivel de microdato la serie histórica disponible de las empresas, para cada una de las variables y las justificaciones al comportamiento de sus variables principales, durante el proceso de diligenciamiento y análisis de los datos. Esta información se contrasta con el comportamiento del sector, los eventos y actividades realizados en el periodo estudiado. También se contrasta
con otras operaciones estadísticas producidas por diferentes actores como entidades gubernamentales, gremios, entre otros.
Se realiza indagación en medios de prensa, donde se retoma la información relacionada con el contexto económico general y el sector comercio. De esta manera se contraponen las notas de prensa con los resultados de la operación estadística.
Análisis de comparabilidad: las salidas de la EAC se comparan y contrastan con las operaciones estadísticas coyunturales de comercio, mensual o trimestral, generadas por el DANE, tales como la Encuesta Mensual de Comercio y el Producto Interno Bruto.
En esta fase, dentro del marco de los comités técnicos se verifica la consistencia de las salidas de la EAC con las salidas coyunturales ya publicadas; teniendo en cuenta las nomenclaturas, clasificaciones, conceptos y aspectos metodológicos definidos para cada operación estadística. En todo el proceso de análisis se documentan e implementan reuniones o mesas de trabajo a nivel interno y externo que contextualizan, analizan y validan la información obtenida.
Análisis estadístico: análisis de carácter descriptivo, contiene el cálculo de todos los indicadores medidos a través de las variables de la operación estadística; las cuales determinan la estructura económica sectorial y describen las características de la población observada. Se calculan los indicadores por dominios de estudio, la estructura de la información es analizada a partir de la distribución de frecuencias para detectar valores atípicos.
Análisis univariado: se hace por medio de frecuencias absolutas con la revisión de variables de manera independiente como el número de empresas, ventas, personal ocupado, producción bruta, remuneraciones, entre otras. Adicionalmente, se identifican las empresas que realizan el mayor o menor aporte al comportamiento de la variable al total nacional, a través de las variaciones y contribuciones importantes para cada una de las desagregaciones que tiene la operación estadística; y, las empresas que se encuentren fuera del promedio; si se evidencia un dato atípico se indaga la razón de la desviación con las observaciones enviadas por la fuente.
Análisis bivariado: se utiliza para revisar coherencia del comportamiento de la información de una variable con relación a otras, las cuales están relacionadas. Este análisis se realiza con las variables calculadas, valor agregado, coeficiente técnico, relación costo ventas, márgenes comerciales y productividad o entre variables que tienen relación.
Un ejemplo es el análisis del comportamiento de las ventas frente al personal. En las empresas dedicadas al comercio al por menor se presenta mayor correlación entre el comportamiento de las ventas y el personal, teniendo en cuenta que al tratarse de ventas al público se requiere mayor número de personas para atención al cliente. En cambio, en el comercio al por mayor y el comercio de vehículos, una sola persona puede cerrar transacciones comerciales de altos niveles, limitando la correlación entre las ventas y el personal ocupado.
Así mismo, se evalúan los indicadores comparando el costo de las ventas con el valor de las ventas, este es un indicador que permite a las empresas detectar cuáles son las actividades con mayor o menor margen comercial.
Anonimización de microdatos
La anonimización se hace usando diferentes técnicas para encriptrar la información de las fuentes que se consideren identificables después de realizar un estudio de riesgo. El DANE publica en su página web bases anonimizadas con periodos de referencia de 2003 en adelante. A partir de la encuesta del año 2016, la base anonimizada se publica el mismo año de publicación de la información estadística.
El proceso de anonimización de la EAC consiste en 3 macroprocesos, los cuales están contenidos en el proyecto de SAS Enterprise: aislamiento y armonización de la base de datos, identificación de escenarios de riesgo, donde se contemplan todos los escenarios donde puede tener riesgo la información de las empresas y aplicación de técnicas de anonimización.
Los métodos de anonimización utilizados en la EAC corresponden a la microagregación, consiste en una técnica de perturbación propuesta por Eurostat como forma de divulgación estadística para variables numéricas. Busca reemplazar un valor observado con la media calculada sobre un pequeño grupo de unidades (agregado pequeño o micro-agregado), incluido el investigado. Agrupa los registros individuales en pequeños grupos antes de su publicación, manteniendo los resultados al aplicar las operaciones estadísticas. Otro método utilizado corresponde al de perturbación, a partir del cual se ajusta la información de algunas empresas para restringir su identificación por ser empresas ampliamente conocidas y fácilmente identificables por los usuarios.
Verificación de la anonimización de microdatos
Una vez se realiza el proceso de anonimización y se exporta la base en formato Excel, se revisa a través de cruces de información para garantizar y proteger la privacidad de las fuentes, preservando el aprovechamiento de los datos.
Los usuarios de la información pueden acceder a los datos en la sala de procesamiento especializado, allí reposan las bases a nivel de microdato sin variables de localización ni identificación. Con estas bases, quienes usan la información generan las salidas que requieren y pueden disponer de los resultados, sólo a nivel agregado, para cumplir con los parámetros de reserva estadística. Igualmente, pueden encontrar los microdatos anonimizados en el portal Archivo Nacional de Datos (ANDA)
Comités de expertos
El comité interno permite la participación, además de representantes del equipo de trabajo, a personas de otras áreas de la entidad como la Dirección de Síntesis y Cuentas Nacionales (DSCN), la Dirección de Regulación, Normalización y Estandarización Estadística (DIRPEN), la Dirección de Difusión y Cultura Estadística (DICE), representantes de la Dirección de Metodología y Producción Estadística (DIMPE) y asesores de la Dirección de la entidad.
Como resultado de estas reuniones surgen ejercicios que permiten explicar a profundidad los resultados y avalar las cifras.
Posteriormente, los resultados de la EAC son socializados en el comité externo, integrado por representantes de instituciones como el Departamento Administrativo Nacional de Planeación (DNP), Banco de la República, Secretaría de Desarrollo Económico, y gremios como la Federación Nacional de Comerciantes (FENALCO), con el fin de dar a conocer, discutir y retroalimentar el contexto que rodea la estadística de comercio.
NOTAS EXPLICATIVAS ACERCA DE LAS MEDIDAS DE CALIDAD DE LA OPERACIÓN ESTADÍSTICA:
Tasa de cobertura: 96,8%
Fórmula de la tasa de cobertura:
Directorio - (Empresas sin localizar con probabilidad de traslado + Empresas en deuda + Empresas sin localizar con probabilidad de cierre - Empresas imputadas) / Directorio *100
Tasa de no respuesta: 2,7%
Fórmula de la tasa de no respuesta:
(Empresas imputadas + Empresas en deuda) / (Empresas inactivas + Empresas en deuda + Empresas nuevas + Empresas que rinden + Empresas imputadas) *100
Tasa de imputación: en número de empresas 2,6%; en ventas 1,4%; y en personal ocupado 1,7%.
Fórmula de la tasa de imputación para el número de empresas, las ventas y el personal ocupado:
(Empresas imputadas + Empresas en deuda) / Directorio *100
EQUIVALENCIA DE LAS ESCALAS DE VENTAS
Grupo 1
Tamaño Microempresa
Escala en UVT Menor o igual que 44.769
Escala en miles de pesos - Año 2023 Menor o igual que $1.898.743.
Grupo 2
Tamaño Pequeña
Escala en UVT Mayor que 44.769 y menor o igual que 431.196
Escala en miles de pesos - Año 2023 Mayor que $1.898.743 y menor o igual que $18.287.885.
Grupo 3
Tamaño Mediana
Escala en UVT Mayor que 431.196 y menor o igual que 2.160.692
Escala en miles de pesos - Año 2023 Mayor que $18.287.885 y menor o igual que $91.639.269.
Grupo 4
Tamaño Gran empresa
Escala en UVT Mayores a 2.160.692
Escala en miles de pesos - Año 2023 Mayores a $91.639.269.