A continuación se presenta la base de datos de la Encuesta Anual de Comercio, que tiene como objetivo general recolectar la información de las empresas y establecimientos; el formato optimiza los requerimientos de información y promueve una relación más eficiente y transparente entre las empresas.
Entre los años 2003 y 2017 la Encuesta Anual de Comercio - EAC ha tenido algunos cambios metodológicos, con el fin de mejorar la medición de la estructura del sector comercio, específicamente el criterio que establece cuales son las empresas que reportan información a la encuesta; los cambios corresponden a:
- De 2003 a 2012 se realizaba una medición por muestreo probabilístico, la investigación representaba a las empresas de todos los tamaños.
- Para el año 2013 se cuenta con información de las empresas de mayor tamaño, es decir aquellas con ventas mayores o iguales $2.990 millones y/o con 20 o más personas ocupadas.
- A partir del año 2014 se amplió la cobertura de la encuesta midiendo las empresas con ingresos por ventas mayores o iguales a $1.500 millones o con personal ocupado mayor o igual a 10 personas ocupadas; sin embargo, es importante señalar que por ser un periodo de transición, durante 2014 algunas empresas solo reportaron información de ventas y personal.
COMPARABILIDAD HISTÓRICA DE LA INFORMACION
La información generada en la Encuesta Anual de Comercio tiene como objetivo principal el análisis de la estructura anual del sector comercio, por tanto, salidas de información para análisis de evolución pueden presentar sesgos, principalmente por mejoras en el directorio de empresas
El programa de mejoramiento continuo del directorio de empresas que el DANE realiza, permite ampliar el número de empresas de las diferentes actividades cubiertas por la Encuesta Anual de Comercio, esto conlleva que en los operativos de la investigación se incluyan nuevas empresas las cuales no necesariamente iniciaron operaciones en el año de referencia de los datos, sino que obedecen a mejoramientos en la cobertura. Es decir que no todas las empresas adicionadas en los operativos anuales representan un crecimiento económico.
Para hacer comparables los resultados de la encuesta entre dos años: año actual (t) y año anterior (t-1), el DANE implementó una metodología de panel, mediante la cual se identifican las empresas que deben formar parte de la comparación en los dos años. Con estas empresas se calculan y divulgan las variaciones anuales de las variables publicadas.
En este sentido si el investigador o usuario de las bases anonimizadas realiza ejercicios tendientes a demografía de empresas, análisis de evolución de las variables, etc. debe ser consciente de estas limitaciones.
COMPARABILIDAD HISTÓRICA A NIVEL DE MICRODATO
La información generada en la Encuesta Anual de Comercio no vela por la comparabilidad a nivel de microdato, sino de las salidas a nivel de dominios más agregados, como actividades CIIU, Tipo de organización jurídica y otros que pueden llegar a definir los investigadores o usuarios de la base.
El principal motivo que limita el análisis histórico a nivel de microdato, es decir a nivel de empresa consiste en los métodos de anonimización utilizados
- Uno de los métodos de anonimización utilizado en la Encuesta Anual de Comercio corresponde a la microagregación, que consiste en una técnica de perturbación propuesta por Eurostat como forma de divulgación estadística para variables numéricas. La idea es reemplazar un valor observado con la media calculada sobre un pequeño grupo de unidades (agregado pequeño o micro-agregado), incluido el investigado. Consiste en agrupar los registros individuales en pequeños grupos antes de su publicación, manteniendo los resultados al aplicar las operaciones estadísticas.
- Otro método utilizado corresponde al de perturbación, a partir del cual se ajusta la información de algunas empresas para restringir su identificación por ser empresas ampliamente conocidas y fácilmente identificables por los usuarios.
Estos métodos implican que la información de algunas empresas no corresponda a la reportada originalmente sino al cálculo del promedio de varias empresas o a un dato ajustado en procesos de perturbación, ello con el fin de proteger la información original. Este hecho limita comparar la información a nivel de empresas en el tiempo; sin embargo, los resultados agregados para los dominios de publicación se conservan; es decir, que las salidas de información para dichos dominios son comparables entre los anexos divulgados y los calculados con las bases anonimizadas.
En este sentido y velando por resguardar la confidencialidad de la información suministrada por las empresas al DANE es posible que el identificador de las empresas cambie en el tiempo.
1.Agusti Solanas, Antoni Martínez-Ballesté, Josep Domingo-Ferrer, Susana Bujalance y Josep M. Mateo-Sanz, Métodos de Microagregación para k-anonimato: privacidad en bases de datos. Dpto. Ingeniería Informática y Matemáticas, Universidad Rovira y Virgili, Av. Paisos Catalans 26, E-43007 Tarragona, Catalonia, España.
cases: | 0 |
variables: | 64 |
Conmutador: (+57 601) 597 8300 ó (+57 601) 597 8398 /
Línea gratuita de
atención: 01 8000
912002
Lunes a viernes 8:00 a 17:00
Carrera 59 No. 26-70 Interior I - CAN / Bogotá D.C. - Colombia