Sampling Procedure
DISEÑO MUESTRAL
Elementos que lo componen: listado de fincas potencialmente arroceras.
Diseño del registro: el marco incluye principalmente las siguientes variables:
- Variables de identificación y ubicación: nombre del departamento (DEPTO), nombre del municipio (MPIO), nombre de la vereda (VEREDA), código de la finca (COFINCA).
- Variables auxiliares: área de la finca en Ha (AREA), sistema de cultivo (SISTEMA), zona arrocera (ZONARRO), total área sembrada en el primer semestre (ARA), total área sembrada en el segundo semestre (ARB), total área cosechada en el primer semestre (TOT_COS_A), total área cosechada en el segundo semestre (TOT_COS_B).
Exclusiones del marco para la selección de la muestra de área sembrada:
- Zona arrocera Llanos orientales, dado que se realiza censo en esta zona, precisamente por la gran dinámica que se presenta en las fincas que cada semestre cultivan arroz.
- Secano manual porque no es objeto de estudio.
- Distritos de riego dado que la información de área sembrada se obtiene por registro administrativo.
Exclusiones del marco para la selección de la muestra de rendimiento:
PRIMER SEMESTRE
Zona arrocera Llanos: dado que para este semestre se realiza censo en esta zona.
Distritos de riego: dentro de este estrato se excluyen las fincas que no reportan área sembrada en el II semestre, según el censo 2007 o última actualización. Es decir, para el primer semestre se observan las áreas sembradas del segundo semestre; este proceso mantiene fija la dinámica de las fincas dentro del distrito porque estos presentan una estructura de ciclos de siembra completamente definidos que no presentan variaciones considerables en el tiempo y se actualiza con la información obtenida a partir de la recolección.
Fincas que no reportaron área sembrada en la muestra de área sembrada del semestre inmediatamente anterior o que hayan sembrado únicamente en julio del año anterior; esto con el fin de hacer factible la medición del rendimiento en las fincas.
Secano manual porque no es objeto de estudio.
SEGUNDO SEMESTRE
- Fincas con sistema secano, que no presentan área sembrada en zona arrocera llanos primer semestre; esto asegura que sea factible medir el rendimiento en la finca. Para esta zona se excluyen del marco de selección las fincas con sistema riego porque se realiza censo.
- Distritos de riego: dentro de este estrato se excluyen las fincas que no reportan área sembrada en el I semestre, según el Censo 2007 o última actualización. Es decir, para el segundo semestre se observan las áreas sembradas del primer semestre; este proceso mantiene fija la dinámica de las fincas dentro del distrito porque estos presentan una estructura de ciclos de siembra completamente definidos que no presentan variaciones considerables en el tiempo y se actualiza con la información obtenida a partir de la recolección.
- Fincas que no reportaron área sembrada en la muestra de área sembrada del semestre inmediatamente anterior o que hayan sembrado únicamente en enero del mismo año, esto con el fin de hacer factible la medición del rendimiento de las fincas.
- Secano manual, porque no es objeto de estudio.
- TIPO DE MUESTREO
El diseño de la ENAM tiene en cuenta el calendario de siembra, la disponibilidad de registros administrativos de los distritos de riego y la factibilidad de obtener información directamente por parte de los productores. Para generar información del cultivo de arroz se emplea una combinación de operaciones en cada semestre, que se complementan y optimizan con la medición de las variables de interés: se realiza censo de fincas arroceras, registros administrativos y muestras probabilísticas.
CENSO
En el transcurso de la investigación, se evidenció que en la zona arrocera Llanos, se presenta una gran dinámica del cultivo, es decir, no siempre se realizan siembras de arroz en las mismas fincas; como consecuencia en cada semestre del año el marco de muestreo se desactualiza. En este contexto y teniendo en cuenta que durante el primer semestre del año esta zona aporta el mayor porcentaje de área sembrada a nivel nacional y por lo consiguiente en el segundo semestre aporta el mayor volumen de producción de arroz Paddy verde, se determinó realizar censo para área sembrada en esta zona en los dos semestres de cada año, de esta manera se cuenta con marcos actualizados y estimaciones más precisas.
Igualmente, en las demás zonas arroceras del país la actualización del marco es permanente. Además, en el primero o segundo semestre se puede realizar un censo dependiendo de las condiciones puntuales de la zona.
REGISTROS ADMINISTRATIVOS
Se utilizan los registros administrativos agrupados de los distritos de riego para el cultivo del arroz, donde los usuarios adscritos a estos distritos hacen parte del marco de muestreo, como resultado se dispone de una fuente de información veraz y oportuna de cada distrito de riego con las áreas sembradas por variedad y por mes en las fincas arroceras adscritas a cada distrito.
Las variables de estos registros son: nombre del distrito de riego, área sembrada en hectárea, variedad de arroz y mes de la siembra.
MUESTRAS PROBABILÍSTICAS
El comportamiento de las variables área sembrada y rendimiento, tienen una tendencia opuesta dependiendo del semestre y la región geográfica; además la medición del rendimiento se puede realizar sólo a las fincas que presentaron área sembrada en el semestre anterior, por lo cual estos dos parámetros se estudian mediante diseños y muestras por separado para cada variable.
La metodología también tiene en cuenta la disponibilidad de información que existe en cada semestre de la siguiente forma:
- MUESTRA PARA EL ÁREA SEMBRADA
Se realiza muestra de fincas en los departamentos Tolima, Huila y las zonas Bajo Cauca, Costa Norte, Santanderes y Resto; se excluyen del marco de selección las fincas que conforman los distritos de riego y la zona arrocera Llanos.
- MUESTRA PARA EL RENDIMIENTO
- Para el primer semestre, se realiza muestra en los departamentos de Tolima, Huila y Resto, para las fincas pertenecientes a distritos de riego; por otro lado se realiza censo en la zona arrocera Llanos; para completar la cobertura nacional, se selecciona una sub muestra de las fincas que presentaron siembras en la muestra de área sembrada del semestre inmediatamente anterior.
- Para el segundo semestre, se realiza muestra en los departamentos de Tolima, Huila y Resto, para las fincas pertenecientes a distritos de riego; por otro lado, se selecciona muestra para las fincas con sistema secano de Casanare, Meta y resto de zona arrocera Llanos y censo de sistema riego; para completar la cobertura nacional, se selecciona una sub muestra de las fincas que presentaron siembras en la muestra de área sembrada del semestre inmediatamente anterior.
DISEÑO PARA LA MEDICIÓN DEL ÁREA SEMBRADA
El diseño es ESTMAS, probabilístico, estratificado de elementos:
Probabilístico: significa que todas las unidades de muestreo tienen probabilidad de selección mayor que cero y conocida.
Estratificado: para reducir varianza en las estimaciones se conforman grupos homogéneos dentro y heterogéneos entre ellos; en este caso se conformaron tres estratos siguiendo criterios geográficos y temáticos: fincas que pertenecen a distritos de riego, zona arrocera de los Llanos y resto país, de la siguiente manera:
- Dentro de los distritos de riego no hay sub-estratificación dado que la información de área sembrada se obtiene por registros administrativos. En la zona arrocera Llanos se realiza censo de fincas arroceras. Antes de 2010 únicamente se realizaba censo para el primer semestre; sin embargo, dada la alta dinámica de las fincas arroceras, se vio la necesidad de realizar un seguimiento más detallado de esta zona, se decidió realizar censo también en el segundo semestre.
- En cuanto al grupo resto país, se aplica estratificación indistintamente del semestre, el criterio es la ubicación de las fincas: Tolima, Huila y zona Bajo Cauca, zona Costa Norte, zona Santanderes y zona Centro. Al interior de los estratos se subestratifica por el máximo de área sembrada de las fincas (grandes, medianas y pequeñas). La estratificación por zonas arroceras busca disminuir los errores muéstrales en dichas desagregaciones.
- Para la subestratificación por el tamaño de la finca en términos de su área sembrada se usa la generalización del algoritmo de Hidiroglou-Lavalleé. La selección se realiza de la siguiente forma: las fincas grandes se incluyen de manera forzosa; y en las fincas medianas y pequeñas se selecciona una muestra aleatoria independiente para cada grupo.
DISEÑO PARA LA MEDICIÓN DEL RENDIMIENTO
El diseño es ESTMAS-ESTMAS, probabilístico, bifásico, estratificado de elementos:
* Probabilístico: todas las unidades de muestreo tienen probabilidad de selección mayor que cero y conocida.
- Estratificado: para reducir varianza en las estimaciones se conforman grupos homogéneos dentro y heterogéneos entre ellos; en este caso se conformaron tres estratos siguiendo criterios geográficos y temáticos: fincas pertenecientes a distritos de riego, las ubicadas en la zona arrocera Llanos y las seleccionadas en la muestra de área sembrada del semestre inmediatamente anterior.
- Distritos de riego. Para los dos semestres el criterio de estratificación corresponde a los departamentos: Huila, Tolima y resto.
- Zona arrocera Llanos. Para el sistema riego, se realiza censo en los dos semestres, por lo cual no se aplica estratificación; para el sistema secano se realiza censo en el primer semestre del año, mientras que en el segundo semestre se estudia mediante muestra, estratificando por departamento así: Casanare, Meta y resto de Llanos, y luego se clasifican según su tamaño en grandes, medianas y pequeñas.
- Fincas seleccionadas en la muestra de área sembrada del semestre inmediatamente anterior. Se clasifican a su vez en grandes y pequeñas.
Para la sub-estratificación por el tamaño de la finca en términos de su área sembrada, se usa una generalización del algoritmo de Hidiroglou-Lavalleé. La selección se realiza de la siguiente forma: las fincas grandes, se incluyen de manera forzosa y en las fincas medianas y/o pequeñas, se seleccionan una muestra aleatoria independiente para cada grupo.
- Bifásico: se realiza en dos fases, esto aplica únicamente para el estrato 3, el cual está conformado por las fincas seleccionadas en la muestra de área sembrada del semestre inmediatamente anterior. Esto se realiza para asegurar que la finca efectivamente haya sembrado arroz y por lo tanto sea factible de medirle su rendimiento. En la primera fase se seleccionan fincas (esta fase corresponde a la muestra de área sembrada que se seleccionó en el semestre anterior usando el diseño descrito anteriormente) y en la segunda fase se seleccionan fincas que hayan presentado área sembrada en arroz en la fase anterior.
DEFINICIÓN DEL TAMAÑO DE LA MUESTRA
El tamaño de muestra seleccionada no es constante en los diferentes semestres, presenta variaciones que están ligadas a diferente factores, dentro de los cuales se encuentran el presupuesto para el operativo de campo que es determinado por el gremio; otro factor determinante es el semestre de estudio y la dinámica del sector; otro criterio es la cantidad de fincas que por efectos aleatorios resultan seleccionadas simultáneamente en las dos muestras: de áreas sembradas y rendimiento, las cuales son muestras independientes; finalmente, también influye el error muestral, el cual se planea para que sea máximo 3% para el total nacional.
En términos generales el tamaño de muestra se encuentra entre 1.900 y 2.200 fincas arroceras por semestre, esto incluye la muestra seleccionada para la estimación de área y la muestra seleccionada para la estimación de rendimiento, no incluye las fincas resultantes del censo de zona Llanos y las áreas nuevas.
TAMAÑO DE MUESTRA
El tamaño de muestra seleccionada cada semestre se encuentra entre 1.900 y 2.200 fincas arroceras por semestre; esto incluye la muestra seleccionada para la estimación de área y la muestra seleccionada para la estimación de rendimiento. Se adiciona las fincas resultantes del censo de zona Llanos, la cual es diferente en cada semestre y las áreas nuevas.
PROCEDIMIENTO DE ESTIMACIÓN
PARÁMETROS A ESTIMAR
• Área sembrada expresada en hectáreas
• Producción expresada en toneladas
• Rendimiento expresado en toneladas por hectárea
FACTOR DE EXPANSIÓN
El factor de expansión, es un valor que multiplica a cada uno de los elementos seleccionados en la muestra, con el fin de obtener la estimación del parámetro en el universo, este factor depende y se construye a partir del método de selección utilizado.
En la encuesta ENAM se aplica un diseño MAS para cada estrato.
Para el caso de la muestra de rendimiento, cuyo diseño es en dos fases el factor de expansión se construye como el producto de los factores de expansión de cada fase.
ESTIMACIÓN DEL ÁREA COSECHADA
Según conocimiento de los expertos basado en los ciclos de siembra, la estimación del área cosechada se asume igual al área sembrada del semestre anterior, este es el dato que se publica semestralmente con su correspondiente nota aclaratoria.
ESTIMACIÓN DE LA PRODUCCIÓN
La producción se estima a partir del rendimiento estimado y el área cosechada estimada, estos dos se multiplican a nivel de departamento para obtener la producción. De esta forma la estimación de la varianza corresponde al área sembrada del semestre anterior al cuadrado, por la varianza del rendimiento.