Descripción |
Una gran cantidad de información, acerca de las características económicas tanto de individuos como de establecimientos industriales o países, es recopilada con fines de análisis, para entonces planear y tomar decisiones.
Al registro sistemático de mediciones u observaciones numéricas, efectuado a intervalos fijos de tiempo, se conoce como serie de tiempo y como la serie de tiempo se compone de datos numéricos, es común usar la estadística para describirla y analizarla, sea de forma descriptiva o de manera inferencial, cuyo objetivo de esta última es la utilización de muestras, que representen a la población de estudio, para producir conclusiones válidas para toda la población.
Uno de los problemas que se presentan en el análisis estadístico inferencial es la falta de algunos registros en la serie, lo que conlleva a aumentar el error en la varianza de las estimaciones de los parámetros poblacionales; para hacer menos grave el error, se presentan dos métodos de estimación con datos faltantes que son la reponderación y la imputación.
La imputación es un método muy usado, en el cual se debe hacer el esfuerzo por imputar solo del 1% al 2% de los datos, si el porcentaje de datos imputados es muy alto se crea un error sistemático o sesgo en la varianza del estimador puntual. Pero aún si un método de imputación no produce un apreciable error, no se debe ignorar el efecto que la imputación tiene en la precisión de la varianza del estimador puntual.
La imputación es útil porque hace más viable el análisis de un conjunto de datos, asegurando consistencia entre los resultados de diferentes análisis y reduciendo el sesgo de no respuesta.
Muchas técnicas estadísticas requieren de conjuntos de datos rectangulares o en forma de matriz y en la presencia de datos faltantes, los registros pueden restringirse a un conjunto de datos completos. Esta restricción sacrifica información parcial en aquellas encuestas que no han sido diligenciadas totalmente y que se pueden utilizar o aprovechar si se hace imputación.
En la literatura estadística hay una variedad de métodos que se han propuesto para imputar datos, estos métodos son clasificados según si se genera una sola imputación para cada valor faltante (imputación simple) o se generan, bajo simulaciones, m imputaciones para cada valor faltante el cual genera m conjuntos de datos completos (imputación múltiple).
Algunos métodos de imputación usan un modelo explícito como el de una regresión ajustada, una razón o la imputación por la media. En otros métodos el modelo es implícito como el de la imputación en paquete caliente (hot deck) y la imputación por donadores vecinos. |