13.07.2015 Views

El diseño muestral en las encuestas de hogares

El diseño muestral en las encuestas de hogares

El diseño muestral en las encuestas de hogares

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Noviembre 2005tema <strong>de</strong> portada • 16<strong>El</strong> diseño <strong>muestral</strong> <strong>en</strong> <strong>las</strong> <strong>en</strong>cuestas<strong>de</strong> <strong>hogares</strong>Juana Porras Pugasubdirectora g<strong>en</strong>eral adjunta <strong>de</strong> Metodología y Técnicas Estadísticas. INELa creci<strong>en</strong>te <strong>de</strong>manda <strong>de</strong> información, junto con el <strong>de</strong>sarrollo <strong>de</strong> nuevas técnicas <strong>de</strong> investigación <strong>muestral</strong>,ha t<strong>en</strong>ido como consecu<strong>en</strong>cia la proliferación <strong>de</strong> <strong>las</strong> <strong>en</strong>cuestas por muestreo. Esta forma <strong>de</strong> investigaciónse fundam<strong>en</strong>ta <strong>en</strong> la posibilidad <strong>de</strong> obt<strong>en</strong>er características <strong>de</strong> la población a partir <strong>de</strong>l estudio <strong>de</strong> una parte<strong>de</strong> la misma, que es la muestra.<strong>El</strong> diseño <strong>muestral</strong> compr<strong>en</strong><strong>de</strong> todos los aspectos relacionadoscon la obt<strong>en</strong>ción <strong>de</strong> una muestra, repres<strong>en</strong>tativa <strong>de</strong> lapoblación respecto a la características objeto <strong>de</strong> estudio, ycon la <strong>de</strong>cisión sobre la forma <strong>de</strong> inferir los resultados poblacionales.<strong>El</strong> hecho <strong>de</strong> inferir los resultados <strong>de</strong> la población a partir<strong>de</strong> la investigación <strong>de</strong> una parte <strong>de</strong> la misma introduce elerror <strong>de</strong> muestreo. Con objeto <strong>de</strong> que el usuario <strong>de</strong> la informaciónt<strong>en</strong>ga conocimi<strong>en</strong>to <strong>de</strong> la calidad <strong>de</strong> la misma, eldiseño <strong>muestral</strong> trata <strong>de</strong> proporcionar una medida <strong>de</strong> la precisión<strong>de</strong> <strong>las</strong> estimaciones.Fr<strong>en</strong>te a otras técnicas, el muestreo probabilístico, utilizadopor el INE <strong>en</strong> todas <strong>las</strong> <strong>en</strong>cuestas y <strong>en</strong> particular <strong>las</strong> dirigidasa los <strong>hogares</strong>, permite obt<strong>en</strong>er una medida objetiva<strong>de</strong> esta precisión.“<strong>El</strong> diseño <strong>muestral</strong>trata <strong>de</strong> proporcionaruna medida <strong>de</strong> la precisión<strong>de</strong> <strong>las</strong> estimaciones”<strong>El</strong> primer paso antes <strong>de</strong> abordar el diseño <strong>de</strong> una muestraconsiste <strong>en</strong> establecer <strong>de</strong> manera lo más precisa posible cuálesson los objetivos <strong>de</strong> la investigación, <strong>en</strong> lo que se refierea <strong>las</strong> variables a estimar, <strong>de</strong>sagregación geográfica requerida,tipo <strong>de</strong> estimaciones, y cuál se consi<strong>de</strong>ra la precisión mínimaaceptable <strong>de</strong> <strong>las</strong> mismas.Esta etapa previa resulta fundam<strong>en</strong>tal a la hora <strong>de</strong> realizarun diseño <strong>muestral</strong> a<strong>de</strong>cuado a <strong>las</strong> necesida<strong>de</strong>s señaladaspor los usuarios.Una vez conocidos los objetivos <strong>de</strong> la <strong>en</strong>cuesta, se analizany concretan <strong>las</strong> distintas fases <strong>de</strong>l diseño <strong>muestral</strong>.T<strong>en</strong>i<strong>en</strong>do <strong>en</strong> cu<strong>en</strong>ta que la población objetivo está constituidapor <strong>las</strong> personas o los <strong>hogares</strong>, los aspectos técnicosmás importantes son:Tipo <strong>de</strong> muestreoSe utiliza un muestreo bietápico estratificado <strong>de</strong> conglomerados.Esta técnica, ampliam<strong>en</strong>te utilizada <strong>en</strong> el mundo <strong>de</strong> laestadística oficial, pres<strong>en</strong>ta una cierta pérdida <strong>de</strong> precisión<strong>en</strong> comparación con el muestreo aleatorio simple <strong>en</strong> unaetapa, pero una mayor eficacia <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong>lcoste <strong>de</strong> la operación <strong>muestral</strong>. La pérdida <strong>de</strong> precisión quesupone el muestreo <strong>de</strong> conglomerados, se comp<strong>en</strong>sa con unincrem<strong>en</strong>to <strong>de</strong>l tamaño <strong>de</strong> la muestra.Las unida<strong>de</strong>s <strong>de</strong> primera etapa la constituy<strong>en</strong> <strong>las</strong> seccionesc<strong>en</strong>sales(áreas geográficas), y <strong>las</strong> <strong>de</strong> segunda etapa, <strong>las</strong>vivi<strong>en</strong>das familiares. A través <strong>de</strong> el<strong>las</strong> se investiga a la poblaciónobjeto <strong>de</strong> estudio.Determinación <strong>de</strong>l marco <strong>muestral</strong><strong>El</strong> marco repres<strong>en</strong>ta la relación <strong>de</strong> <strong>las</strong> unida<strong>de</strong>s <strong>de</strong> lapoblación que va a ser investigada. Dado que la muestraha <strong>de</strong> reproducir la característica <strong>de</strong> interés <strong>de</strong> la población,el marco, relación <strong>de</strong> unida<strong>de</strong>s <strong>de</strong> muestreo, <strong>de</strong>be seridéntico a la población objetivo. A<strong>de</strong>más, cualquier informacióndisponible <strong>en</strong> el mismo sobre <strong>las</strong> unida<strong>de</strong>s <strong>de</strong> la


Noviembre 2005tema <strong>de</strong> portada • 17población es útil <strong>en</strong> el establecimi<strong>en</strong>to <strong>de</strong>l tipo <strong>de</strong> muestreoa utilizar.<strong>El</strong> INE utiliza difer<strong>en</strong>tes marcos para la selección <strong>de</strong> <strong>las</strong>muestras, según el tipo <strong>de</strong> <strong>en</strong>cuestas:En <strong>las</strong> <strong>en</strong>cuestas <strong>de</strong> tipo esporádico se utiliza el PadrónContinuo, el cual es la relación <strong>de</strong> <strong>las</strong> personas <strong>de</strong>l país <strong>en</strong>un mom<strong>en</strong>to <strong>de</strong>l tiempo. Es un marco actualizado ya queeste es un fichero vivo que se actualiza mes a mes. A partir<strong>de</strong> él se obti<strong>en</strong>e un marco <strong>de</strong> vivi<strong>en</strong>das mediante una explotaciónad hoc que se realiza <strong>de</strong>l mismo.En <strong>las</strong> <strong>en</strong>cuestas <strong>de</strong> tipo continuo, EPA, ECPF, se utilizaun marco que se obti<strong>en</strong>e <strong>de</strong>l C<strong>en</strong>so <strong>de</strong> Población, pero quemediante un tratami<strong>en</strong>to especial se manti<strong>en</strong>e actualizado <strong>en</strong>los periodos interc<strong>en</strong>sales.Esta actualización pret<strong>en</strong><strong>de</strong> incorporar a la muestra, y portanto dar probabilidad <strong>de</strong> ser seleccionadas, a aquel<strong>las</strong> unida<strong>de</strong>sque <strong>en</strong> el mom<strong>en</strong>to <strong>de</strong> la realización <strong>de</strong>l c<strong>en</strong>so no formabanparte <strong>de</strong> <strong>las</strong> unida<strong>de</strong>s primarias seleccionadas para lamuestra.La información auxiliar <strong>de</strong> este marco es superior a lacont<strong>en</strong>ida <strong>en</strong> el Padrón Continuo, ya que al ser éste un docum<strong>en</strong>topúblico la información cont<strong>en</strong>ida <strong>en</strong> el mismo es muyescasa.<strong>El</strong> marco proced<strong>en</strong>te <strong>de</strong>l c<strong>en</strong>so, conti<strong>en</strong>e información <strong>de</strong>sagregadaa nivel <strong>de</strong> sección c<strong>en</strong>sal, unidad primaria <strong>de</strong> muestreo,que es utilizada <strong>en</strong> la estratificación <strong>de</strong> dichas unida<strong>de</strong>s.Como variables <strong>de</strong> estratificación se utiliza el tamaño <strong>de</strong>lmunicipio y otras características <strong>de</strong> tipo socioeconómicoque estén correlacionadas con la variable objeto <strong>de</strong> estudio.En los últimos años se dispone a<strong>de</strong>más <strong>de</strong> información agregadasobre niveles <strong>de</strong> r<strong>en</strong>ta <strong>en</strong> <strong>las</strong> unida<strong>de</strong>s primarias <strong>de</strong>muestreo, proced<strong>en</strong>te <strong>de</strong> la Ag<strong>en</strong>cia Estatal <strong>de</strong> AdministraciónTributaria, que resulta <strong>de</strong> la mayor utilidad para la <strong>de</strong>finición<strong>de</strong> los estratos.La calidad <strong>de</strong>l marco es una característica primordial paraasegurar una cobertura a<strong>de</strong>cuada <strong>de</strong> la población.Tamaño <strong>de</strong> la muestra<strong>El</strong> tamaño <strong>de</strong> la muestra se establece según el nivel <strong>de</strong> <strong>de</strong>sagregación<strong>de</strong> los datos y el nivel <strong>de</strong> precisión <strong>de</strong> <strong>las</strong> estimaciones.Estos objetivos están limitados por el coste <strong>de</strong> lainvestigación.Aún cuando <strong>las</strong> <strong>en</strong>cuestas ti<strong>en</strong><strong>en</strong> objetivos múltiples, pararealizar estos cálculos, el muestrista <strong>de</strong>be c<strong>en</strong>trarse <strong>en</strong> <strong>las</strong> característicasque sean <strong>de</strong> interés fundam<strong>en</strong>tal para el estudio.


Noviembre 2005tema <strong>de</strong> portada • 18La expresión que relaciona la precisión con el tamaño<strong>muestral</strong> <strong>de</strong>p<strong>en</strong><strong>de</strong> <strong>de</strong> valores poblacionales, g<strong>en</strong>eralm<strong>en</strong>te<strong>de</strong>sconocidos. En este caso hay que apoyarse <strong>en</strong> informaciónproced<strong>en</strong>te <strong>de</strong> otras <strong>en</strong>cuestas próximas <strong>en</strong> el tiempo,c<strong>en</strong>sos, etc.Los tamaños <strong>muestral</strong>es <strong>de</strong> <strong>las</strong> <strong>en</strong>cuestas <strong>de</strong> <strong>hogares</strong> varían<strong>de</strong> unas a otras según los objetivos <strong>de</strong> <strong>las</strong> mismas.“En la mayoría<strong>de</strong> <strong>las</strong> <strong>en</strong>cuestas <strong>de</strong> <strong>hogares</strong>se utilizan estimadores<strong>de</strong> razón a los que se aplicantécnicas <strong>de</strong> calibrado”Así por ejemplo, una <strong>en</strong>cuesta diseñada para dar datospor comunida<strong>de</strong>s autónomas, como la <strong>en</strong>cuesta sobre Equipami<strong>en</strong>toy Uso <strong>de</strong> Tecnologías <strong>de</strong> la Información y laComunicación <strong>de</strong> los Hogares ti<strong>en</strong>e un tamaño <strong>en</strong> torno a20.000 <strong>hogares</strong>, mi<strong>en</strong>tras que otra <strong>en</strong>cuesta como la EPAdiseñada para dar datos provinciales ti<strong>en</strong>e un tamaño <strong>de</strong>60.000 <strong>hogares</strong>.Estimadores<strong>El</strong> proceso <strong>de</strong> estimación permite inferir los datos poblacionalesa partir <strong>de</strong> la muestra. La obt<strong>en</strong>ción <strong>de</strong>l estimador serealiza <strong>en</strong> varios pasos y vi<strong>en</strong>e <strong>de</strong>terminado por: el procedimi<strong>en</strong>toseguido <strong>en</strong> la selección <strong>de</strong> la muestra, la corrección<strong>de</strong> la falta <strong>de</strong> respuesta y el uso <strong>de</strong> información auxiliar(Técnicas <strong>de</strong> calibrado).<strong>El</strong> primer paso trata <strong>de</strong> recoger los efectos <strong>de</strong> la selección<strong>de</strong> unida<strong>de</strong>s, estratificación, formación <strong>de</strong> conglomerados,etc. <strong>El</strong> peso que se obti<strong>en</strong>e es el peso <strong>de</strong> diseño y se obti<strong>en</strong>ecomo la inversa <strong>de</strong> la probabilidad que ti<strong>en</strong>e la unidad <strong>de</strong>pert<strong>en</strong>ecer a la muestra.<strong>El</strong> segundo paso trata <strong>de</strong> corregir el sesgo que se introduce<strong>en</strong> la muestra por la falta <strong>de</strong> respuesta, <strong>de</strong>bido al hecho<strong>de</strong> que ésta no es aleatoria d<strong>en</strong>tro <strong>de</strong> la población.<strong>El</strong> tercer paso trata <strong>de</strong> mejorar la precisión <strong>de</strong> los estimadores,ajustando la estimación obt<strong>en</strong>ida con la muestra paraalguna variable relacionada con la variable <strong>de</strong> interés, a lainformación proced<strong>en</strong>te <strong>de</strong> una fu<strong>en</strong>te externa.En la mayoría <strong>de</strong> <strong>las</strong> <strong>en</strong>cuestas <strong>de</strong> <strong>hogares</strong> se utilizan estimadores<strong>de</strong> razón a los que se aplican técnicas <strong>de</strong> calibrado.La información auxiliar hace refer<strong>en</strong>cia a la población c<strong>las</strong>ificadapor sexo y edad y a la distribución por tamaño <strong>de</strong>hogar.Medida <strong>de</strong> la precisiónLa precisión <strong>de</strong> <strong>las</strong> estimaciones vi<strong>en</strong>e medida a través <strong>de</strong> lavarianza <strong>de</strong>l estimador.De acuerdo con la teoría <strong>de</strong> la probabilidad, el conocimi<strong>en</strong>to<strong>de</strong> la varianza <strong>de</strong>l estimador permite la construcción<strong>de</strong> intervalos <strong>de</strong> confianza, d<strong>en</strong>tro <strong>de</strong> los cuales pue<strong>de</strong><strong>en</strong>contrarse el valor verda<strong>de</strong>ro <strong>de</strong> la característica que se haestimado.En diseños complejos, como los utilizados <strong>en</strong> <strong>las</strong> <strong>en</strong>cuestas<strong>de</strong> <strong>hogares</strong>, el cálculo <strong>de</strong> la varianza <strong>de</strong>l estimador se realizamediante procedimi<strong>en</strong>tos indirectos que permit<strong>en</strong> obt<strong>en</strong>erestimaciones insesgadas.Los procedimi<strong>en</strong>tos utilizados son el <strong>de</strong> <strong>las</strong> semimuestrasreiteradas <strong>en</strong> la EPA, el método <strong>de</strong> los conglomerados últimos<strong>en</strong> la ECPF, y actualm<strong>en</strong>te se está utilizando el métodoJackniffe <strong>en</strong> la <strong>en</strong>cuestas esporádicas.Como resum<strong>en</strong> <strong>de</strong> lo com<strong>en</strong>tado anteriorm<strong>en</strong>te, a la hora<strong>de</strong> realizar un diseño <strong>muestral</strong>, es fundam<strong>en</strong>tal t<strong>en</strong>er <strong>en</strong>cu<strong>en</strong>ta <strong>las</strong> experi<strong>en</strong>cias anteriores, el conocimi<strong>en</strong>to sobre lainformación auxiliar disponible, así como el uso <strong>de</strong> <strong>las</strong>metodologías que se emplean <strong>en</strong> otros países <strong>de</strong> similarescaracterísticas al nuestro.En conclusión, el diseño <strong>muestral</strong> es un proceso que participa<strong>en</strong> prácticam<strong>en</strong>te todas <strong>las</strong> fases <strong>de</strong> una <strong>en</strong>cuesta,<strong>de</strong>s<strong>de</strong> el establecimi<strong>en</strong>to <strong>de</strong> objetivos claros y precisos <strong>de</strong> lamisma, hasta la producción <strong>de</strong> estimaciones y medidas <strong>de</strong>precisión <strong>de</strong> <strong>las</strong> mismas.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!