

Un Procedimiento De Selecciin De Sub-Muestras De Gran Tamaao De Una Muestra Aleatoria Simple Representativas De La Poblaciin De Estudio (A Selection Procedure of High Size Sub-Samples from a Simple Random Sample Representative of the Population)

Carlos Vidal-meliáMarta Regúlez-castilloJuan Manuel Pérez-salamero González



Spanish Abstract: En este trabajo se propone una metodologia basada en la optimizacion para elegir sub-muestras de gran tamano extraidas de una muestra aleatoria simple inicial que mejore la representatividad de la poblacion objeto de estudio. El criterio se basa en maximizar el tamano de la sub-muestra a traves de la constante de proporcionalidad de un muestreo estratificado con afijacion proporcional sujeto a que el p-valor del test de bondad del ajuste tome valores suficientemente altos, dejando al usuario la posibilidad de elegir la relacion deseada entre la calidad del ajuste y el tamano de la sub-muestra. Para ilustrar el procedimiento propuesto se realiza una aplicacion a la Muestra Continua de Vidas laborales (MCVL). Se confirma que es posible disponer de sub-muestras de gran tamano con una representatividad muy mejorada lo que permite obtener mayor calidad en los posteriores analisis sobre el sistema publico de pensiones. La mejora en la representatividad de la sub-muestra obtenida se constata comparando la estimacion del gasto total en pensiones proporcionada por la MCVL y la de dicha sub-muestra.English Abstract: This paper proposes criteria for choosing large sub-samples drawn from a large simple random sample that are more representative of the population that is the object of the study. The criterion used seeks to maximize the size of the sub-sample restricted to a p-value high enough to achieve a good fit of the test for goodness of fit, giving the user the freedom to choose between a larger size sub-sample with a poorer adjustment or a better fit with smaller size. We use the Continuous Sample of Working Lives (CSWL) to illustrate the procedure finding high size sub-samples with better representativeness The gains from using this sample design procedure is found by comparing the estimate of total pension expenditure provided by the CSWL and such sub-samples. Having most representative large sub-samples is possible allowing for higher quality in subsequent analysis on the public pension system
