ENFOQUES CONCEPTUALES SOBRE LA PRECISIÓN DE ENCUESTAS DE MUESTREO PROBABILÍSTICO Y NO PROBABILÍSTICO
Por: Ing. José Cotos
Estoy analizando acá un paper de varios profesores, de diversas universidades. Entre ellas están de la University of Mannheim, University of Chicago, Stanford University, Utrecht University, Université Paris-Saclay, University of Michigan, Australian National University, University of Queenslandk, Ludwig Maximilian University of Munich, y University of Essex.
Explican que hay muchos hechos de los últimos años en que las predicciones fueron erróneas como se predijo que los británicos permanecerían en la Unión Europea, que en las elecciones del 2016 Hillary Clinton derrotaría a Donald Trump. Cuando se han investigado en las razones de estos fallos, se encontró que las predicciones de estos hechos se basaron en muestras no probabilísticas. Los estudios muestran que las predicciones basadas en muestras probabilísticas son más precisos que los estudios basados en muestras no probabilísticas. Los estudios muestran alta precisión en encuestas de muestreo probabilístico para estimados univariados y análisis longitudinales. Estos estudios no hallan diferencia en precisión de casos bivariados y multivariados.
Evaluar la precisión de las muestras enfrenta desafíos. Un desafío común es desenredar modos de efecto (sesgos de medición por ejemplo) de efectos de muestra (sesgos de selección por ejemplo). Este desafío ocurre porque las encuestas de muestras probabilísticas son conducidos generalmente offline (por ejemplo cara a cara o por entrevistas telefónicas) mientras encuestas de muestras no probabilísticas son conducidas generalmente online vía paneles no probabilísticos online. La mayoría de todos los estudios concluyen que ambas encuestas de muestras probabilísticas offline y online son más precisas que las encuestas de muestreo no probabilístico online.
El desafío es cómo medir la precisión de forma que sirva par ambos, variabilidad de muestreo y sesgo sistemático. Todo estos sugiere que las encuestas varían en un número de factores de diseño en vez de diseño muestral (por ejemplo, esquemas de incentivos, frecuencia de contacto) y puede a veces ser más o menos preciso por elección, las muestras más precisas son basadas en procedimientos de muestreo probabilístico en vez de procedimientos de muestreo no probabilístico.
Otro desafío común en evaluaciones de precisión es cuando enfrentan disponibilidad de benchmarks dorados. Los benchmarks más usados son gran escala, alta calidad en encuestas de muestreo de probabilidad. Un ejemplo típico de diseño benchmark es la Encuesta de la Comunidad Americana US. Otros benchmarks son datos del censo de población, salidas en la elección y datos de registro de la población.
Todos estos benchmarks tienen ventajas y desventajas. Una ventaja clave de usar una encuesta de muestreo probabilístico de alta calidad usándolo a gran escala es que el juego de variables disponibles para comparación incluye no solo variables sociodemográficas sino variables sustantivas en actitudes y comportamiento. Una desventaja es que a gran escala, las encuestas de muestreo no probabilístico de alta calidad son encuestas por sí mismas y deben contener errores típicos de encuestas, como errores de cobertura, muestreo y falta de respuesta.
Yo creo que en el Perú también podemos realizar investigaciones de este tipo pero se requiere de buenos profesionales en Estadística. En los tiempos actuales, la Estadística y la Matemática se han vuelto más importantes que antes para predecir hechos e identificar tendencias y son aplicados en Machine Learning e Inteligencia Artificial. Ofrecer becas de estudio para maestría y doctorado en Estadísticas y en Matemáticas Puras sería muy valioso para elevar el nivel y aumentar la calidad de las investigaciones peruanas. Tuve ocasión de llevar un curso internacional de matemáticas puras hace unos años, y el profesor, de España, contó que invertir en estudios de investigación en matemáticas puras no es muy caro y se pueden realizar grandes descubrimientos. El nos recomendó que así podía desarrollar el Perú.
Si se dan cuenta, la experiencia de Brasil, que se esmeraron en estudiar e investigar en Matemáticas Puras es un gran ejemplo de cómo este hecho, reforzó el estudio de las ingenierias y el desarrollo del Brasil. Esta iniciativa puede ser replicada en el Perú y lograr elevar las investigaciones en Estadística, Matemáticas e Ingenierias para sus diversas aplicaciones. Yo he logrado revisar libros brasileños de Recursos Humanos llenos de herramientas matemáticas lo cual no se da en los países vecinos. Sigamos el camino del desarrollo. La ruta está trazada, solo hay que seguirla.