La vida es el arte de obtener conclusiones a partir de evidencias
insuficientes (S. Butlev), y la estadistica es el arte de obtener
conclusiones a partir de diferencias significativas

jueves, 17 de junio de 2010

FUNDAMENTOS DE MUESTREO

Marco conceptual de las técnicas muestrales:
Población,
Muestras, Marcos muestrales,
Diseños muestrales,
Estimación puntual,
Estimación por intervalos.
La encuesta y el cuestionario.
Captura de datos.
Marco conceptual de las técnicas muestrales:
Población de Referencia: Conjunto de elementos o sujetos acerca de los cuales queremos conocer una o varias características (Consideraremos solo el caso de Poblaciones finitas pero relativamente grandes).
Se describen generalmente de manera conceptual:
Niños en Edad Escolar del municipio X
Municipios de Colombia
Estudiantes universitarios de pregrado.
Manzanas del Municipio de Bucaramanga
Unidades de Análisis: Nombre genérico que reciben los elementos o sujetos que constituyen una población y que podrían ser objeto de interrogatorio o medición.
Unidades de Primera Etapa (UPE): En una primera etapa del muestreo pueden ser seleccionados directamente los individuos que serán interrogados o sobre los que se hará la medición.
Unidades de Segunda Etapa (USE): En una primera etapa se seleccionen conglomerados (UPE), y en una segunda etapa, se seleccionan las Unidades que serán interrogadas o medidas. Y así sucesivamente…
En cualquier caso las Unidades de Muestreo deben cubrir por entero la Población sin interceptarse.


Marco Muestral: Conjunto de listas de todas las unidades de muestreo necesarias para llevar adelante el proceso.

Por ejemplo: Para interrogar u observar características de jefes de hogar en una ciudad puede ser necesario contar con:

  • Listado de Manzanas de la ciudad.

  • Listado de Hogares de cada Manzana.

No se puede hablar de muestreo probabilístico e inferencia estadística sin contar con Marcos Muestrales.


Probabilidad de Selección y Diseños Probabilisticos:

Supongamos que tenemos una población:

El método de selección es estadísticamente riguroso si se cumple:
Que se ha otorgado a cada elemento de la población una probabilidad conocida πi (diferente de cero) de integrar la muestra
Diseños Equiprobablísticos:
Todos los elementos de la Población tienen la misma probabilidad de ser seleccionados. Es decir πi es constante para todo i.
Ejemplo 1: Tenemos 12 individuos numerados del 1 al 12 y los separamos en dos grupos. Grupo 1, los numerado del 1 al 6, Grupo 2 los numerados del 7 al 12. Se lanza una moneda, si cae cara se elige el Grupo 1 y si sello el Grupo 2. La probabilidad de elegir cualquier individuo es igual a ½.
Ejemplo 2: Se escriben los 12 números en igual número de tarjetas que se colocan en una urna y se toma al azar 6 números; la teoría combinatoria permite probar que en este caso cada individuo tiene igual probabilidad también ½ de se elegido.
Sin embargo, los dos métodos de elección son diferentes.
En que se diferencian los dos métodos?
Diseños No Equiprobablísticos:
Ejemplo: Ahora los 12 individuos están separados en dos grupos: En el Grupo 1 hay 4 individuos y en el Grupo 2 hay 8 individuos. Los 6 individuos se seleccionan así: Se seleccionan al azar 3 individuos del Grupo 1: la probabilidad de elegir cualquier individuo de este grupo es ¾, y se eligen al azar 3 individuos del Grupo 2: la probabilidad de elegir a cualquier individuo de este grupo es 3/8.
El diseño es Probabilístico, pero no equiprobabilistico
Muestras No Probabilísticas:
Selección realizada sin ningún método.
No se recomienda en ningún caso
Muestreo semiprobabilístico.
Se mantiene el rigor probabilístico hasta cierto punto y de allí en adelante se abandona. Solo se recomienda cuando no hay nada más que hacer y tomando muchas precauciones para no generar sesgos.
Muestreo por cuotas.
Forzar que la muestra contenga el mismo porcentaje de individuos con ciertas características prefijadas que la población entera.
Por ejemplo: Se le asigna a cada encuestador una manzana en la cual debe hacer 10 entrevistas: Así:
5 hombres y 5 mujeres.
Uno profesional.
Dos mayores de 50 años 6 deben estar entre los 25 y los 49 años y el resto entre 15 y 24 años.
Puede conducir a importantes sesgos debido a que la selección final del encuestado se deja al juicio subjetivo del entrevistador.
Selección según criterio de autoridad.
En ocasiones, con poblaciones y muestras pequeñas se prefieren a los estrictamente probabilísticos.
Representatividad:
La muestra exhibe internamente el mismo grado de diversidad que la población
Azar: (Definición) Suceso imprevisible por ser fruto de una coincidencia fortuita de series causales diversas. Según algunas escuelas, llamamos azar sólo a nuestra ignorancia de todos los factores causales que inciden en un fenómeno.
Porque recurrimos al azar para escoger las muestra con las cuales trabajar en el muestreo probabilístico?
Para eliminar toda subjetividad en la elección de las unidades de análisis.
Para establecer criterios que nos permitan medir el grado de precisión con el cual se hacen las estimaciones.
Garantiza el azar la representatividad?
Parámetros Poblacionales y Estimación Puntual

Estimación por Intervalos e interpretación
Límite Inferior = Estimación Puntual - Error de Muestreo
Límite Superior = Estimación Puntual + Error de Muestreo
Ejemplo:
Tamaño de Muestra: 100

Confiabilidad
Es el grado de confianza con el cual el investigador puede asegurar que el verdadero valor del parámetro se encuentra en el intervalo calculado. Se da en porcentaje generalmente del 90 95 98 por ciento.
Por ejemplo un Intervalo de Confianza del 95 % quiere decir que si el investigador repitiera el experimento 100 veces en aproximadamente 95 ocasiones el Intervalo incluirá el verdadero valor del parámetro.
Tamaño del Error de Muestreo
Para comprender la importancia de este concepto miremos el siguiente raciocinio:
Supóngase que un Candidato cree contar con el 70 % de opinión favorable.
En un Sondeo de opinión obtuvo que 75 % de los encuestados están por dicho candidato.
Se puede afirmar que se supera la creencia original?
Si el Error Muestral es del 8 % esto significa que el verdadero valor promedio de favorabilidad esta entre el 67 % y el 83 %.
Es decir, la favorabilidad en el momento del nuevo sondeo podría ser incluso inferior a la primera medición.
En otras palabras el sondeo solo mostraría superación de la creencia original, para una estimación puntual del 75 %, si el error muestral fuera inferior al 5 % (digamos, por ejemplo, 4 %).
En este caso el intervalo de confianza para la favorabilidad promedio en el momento del sondeo, estaría entre el 71% y el 79 %, intervalo que esta por encima del 70 % (creencia original).
Pero hay algo más:
Si la creencia original se estableció también por un procedimiento de muestreo y lo que obtuvo fue un Intervalo de Confianza de 68 % al 72 %.
El nuevo sondeo, para ser concluyentemente favorable, debería tener un error muestral aun más pequeño digamos del 2 %. Así, el nuevo intervalo del 73 % al 77 % al no interceptar al anterior apoyaría la conclusión de que la favorabilidad actual es mayor que la original.
Algunos cometarios acerca de las encuestas o cuestionarios
El cuestionario
1. Instrumento básico de recolección de información:
Preguntas (subjetividad: opiniones, Objetividad)
Mediciones
2 Formas de Aplicación
A través de un encuestador.
Cuestionario auto administrados,
Por teléfono,
Procurando respuestas por correo
Encuesta asistida por computador usando el Internet.
3 Ubicación de las preguntas
Es trivial el orden en el cual se hagan las preguntas?
4. Tipos de Preguntas
4.1 Abiertas, cerradas
Cerradas
Las opciones presentadas deben ser exhaustivas
Cuando las opciones son valorativas, el número de opciones que se presente al encuestado influye en las respuestas.
Abiertas
Al dejar en libertad al encuestado para que redacte un párrafo como respuesta, se debe prever el tratamiento que se le dará.
Son útiles en estudios exploratorios
4.2 Cuantitativas, cualitativas
Cuantitativas
La respuesta es un número que puede ser el resultado de una pregunta sobre aspectos objetivos o subjetivos.
O el resultado de una medición.
Cualitativas
La respuesta es una categoría.
En la mayoría de los casos las categorías posibles (una de las cuales debe ser escogida por el encuestado) son aportadas en forma de pregunta cerrada
4.3 De ordenación
Responden a preguntas que se enuncian como : “Ponga en orden de importancia …” dando una lista de opciones
O ser abierta: En orden de importancia, de más a menos, escriba los nombres de los tres profesores que más influyeron, positivamente, en su formación durante la carrera.
4.4 De escala
Escala de analogía visual
Nada______________________________________________Mucho
Escala de Likert
Se usa para valorar el grado en que un individuo comparte cierta línea de pensamiento o teoría.
Se aplica a una secuencia de afirmaciones (alrededor de 15) acerca de un determinado punto de vista.
Para cada afirmación la persona encuestada debe elegir una de entre varias alternativas (usualmente entre 5 y 9) que expresan diversos grados de adhesión a dicha posición.
Para evitar que el encuestado responda sin pensar, en un cierto sentido, se construyen unas preguntas en forma positiva y otras en forma negativa.


Consistencia interna
Existen indicadores estadísticos, como el Alfa de Cronbach, que permiten establecer si la escala mide concistentemente lo que se quiere.


Índice de adherencia de la escala de Likert


Suponga que se emplean k afirmaciones, cada una con r alternativas, y sea xi la opción elegida en la i-esima afirmación.


El Índice de Adherencia (IA) se calcula mediante la siguiente formula:




El valor de IA cae entre 0 y 1 e indica el grado en que el sujeto simpatiza con la posición expresada en el contexto. IA = 1 indicaría absoluta adherencia, y el valor IA = 0 discrepancia total.
El valor de IA cae entre 0 y 1 e indica el grado en que el sujeto simpatiza con la posición expresada en el contexto. IA = 1 indicaría absoluta adherencia, y el valor IA = 0 discrepancia total.

Algunos comentarios sobre:

1. Recolección de la información.

Necesidad de establecer controles para garantizar que la información que se recoge sea correcta.

2. Registro y captura de datos

Uso de Hojas de Excel, Access, o los módulos específicos con que cuentan los distintos paquetes estadísticos.
Conocer, o aprender a lidiar con los problemas de importación y exportación de datos.

3. Procesamiento y análisis de datos

Uso de hojas de Excel (cálculos manuales)

Paquetes estadísticos:
Epi info, Modulo “Complex Sample”
SPSS , Modulo “Complex Sample”
SAS, Procedimientos SurveyMeans, SurveyFreq, etc.

Disposición de los dato en filas y columnas

No hay comentarios:

Publicar un comentario en la entrada

Seguidores

Archivo del blog