UNIDAD 2 CONTROL ESTADÍSTICO DE LA CALIDAD
ESTADÍSTICA DESCRIPTIVA
La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) y trata de extraer conclusiones sobre el comportamiento de estas variables.
Las variables pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).
Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).
Las variables también se pueden clasificar en:
Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase).
Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:
Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo.
Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.
Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.
2.2 ESTADÍSTICA INFERENCIAL
(CASOS DE APLICACIÓN)
Estadística Inferencial
Definición de Estadística Inferencial
El principal objetivo de la Estadística consiste en poder decir algo con respecto a un gran conjunto de personas, mediciones u otros entes (población) con base en las observaciones hechas sobre sólo una parte (muestra) de dicho gran conjunto. La capacidad para "decir algo" sobre poblaciones con base en muestras está basada en supuestos con respecto a algún modelo de probabilidad que permite explicar las características del fenómeno bajo observación.
Al conjunto de procedimientos estadísticos en los que interviene la aplicación de modelos de probabilidad y mediante los cuales se realiza alguna afirmación sobre poblaciones con base en la información producida por muestras se le llama Inferencia Estadística o Estadística Inferencial.
Los dos tipos de problemas que resuelven las técnicas estadísticas son: estimación y contraste de hipótesis. En ambos casos se trata de generalizar la información obtenida en una muestra a una población. Estas técnicas exigen que la muestra sea aleatoria. En la práctica rara vez se dispone de muestras aleatorias, por la tanto la situación habitual es la que se esquematiza en la figura
Entre la muestra con la que se trabaja y la población de interés, o población diana, aparece la denominada población de muestreo: población (la mayor parte de las veces no definida con precisión) de la cual nuestra muestra es una muestra aleatoria. En consecuencia la generalización está amenazada por dos posibles tipos de errores: error aleatorio que es el que las técnicas estadísticas permiten cuantificar y críticamente dependiente del tamaño muestral, pero también de la variabilidad de la variable a estudiar y el error sistemático que tiene que ver con la diferencia entre la población de muestreo y la población diana y que sólo puede ser controlado por el diseño del estudio.
Tamaño muestral
El tamaño muestral juega el mismo papel en estadística que el aumento de la lente en microscopía: si no se ve una bacteria al microscopio, puede ocurrir que:
- la preparación no la contenga
- el aumento de la lente sea insuficiente.
Para decidir el aumento adecuado hay que tener una idea del tamaño del objeto.
Del mismo modo, para decidir el tamaño muestral:
i) en un problema de estimación hay que tener una idea de la magnitud a estimar y del error aceptable.
ii) en un contraste de hipótesis hay que saber el tamaño del efecto que se quiere ver.
2.3 LAS SIETE HERRAMIENTAS BASICAS PARA EL CONTROL DE LA CALIDAD
Las siete herramientas básicas de calidad es una denominación dada a un conjunto de técnicas gráficas identificadas como las más útiles en la solución de problemas enfocados a la calidad de los productos. Se conocen como “herramientas básicas” ya que son adecuadas para personas con poca formación en materia de estadísticas.
Las siete herramientas básicas son:
1. Diagrama de Ishikawa: también llamado diagrama de causa-efecto o diagrama causal, se trata de un diagrama que por su estructura ha venido a llamarse también: diagrama de espina de pez, que consiste en una representación gráfica sencilla en la que puede verse de manera relacional una especie de espina central, que es una línea en el plano horizontal, representando el problema a analizar, que se escribe a su derecha. Es una de las diversas herramientas surgidas a lo largo del siglo XX en ámbitos de la industria y posteriormente en el de los servicios, para facilitar el análisis de problemas y sus soluciones en esferas como lo son; calidad de los procesos, los productos y servicios.
2. Hoja de Verificación: también llamada hoja de control o de chequeo, es un impreso con formato de tabla o diagrama, destinado a registrar y compilar datos mediante un método sencillo y sistemático, como la anotación de marcas asociadas a la ocurrencia de determinados sucesos. Esta técnica de recogida de datos se prepara de manera que su uso sea fácil e interfiera lo menos posible con la actividad de quien realiza el registro.
3. Gráfico de Control: es una representación gráfica de los distintos valores que toma una característica correspondiente a un proceso. Permite observar la evolución de este proceso en el tiempo y compararlo con unos límites de variación fijados de antemano que se usan como base para la toma de decisiones.
4. Histograma: es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos. Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.
5. Diagrama de Pareto: también llamado curva 80-20 o distribución C-A-B, es una gráfica para organizar datos de forma que estos queden en orden descendente, de izquierda a derecha y separados por barras. Permite asignar un orden de prioridades. El diagrama permite mostrar gráficamente el principio de Pareto (pocos vitales, muchos triviales), es decir, que hay muchos problemas sin importancia frente a unos pocos graves. Mediante la gráfica colocamos los “pocos vitales” a la izquierda y los “muchos triviales” a la derecha.
6. Diagrama de Dispersión: también llamado gráfico de dispersión, es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. Los datos se muestran como un conjunto de puntos, cada uno con el valor de una variable que determina la posición en el eje horizontal y el valor de la otra variable determinado por la posición en el eje vertical.
7. Muestreo Estratificado: también conocida como estratificación, es una herramienta estadística que clasifica los elementos de una población que tiene afinidad para así analizarlos y determinar causas comunes de su comportamiento. La estratificación contribuye a identificar las causas que hacen mayor parte de la variabilidad, de esta forma se puede obtener una comprensión detallada de la estructura de una población de datos, examinando así la diferencia en los valores promedio y la variación en los diferentes estratos.
2.4 MANEJO DE SOFWARE ESPECIALIZADO EN CALIDAD
KMKey Quality es un software de gestión de calidad ideal para la implantación y mantenimiento de un Sistema de Gestión de calidad (SGC) de cualquier tipo: ISO 9001, ISO 14001, OHSAS 18001, etc., o de una combinación de los mismos, facilitando la gestión de un sistema integrado.
UNIDAD 3: PLANES DE MUESTREO
3.1. MUESTREO ALEATORIO
El muestreo aleatorio constituye una de las clases más populares de muestreo aleatorio o probabilístico. En esta técnica, cada miembro de la población tiene la misma probabilidad de ser seleccionado como sujeto. Todo el proceso de toma de muestras se realiza en un paso, en donde cada sujeto es seleccionado independientemente de los otros miembros de la población.
El muestreo aleatorio siempre se puede aplicar en muchos métodos. El más primitivo y mecánico sería el de la lotería. A cada miembro de la población se le asigna un número. Todos los números se colocan en un recipiente o un sombrero y se mezclan. Con los ojos vendados, el investigador va sacando las etiquetas con números. Todos los individuos que tengan los números sacados por el investigador son los sujetos del estudio. Otra forma sería que una computadora haga la selección al azar de la población. En el caso de poblaciones con pocos miembros, es aconsejable utilizar el primer método, pero si la población tiene muchos miembros, es preferible una selección aleatoria por computadora.
Ventajas del muestreo aleatorio simple:
Una de las mejores cosas del muestreo aleatorio simple es la facilidad para armar la muestra. También se considera una forma justa de seleccionar una muestra a partir de una población, ya que cada miembro tiene igualdad de oportunidades de ser seleccionado.
Otra característica clave del muestreo aleatorio simple es la representatividad de la población. En teoría, lo único que puede poner en peligro su representatividad es la suerte. Si la muestra no es representativa de la población, la variación aleatoria es denominada error de muestreo.
Para sacar conclusiones de los resultados de un estudio son importantes una selección aleatoria imparcial y una muestra representativa. Recuerda que uno de los objetivos de la investigación es sacar conclusiones con relación a la población a partir de los resultados de una muestra. Debido a la representatividad de una muestra obtenida mediante un muestreo aleatorio simple, es razonable hacer generalizaciones a partir de los resultados de la muestra con respecto a la población.
Desventajas del muestreo aleatorio simple:
Una de las limitaciones más evidentes del muestreo aleatorio simple es la necesidad de una lista completa de todos los miembros de la población. Debes tener en cuenta que la lista de la población debe estar completa y actualizada. Esta lista generalmente no está disponible en poblaciones grandes. En estos casos, es más prudente utilizar otras técnicas de muestreo.
3.2 MUESTREO AL AZAR
El concepto básico de todo muestreo es el de la muestra al azar. Una muestra de objetos de una población se llama al azar cuando todos los miembros de la población tienen igual oportunidad de aparecer en la muestra. Es muy importante insistir en que esto es igualmente válido para todos los miembros de la población, tanto para los raros como para los típicos.
Por ejemplo, el plegonero (Merlangus merlangus) desembarcado por un solo barco en Lowestoft suele tener (aquí supondremos que siempre) una composición de longitudes suavemente unimodal, con la moda normalmente entre 28 y 30 cm, pero alguna vez, por ejemplo, una entre 30, llega a ser hasta de 35 cm. Por lo tanto, si tomamos una muestra al azar de plegonero de cada barco, una vez de cada 30, por término medio, tendrá una moda de 35 cm o más, aunque normalmente estará entre 28 y 30 cm. Si entonces un biólogo pesquero, apoyándose en una sola muestra, obtiene una moda de 35 cm, esta desviación de la media de 29 cm no significará necesariamente una muestra que no sea al azar, puesto que se puede dar este caso una vez de cada 30; pero se puede comprobar tomando más muestras, por ejemplo tres muestras, que sólo tendrán juntas una moda superior a 35 cm una vez entre 27.000.
Números al azar:
Un procedimiento muy útil y de amplia aplicación para tomar muestras al azar consiste en utilizar números al azar, tal como se describe en la mayor parte de los libros de estadística. A cada individuo de la población de la cual se quiere extraer una muestra se le atribuye un número, y los que se tomen como muestra estarán determinados por la tabla de números al azar.
Por ejemplo, si se quieren elegir 5 individuos entre 100, como una muestra, y los 5 primeros números de la tabla son 3, 47, 43, 73 y 86, se tomarán los individuos correspondientes a estos números. Cuando la cantidad de individuos no sea exactamente 100 (o 1.000, etc.) saldrán números que no correspondan a ningún individuo, y no se tendrán en cuenta. Esta pérdida de tiempo puede ser reducida atribuyendo a cada individuo dos o más números, con tal de que todos tengan igual cantidad de números. Supongamos, por ejemplo, que se quieren tomar 5 unidades de una población de 24; en este caso, a cada individuo se le adscriben cuatro números; así la primera unidad tendrá, por ejemplo, los números 01 al 04, etc., la 24 tendrá 93-96, con lo que quedarán sólo cuatro números, 97-100, sin utilizar. Los individuos sometidos al muestreo, que corresponden a la serie previa de 5 números al azar, serían entonces los números 1, 12, 11, 16 y 22 (si uno de los números al azar es 97 o más, se descarta y se toma otro).
En lugar de escoger todas las unidades en la muestra individualmente de la tabla de números al azar, las unidades se pueden tomar a intervalos regulares, por ejemplo, cada 5 o 100 individuos, y solamente el primero elegido utilizando los números al azar. En el primer ejemplo, la muestra era de 1/20 de la población, de modo que el intervalo de la muestra será 20 y como el primer número elegido al azar era el 3, los siguientes serían 23, 43, 63 y 83. Este sistema es peligroso si en la población hay una periodicidad natural equivalente al intervalo elegido; por ejemplo, en el caso de someter a muestreo los desembarcos totales en un puerto, no se debe anotar la captura cada 7 o 14 días, puesto que pudiera haber grandes variaciones sistemáticas asociadas a los distintos días de la semana.
Ejemplo
En un determinado lugar se efectúan los desembarcos de pesca durante todo el año. Se desea determinar la cantidad total anual desembarcada, mediante el muestreo de la captura en 30 días del año. Determínense los días en que se debe efectuar el muestreo por medio de números al azar:
a)directamente por medio de una serie de números al azar del 000 al 999, y numerando los días del año de 1 a 365;
b)dando a cada día 2 números, desde el 1 y 2 al 729 y 730;
c) dando a cada día 27 números, de 1-27 a 9.829-9.855, y usando números al azar de 0000 a 9999;
d) haciendo un muestreo cada 12 días a partir de un día elegido al azar entre los 1-12 días primeros (algunas muestras podrán tener 31 días).
Si no se usan números al azar, o cualquier otro proceso similar, entonces lo más probable es que no todos los individuos de la población tengan igual oportunidad de salir en la muestra. Caso de haber alguna correlación entre la cantidad que se va a medir y la probabilidad de que aparezca en la muestra, el resultado podría estar sesgado, quizás demasiado. Por ejemplo, al hacer el muestreo de la captura procedente de un barco en una lonja abarrotada de peces, muchas veces se hace necesario trabajar con las cajas que se desembarcan primero.
Dado que en éstas vendrán los peces últimamente capturados, si es que se pretende conocer la frescura media obtendremos una estimación muy sesgada; en cambio, lo más probable es que sus tamaños sean similares a los de los peces capturados anteriormente, de modo que la muestra dará estimaciones sin sesgo de la talla media. Nunca debe darse rápidamente por supuesto que no existen sesgos, y la posibilidad de su existencia debe investigarse cuidadosamente. En el ejemplo anterior existiría cierto sesgo si los barcos acostumbran hacer una última calada cerca ya del puerto, donde el tamaño medio de los peces se desvía del tamaño medio general. Estas y otras fuentes de posibles sesgos solamente pueden encontrarse y eliminarse si se tiene un completo conocimiento de la pesquería.
Cómo se capturan los peces, cómo se manipulan a bordo y qué distribución sufren en el mercado.
La precisión de las estimaciones que se obtienen por verdaderos muestreos al azar puede ser determinada rápidamente. Si se está efectuando el muestreo de una población para conocer alguna de sus características (como el número de vértebras), cuya media en la población es M y la variancia S2, y se toma al azar una muestra de n individuos, cuyos valores son xi...xn, la estimación de la media de la población.
Ejemplo 2
a) Suponiendo que la media y la variancia de los datos en el Ejemplo 1.2.1 están próximos a los valores de la población, calcúlese la variancia en la estimación de la longitud media a partir de las muestras de 5, 20, y 100 peces;
b) mediante el empleo de números al azar, o por cualquier otro método, tómense 20 muestras al azar de 5 peces de los 449 del Ejemplo 1.2.1. Calcúlese la longitud media de cada una de estas muestras; calcúlese la variancia de estos 20 valores, y compárese con la variancia esperada tal como se calculó en (a). (Nótese cómo la variancia calculada a partir de una serie de números no mayor de 20 está sujeta a cierta variabilidad);
3.3 MUESTREO SIMPLE, DOBLE, MÚLTIPLE.
Bajo esta clasificación, hay tres tipos comunes de métodos de muestreo. Estos son, muestreo simple, doble y múltiple.
Muestreo simple:
Este tipo de muestreo toma solamente una muestra de una población dada para el propósito de inferencia estadística. Puesto que solamente una muestra es tomada, el tamaño de muestra debe ser lo suficientemente grande para extraer una conclusión. Una muestra grande muchas veces cuesta demasiado dinero y tiempo.
Muestreo doble:
Bajo este tipo de muestreo, cuando el resultado del estudio de la primera muestra no es decisivo, una segunda muestra es extraída de la misma población. Las dos muestras son combinadas para analizar los resultados. Este método permite a una persona principiar con una muestra relativamente pequeña para ahorrar costos y tiempo. Si la primera muestra arroja una resultado definitivo, la segunda muestra puede no necesitarse.
Por ejemplo, al probar la calidad de un lote de productos manufacturados, si la primera muestra arroja una calidad muy alta, el lote es aceptado; si arroja una calidad muy pobre, el lote es rechazado. Solamente si la primera muestra arroja una calidad intermedia, será requerirá la segunda muestra. Un plan típico de muestreo doble puede ser obtenido de la Military Standard Sampling Procedures and Tables for Inspection by Attributes, publicada por el Departamento de Defensa y también usado por muchas industrias privadas.
Al probar la calidad de un lote consistente de 3,000 unidades manufacturadas, cuando el número de defectos encontrados en la primera muestra de 80 unidades es de 5 o menos, el lote es considerado bueno y es aceptado; si el número de defectos es 9 o más, el lote es considerado pobre y es rechazado; si el número está entre 5 y 9, no puede llegarse a una decisión y una segunda muestra de 80 unidades es extraída del lote. Si el número de defectos en las dos muestras combinadas (incluyendo 80 + 80 = 160 unidades) es 12 o menos, el lote es aceptado si el número combinado es 13 o más, el lote es rechazado.
Muestreo múltiple:
El procedimiento bajo este método es similar al expuesto en el muestreo doble, excepto que el número de muestras sucesivas requerido para llegar a una decisión es más de dos muestras.
Métodos de muestreo clasificados de acuerdo con las maneras usadas en seleccionar los elementos de una muestra.
Los elementos de una muestra pueden ser seleccionados de dos maneras diferentes:
a. Basados en el juicio de una persona.
b. Selección aleatoria (al azar).
Métodos de selección de muestras:
Una muestra debe ser representativa si va a ser usada para estimar las características de la población.
Los métodos para seleccionar una muestra representativa son numerosos, dependiendo del tiempo, dinero y habilidad disponibles para tomar una muestra y la naturaleza de los elementos individuales de la población.
Por lo tanto, se requiere un gran volumen para incluir todos los tipos de métodos de muestreo.
1. El número de muestras tomadas de una población dada para un estudio.
2.La manera usada en seleccionar los elementos incluidos en la muestra.
Métodos de muestreo clasificados de acuerdo con el número de muestras tomadas de una población. Bajo esta clasificación, hay tres tipos comunes de métodos de muestreo, estos son, muestreo simple, doble y múltiple.
Muestreo de juicio:
Una muestra es llamada muestra de juicio cuando sus elementos son seleccionados mediante juicio personal. La persona que selecciona los elementos de la muestra, usualmente es un experto en la medida dada. Una muestra de juicio es llamada una muestra probabilística, puesto que este método está basado en los puntos de vista subjetivos de una persona y la teoría de la probabilidad no puede ser empleada para medir el error de muestreo, Las principales ventajas de una muestra de juicio son la facilidad de obtenerla y que el costo usualmente es bajo.
Muestreo aleatorio:
Consideremos una población finita, de la que deseamos extraer una muestra. Cuando el proceso de extracción es tal que garantiza a cada uno de los elementos de la población la misma oportunidad de ser incluidos en dicha muestra, denominamos al proceso de selección muestreo aleatorio.
El muestreo aleatorio se puede plantear bajo dos puntos de vista:
•Sin reposición de los elementos;
•Con reposición.
Muestreo aleatorio sin reposición:
Consideremos una población E formada por N elementos. Si observamos un elemento particular, e € E, en un muestreo aleatorio sin reposición se da la siguiente circunstancia:
•La probabilidad de que e sea elegido en primer lugar es 1/N ;
•Si no ha sido elegido en primer lugar (lo que ocurre con una probabilidad de (N-1)/N, la probabilidad de que sea elegido en el segundo intento es de 1/(N-1)
En el (i+1)-ésimo intento, la población consta de N-i elementos, con lo cual si e no ha sido seleccionado previamente, la probabilidad de que lo sea en este momento es de
1/(n-i)
.
Si consideramos una muestra de n<N elementos, donde el orden en la elección de los mismos tiene importancia, la probabilidad de elección de una muestra cualquiera es
Lo que corresponde en el sentido de la definición de probabilidad de Laplace a un caso posible entre las VN,n posibles n-uplas de N elementos de la población. Si el orden no interviene, la probabilidad de que una muestra.
Sea elegida es la suma de las probabilidades de elegir una cualquiera de sus n-uplas, tantas veces como permutaciones en el orden de sus elementos sea posible, es decir:
Muestreo aleatorio con reposición:
Sobre una población E de tamaño N podemos realizar extracciones de n elementos, pero de modo que cada vez el elemento extraído es repuesto al total de la población. De esta forma un elemento puede ser extraído varias veces. Si el orden en la extracción de la muestra interviene, la probabilidad de una cualquiera de ellas, formada por n elementos es:
Si el orden no interviene, la probabilidad de una muestra cualquiera, será la suma de la anterior, repitiéndola tantas veces como manera de combinar sus elementos sea posible. Es decir,
Sea n1 el número de veces que se repite cierto elemento e1 en la muestra;
Sea n2 el número de veces que se repite cierto elemento e2;
Sea nk el número de veces que se repite cierto elemento ek, de modo que n=n1+....+nk.
Entonces la probabilidad de obtener la muestra.
El muestreo aleatorio con reposición es también denominado muestreo aleatorio simple, que como hemos mencionado se caracteriza por que:
•Cada elemento de la población tiene la misma probabilidad de ser elegido
•Las observaciones se realizan con reemplazamiento.
De este modo, cada observación es realizada sobre la misma población (no disminuye con las extracciones sucesivas).
En una muestra aleatoria simple, cada observación tiene la distribución de probabilidad de la población: Además todas las observaciones de la v.a. son independientes.
Muestreo aleatorio simple (m.a.s.)
La inferencia estadística establece ciertos juicios después de examinar solamente una parte o muestra de ello. Así se prueba un pedazo de pastel para saber si ya está frío, el cocinero prueba la sopa para saber si necesita más sazón. El muestreo estadístico es semejante a cada uno de los anteriores, aunque sus métodos son más formales y precisos y generalmente incluyen una proporción de la probabilidad.
El muestreo y la probabilidad están unidos estrechamente constituyendo la Teoría de la Inferencia.
Es aquel en que cada elemento de la población tiene la misma probabilidad de ser seleccionado para integrar la muestra. Una muestra simple aleatoria es aquella en que sus elementos son seleccionados mediante el muestreo aleatorio simple.
En la práctica no nos interesa el individuo o elemento de la población seleccionado en general, sino solo una característica que mediremos u observaremos en él y cuyo valor será el valor de una variable aleatoria que en cada individuo o elemento de la población puede tomar un valor que será un elemento de cierto conjunto de valores. De modo que una muestra simple aleatoria se puede interpretar como un conjunto de valores de variables aleatorias independientes, cada una de las cuales tiene la misma distribución que es llamada distribución poblacional.
Existen dos formas de extraer una muestra de una población: con reposición y sin reposición.
Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del mismo tamaño tiene igual probabilidad de ser seleccionada de la población.
Un método simple para obtener una muestra aleatoria simple es primero escribir el nombre o un número codificado de cada elemento en la población sobre una tarjeta. Las tarjetas son colocadas en una caja. Una muestra entonces extraída de la caja después de que las tarjetas han sido perfectamente mezcladas. Por conveniencia este método puede ser reemplazado por una tabla de números aleatorios, tales como los que se muestran adelante.
La tabla se construye extrayendo cada uno de los dígitos del 0 al 9 sobre una base de “igualmente probables”; es decir, cada uno de los 10 dígitos tienen la misma probabilidad (1/10) de ser seleccionados.
Los 10 dígitos son escritos en tarjetas separadas y son mezclados en una caja. Una tarjeta es extraída y se registra el dígito que aparece en la tarjeta. Una segunda tarjeta es extraída después de que la primera tarjeta ha sido regresada a la caja los10 dígitos en la caja son de nuevo mezclados perfectamente. Cuando se han registrado 5 dígitos, el siguiente dígito se registra en un grupo separado hasta que se obtiene un gran número de grupos.
Obtener una muestra aleatoria simple no es una tarea fácil o práctica bajo muchas circunstancias. Puede ser una tarea tardada o costosa y algunas veces es teóricamente imposible.
Cuando la población es infinita, es obvio que la tarea de numerar cada elemento de la población es imposible.
Llamamos muestreo aleatorio simple al que se utiliza con reemplazamiento, consistente en seleccionar n elementos de entre N que componen la población, de tal forma que todas las muestras de tamaño n que se puedan formar tengan la misma probabilidad de salir elegidas y las mismas sean independientes, en el caso de que N sea grande no es preocupante que se haga sin reemplazamiento, ya que por ejemplo 1/N no difiere mucho de 1/N-1. Esta probabilidad es: p = n/N
En la práctica equivale a numerar la población objeto de estudio, sacando al azar cada uno de los números que van a formar la muestra y aunque en la práctica, a pesar de ser el muestro con reemplazamiento, si el elemento (caso de que sea un individuo para hacer un test u otro caso similar) pueda volver a ser elegido este se desprecia ya que no tiene sentido entrevistar al mismo en más de una ocasión y es por este consenso que se tiende a confundir y expresar que el muestreo aleatorio simple tiene como condición que se hace sin reemplazamiento.
Para llevar a cabo esta labor varios procedimientos como el del bombo, consistente en introducir tantas bolas como elementos tenga la población en un bombo y elegir tantas bolas como elementos tenga la muestra.
Este procedimiento además de ser muy laborioso puede inducir a error debido a defectos de las bolas, al bombo o a cualquier otro factor, por lo que es preciso sustituirlo por otro mucho más aleatorio.
El procedimiento más utilizado es el de las tablas de números aleatorios que consiste en seleccionar en una tabla de números en grupos de cuatro dígitos formando filas y columnas; estas se encuentran en muchos libros de Estadística sobre todo, los que tienen como capítulo La Teoría del Muestreo.
Obtención de una muestra aleatoria:
Si una población es infinita, anotando los elementos en el orden en que ocurren, es posible obtener una muestra que sea representativa del proceso (muestra aleatoria). En tanto que el proceso en consideración se mantienen estable durante el período en el que se hacen las observaciones (de manera que la probabilidad de cada resultado posible permanece constante), es posible considerar el proceso y la muestra resultante como aleatorias. Así es exactamente como se considerar las tiradas sucesivas de una moneda normal y las de dados no cargados.
Si la población objetiva es finita, esencialmente hay dos formas de seleccionar una muestra aleatoria simple. Un método consiste en elaborar una lista, o “marco de referencia” de cada uno de los elementos de la población, y aplicar después un método aleatorio a la lista, para seleccionar los elementos que se habrán de muestrear. El segundo método se utiliza cuando los objetos que forman la población no se identifican claramente, lo que imposibilita un listado.
Método de selección en el Muestreo Aleatorio Simple:
Un procedimiento de extraer una muestra aleatoria de una población finita es el de enumerar todos los elementos que conforman la población, escribir esos números en bolas o papelitos echarlos en un bombo o bolsa mezclarlos bien removiéndolos y sacar uno a uno tantos como lo indique el tamaño de la muestra. En este caso los elementos de la muestra lo constituirán los elementos de la población cuyos números coincidan con los extraídos de la bolsa o bombo.
Otro procedimiento para obtener una muestra de una población ya sea el muestreo con remplazo o sin reemplazo es mediante la utilización de la tabla de números aleatorios pero solamente para poblaciones finitas, la utilización de estas tablas puede realizarse de diferentes modos pero en el presente trabajo solo expondremos el que consideramos más eficiente ya que no se necesita de la búsqueda de una gran cantidad innecesaria de números aleatorios en la tabla, el cual será ejemplificado.
Existen diferentes tablas de números aleatorios nosotros en nuestro trabajo utilizaremos como referencia la tabla de M. G. Kendall y B. Babington Smith que se encuentra en el texto de tablas estadísticas, la misma está constituida por 4 bloques de 1000 números aleatorios dispuestos en 25 filas y 40 columnas.
Veamos cómo se procede para la utilización de la tabla. Consideremos que se desea extraer de una población de tamaño N una muestra de tamaño n se selecciona el bloque, la fila y la columna de la tabla que se va a comenzar, a partir de esta selección (que la hace el muestrista) se toman tantas columnas como dígitos tiene N.
Comenzando por el primer número de las columnas seleccionadas se irán incluyendo en la muestra aquellos individuos que en la lista de la población ( ya sea de forma horizontal o vertical) ocupa la posición de los n números de las columnas seleccionadas que resultan menores que N, en los caso que al seleccionar un número en la tabla de números aleatorios sea mayor que N se divide este por N y el resto de la división que será un número entre 0 y N-1 será la posición del individuo a seleccionar tomando el convenio de que el resto 0 corresponde a la posición N. Para la aplicación de este procedimiento requiere que se fije previamente el mayor múltiplo de N que se considerará, para así garantizar que todos los restos desde 0 a N -1 tengan la misma probabilidad de ser seleccionados, por ejemplo si N = 150 y tomando 3 columnas se consideraran sólo aquellos números menores o iguales que 900, los números mayores que 900 no serán analizados en la selección de la muestra.
Ejemplo 1.1:
Dada la siguiente población formada por la edad del hijo mayor de 200 núcleos familiares de una cierta región.
Seleccione una muestra aleatoria de tamaño 10 (use la tabla de números aleatorios, escoja la tercera fila, tercera columna del segundo bloque de a 1000) numere la población horizontalmente.
Para extraer la muestra lo primero que hacemos es disponer tres columnas en las cuales la primera se ubicara los números aleatorios, es decir los números extraídos de la tabla de números aleatorios; en la segunda columna pondremos:
Los números aleatorios rectificados que serán aquellos números aleatorios menores que N =200 y los restos de las divisiones de los números aleatorios mayores que N =200 y menores que el mayor múltiplo de N es decir 800 y en la tercera columna de encontrar los valores de la muestra.
En la tabla de números aleatorios la tercera fila, tercera columna del segundo bloque de a 1000 le corresponde al número 3 pero como tenemos que coger el número aleatorio de tres dígitos el primer número aleatorio sería el 017, los demás serian, 984, 955, 130, 850, 374, 665, 910, 288, 753, 765, 691, 496, 001, hemos escogido 14 números de la tabla de números aleatorios debido a que hay 4 que son mayores que 800.
Veamos a continuación como extraemos la muestra de la población:
Para el primer número aleatorio 017 se busca en la población el valor que ocupa la posición 017 leída la población horizontalmente que sería la edad de 48 años, el número aleatorio 984 no se contempla dentro del análisis ya que es mayor que 800, al igual que el número 955, el número 130, le corresponde la edad de 52 años, al número 850 no se contempla dentro del análisis, el 374 como es mayor que 200 se divide por 200 y se obtiene reto 174 y este es el número aleatorio rectificado correspondiéndole la edad de 53 años, al número 665 se divide por 200 y se obtiene resto 65 que es el número aleatorio rectificado correspondiéndole la edad de 44 años en la población, a continuación presentaremos la tabla de las tres columnas a la cual nos referimos anteriormente como una vía fácil y práctica para obtener la muestra deseada.
3.4 MUESTREO DE ACEPTACIÓN, POR LOTE, AQL, NIVELES DE INSPECCIÓN, MANEJO DE TABLAS MIL-STD (MILITAR ESTÁNDAR).
3.5 MUESTREO ESTRATIFICADO.
El muestreo estratificado es una técnica de muestreo probabilístico en donde el investigador divide a toda la población en diferentes subgrupos o estratos.
Luego, selecciona aleatoriamente a los sujetos finales de los diferentes estratos en forma proporcional. Es importante tener en cuenta que los estratos no deben superponerse. Que los subgrupos se superpongan dará a algunos individuos mayores probabilidades de ser seleccionados como sujetos. Esto niega completamente el concepto de muestreo estratificado como un tipo de muestreo probabilístico.
Igualmente importante es el hecho de que el investigador debe utilizar un muestreo probabilístico simple dentro de los diferentes estratos.
Los estratos más comunes utilizados en el muestreo aleatorio estratificado son la edad, el género, el nivel socioeconómico, la religión, la nacionalidad y el nivel de estudios alcanzado.
Muestreo aleatorio estratificado: usos
•Se utiliza el muestreo aleatorio estratificado cuando el investigador desea resaltar un subgrupo específico dentro de la población. Esta técnica es útil en tales investigaciones porque garantiza la presencia del subgrupo clave dentro de la muestra.
•Los investigadores también emplean un muestreo aleatorio estratificado cuando quieren observar relaciones entre dos o más subgrupos. Con la técnica de muestreo aleatorio simple, el investigador no está seguro de si los subgrupos que quiere observar son representados equitativa y proporcionalmente dentro de la muestra.
• Con el muestreo estratificado, el investigador puede probar de forma representativa hasta a los subgrupos más pequeños y más inaccesibles de la población. Esto permite que los investigadores prueben a los extremos de la población.
•Con esta técnica, tienes una precisión estadística más elevada en comparación con el muestreo aleatorio simple. Esto se debe a que la variabilidad dentro de los subgrupos es menor en comparación con las variaciones cuando se trata de toda la población.
Debido a que esta técnica tiene una alta precisión estadística, exige un tamaño de la muestra menor que puede ahorrar mucho tiempo, dinero y esfuerzo de los investigadores.
Muestreo estratificado: tipos
Muestreo aleatorio estratificado proporcionado:
En esta técnica, el tamaño de la muestra de cada estrato es proporcional al tamaño de la población del estrato si se compara con la población total. Esto significa que el cada estrato tiene la misma fracción de muestreo.
Supongamos que tienes 3 estratos con 100, 200 y 300 tamaños de la población, respectivamente. El investigador eligió una fracción de muestreo de ½. Luego, el investigador debe probar al azar 50, 100 y 150 sujetos de cada estrato, respectivamente.
En esta técnica, lo importante es recordar el uso de la misma fracción de muestreo en cada estrato, independientemente de las diferencias en el tamaño de la población de los estratos. Es muy parecido a reunir una población más pequeña que sea específica de las proporciones relativas de los subgrupos dentro de la población.
Muestreo aleatorio estratificado desproporcionado:
La única diferencia entre el muestreo aleatorio estratificado proporcionado y el desproporcionado son sus fracciones de muestreo. En el muestreo desproporcionado, los diferentes estratos tienen diferentes fracciones de muestreo.
La precisión de este diseño es altamente dependiente de la asignación de fracción de muestreo del investigador. Si el investigador comete errores en la asignación de fracciones de muestreo, un estrato puede ser representado en exceso o insuficientemente y dará resultados sesgados.
El muestreo desproporcionado constituye una técnica de muestreo probabilístico utilizada para abordar las dificultades que deben enfrentar los investigadores con las muestras estratificadas de tamaños desiguales.
Este método de muestreo divide a la población en subgrupos o estratos y emplea una fracción de muestreo que no es similar para todos los estratos; se realiza un sobre muestreo sobre algunos estratos con respecto a otros.
Muestreo desproporcionado versus Muestreo proporcionado:
La gran diferencia entre las dos técnicas de muestreo es la proporción dada a cada estrato con respecto a los demás. En el muestreo proporcionado, cada estrato tiene la misma fracción de muestreo, mientras que en el muestreo desproporcionado la fracción de muestreo de cada estrato varía.
Cuándo utilizar el muestreo desproporcionado
El muestreo desproporcionado permite que el investigador brinde una representación más grande a uno o más sub grupos para evitar la falta de representación de dichos estratos. Esto se aplica a poblaciones con una proporción de población de estratos muy alta.
Desventajas del muestreo desproporcionado
Si bien el investigador puede crear una representación y un tamaño adecuado con esta técnica, existen problemas en el análisis de datos, ya que la característica del grupo sobrerrepresentado puede sesgar los resultados. La manera de evitar esto es dar una representación matemática proporcionalmente mayor al grupo insuficientemente representado en el análisis de las puntuaciones.
Generalmente, la muestra desproporcionada tiende a ser menos precisa y fiable en comparación con una muestra estratificada porque se realizan los ajustes matemáticos durante el análisis de los datos. Este proceso aumenta la posibilidad de encontrar errores en el análisis de datos. Con esta posibilidad de encontrar errores en el análisis, es menos precisa la elaboración de conclusiones a partir de los resultados de dichos estudios.
Las funciones van agrupadas en tabuladores que se activan o desaparecen, en función de la norma disponible o de los permisos concedidos.