lunes, 3 de junio de 2013

Distribución Normal




La gráfica de la distribución Normal, se suele llamar "Campana de Gauss", en honor a su descubridor, y por la forma que tiene.

Es una gráfica simétrica, cuyos parámetros son la media, y la desviación típica.

Su importancia en la inferencia estadística es fundamental. Ello se debe a que muchos fenómenos de la vida real pueden ser modelados por esta distribución.

También es considerada una de las distribuciones más importantes y utilizadas, porque muchas otras distribuciones , como por ejemplo la distribución Binomial, o la distribución de Poisson, se pueden aproximar por la distribución Normal.
Por supuesto que para realizar las aproximaciones deben cumplirse ciertas requisitos.

Cuando la media vale cero, y la varianza vale uno, se dice que estamos ante la distribución Normal estandarizada, o tipificada.

Al variar los valores de los parámetros  ( media y desviación típica o varianza) la forma de la distribución cambia.sí es como puede quedar más alta, más baja, más aplastada, o más "estirada".


jueves, 23 de mayo de 2013

Distribuciòn Normal-Propiedades



La distribución  de probabilidad Normal tiene como gráfica la "Campana de Gauss".

El área debajo de la campana representa la probabilidad.

O sea que al calcular áreas, se están calculando probabilidades.
O dicho de otra manera: para calcular probabilidades, hay que calcular el valor del área bajo la curva.

Toda el área comprendida entre el eje OX  y la curva  representa el 100% de la probabilidad, o sea que el área debajo de la campana vale 1 (uno).

Recordemos que la gráfica es simétrica, centrada en el valor de la media de la distribución.
Los parámetros de la distribución Normal son su media y su desviación típica.
En este caso es una gráfica correspondiente a una distribución Normal con media igual a cero y desviación típica igual a uno.
Lo que se llama una distribución Normal estandarizada.

El gráfico que adjuntamos es una curva Normal centrada en cero, o sea su media en este caso es cero, y con desviación típica igual a uno.

Una propiedad interesante de la distribución Normal, es que el 68% de la probabilidad se acumula entre 1 y -1 desviaciones típicas. 

El 98% de la probabilidad se acumula entre 2 y -2 desviaciones típicas.

Y entre 3 y -3 se acumula practicamente toda el área . El 100%.

Hay tablas con los valores calculados de las probabilidades correspondientes a esos valores.

martes, 14 de mayo de 2013

Prueba de Hipótesis-Proporciones

Cuando realizamos una prueba de Hipòtesis para testar una proporción poblacional, lo más usual es utilizar la distribución de probabilidad Normal.

Si estamos trabajando con una muestra, obtenemos la proporción muestral, que nos servirá para calcular el estadístico de prueba, que en este caso será:






Este estadístico de prueba contiene la proporción muestral, que se suele llamar "p gorro" por el circunflejo que tiene sobre la "p".
También contiene la proporción poblacional, que se suele escribir con mayúscula.

Luego incorpora  el tamaño de muestra "n" y la letra "Q".

Recordemos que las proporciones vienen de una distribución Binomial, donde "P" significa "éxito" y "Q" significa "fracaso".
Luego siempre "P" mas "Q" deben sumar uno (1).
Siempre que tengamos que realizar una prueba de hipótesis sobre proporciones , con un solo grupo de datos, el estadístico de prueba a utilizar será el indicado más arriba.
S

lunes, 6 de mayo de 2013

Prueba de Hipótesis-Procedimiento

El procedimiento para realizar una prueba de hipótesis tiene 5 pasos:

1) Plantear las Hipótesis.
Hay 2 hipótesis: la hipótesis nula, llamada Ho  y la hipótesis alternativa llamada H1
Las hipótesis siempre se refieren a los parámetros poblacionales. Por ejemplo, si la prueba de hipótesis se refiere a medias, debemos colocar los valores de la media poblacional , y no los valores de la media muestral.

Porque nosotros lo que queremos averiguar, o probar son los valores de los parámetro poblacionales, basándonos en valores tomados de una muestra,

2) Distribución de Probabilidad y Regiones de rechazo.
Debemos determinar la distribución de probabilidad a utilizar.
Aquì es donde se determina si utilizamos la distribución Normal (Z) o la distribución de Student (t), siempre que estemos trabajando una prueba de hipótesis para la media poblacional.
Si lo que queremos probar es el valor de una varianza poblacional, la distribución de probabilidad a utilizar será, la distribución de Fischer (F).

Y en otros casos podremos también tener que decidir si utilizamos la distribución Chi cuadrado.

En este paso se decide también si la prueba de hipótesis es a una rama (derecha o izquierda) o si se realiza a dos ramas.

3)Estadístico de Prueba.
 Luego de tener presente cual es la distribución de probabilidad a utilizar, calcularemos el estadístico de prueba.
El estadístico de prueba debe ser coherente  con la distribución  de probabilidad elegida.

Si estamos testando valores de la media poblacional con la distribución "Z" el estadístico a utilizar será:



Si estamos realizando una prueba de hipótesis para la media poblacional, y la distribución de probabilidad utilizada en el paso anterior fue la distribución "T" entonces el estadístico a utilizar  ahora será:


Observemos la similitud de las fórmulas: ambas tienen la media muestral, la media poblacional, y el tamaño de muestra. La diferencia radica en la desviación típica poblacional y la desviación típica  muestral.

Cuando trabajamos con la distribución  "Z" conocemos la desviación típica poblacional.
Cuando trabajamos con la distribución "T" conocemos la desviación típica muestral.

4)Decisión.
En este paso es donde observamos si el estadístico de prueba cae en la región de rechazo o en la región de aceptación.
Siempre lo  que  se rechaza o no se rechaza es la hipótesis nula, la Ho

5) Conclusión.
Y en último paso indicamos la conclusión a la que llegamos al rechazar la hipótesis nula, o no rechazarla.


sábado, 20 de abril de 2013

Prueba de Hipòtesis para la media poblacional

Prueba de Hipótesis para la media poblacional.

Si tenemos un solo grupo de datos, una muestra, para realizar la prueba de hipótesis de la media poblacional  podemos utilizar la distribución (Z) Normal o la distribución "t" de Student.

Para ello debemos ver el tamaño de muestra.
Si la muestra es grande ( mayor que 30) utilizamos la distribución Normal.
Si la muestra es pequeña ( menor a 30 ) , pero proviene de una población con distribución Normal, también utilizaremos la distribución Normal.

Nos basamos en el Teorema Central del Limite.

Y si la muestra es pequeña (menor a 30) y proviene de una distribución desconocida utilizaremos la distribución "t" de Student.

Pero podríamos conocer la varianza poblacional, en ese caso también utilizaremos para realizar la inferencia , la distribuciòn Normal.

Se utilizan los mismos criterios que para los Intervalos de Confianza.

viernes, 12 de abril de 2013

Prueba de Hipòtesis

La Prueba de Hipòtesis es una de los procedimientos que tiene la estadìstica inferencial para la estimaciòn de paràmetros.

Recordemos que la estimaciòn nunca es exacta, siempre va acompañada de cierto margen de error.

El error se mide en tèrminos de probabilidad.

Los otros procedimientos para realizar inferencias son los intervalos de confianza,y la estimaciòn puntual.

La estimaciòn puntual no es muy utilizada. Los intervalos de confianza se realizan tanto para medias comopara proporciones.

Las pruebas de hipòtesis tambièn pueden realizarse para medias o para proporciones, incluso hay pruebas de hipòtesis para diferencias de medias, para diferencias de proporciones, para datos pareados o relacionados, para datos pertenecientes a grupos independientes.

Incluso hay pruebas de hipòtesis para probar la igualdad de las varianzas poblacionales.

Cada prueba de hipòtesis requiere del uso de una distribuciòn de probabilidad adecuada.

A veces se utiliza la distribuciòn Normal, otras veces se utiliza la distribuciòn "t", en otros casos se utiliza Chi cuadrado, o tambièn la distribuciòn de Fischer.

De todas estas cuestiones nos iremos ocupando en sucesivos post.

jueves, 14 de marzo de 2013

Diagrama de caja

El diagrama de caja, es un gráfico que se construye con los datos de la mediana, y el primer y tercer cuartil.
Una vez que tengamos calculados esos estadísticos para los datos del ejercicio en cuestión, se procede a realizar una "caja" que tiene por lados los valores del primer y tercer cuartil.

Ademas se realiza el cálculo del rango intercuartílico, y se multiplica por 1,5  para así obtener las "barreras interiores".

Multiplicando el rango intercuartílico por 3, se obtienen las "barreras exteriores".

Cualquier dato que caiga fuera de las barreras interiores, se dirá que es un dato atípico.
Cualquier dato que caiga fuera de las barreras exteriores, se dirá que es un dato atípico extremo.

domingo, 16 de septiembre de 2012

Clasificar Variables

Clasificar las siguientes variables en cualitativas (nominales y ordinales) o cuantitativas (discretas y contínuas).

1) Rendimiento escolar de jóvenes de 18 a 25 años.
2) Litros de leche adquiridos por un comedor estudiantil.
3) Niveles de glucosa en diabéticos.
4) Número de empleados en un laboratorio.
5) Consumo de electricidad de 20 computadoras conectadas a internet.

martes, 1 de mayo de 2012

Teorema Central del Límite

El Teorema Central del Límite es aquél que nos permite realizar inferencias con la distribución Normal, cuando el tamaño de muestra es mayor o  igual a 30.

Nos habla de la distribución que tiene la media muestral.

Si tenemos una población con distribución de probabilidad Normal, todas las muestras extraidas de esa población también tendrán distribución Normal. Y por lo tanto la distribución de las medias muestrales será Normal.

Si tenemos una población con distribución de probabilidad desconocida, todas las muestras extraidas de esa población, si son de tamaño mayor o igual a 30, también tendrán distribución Normal.

Si tenemos una población con distribución de probabilidad desconocida, las muestras tomadas de esa población que sean de tamaño menor a 30, no tendrán distribución Normal.

Tendremos que utilizar la distribución "T" de Student.

domingo, 15 de abril de 2012

Distribución "T" de STUDENT

La Distribución de Student, se utiliza cuando el tamaño de muestra es pequeño.
Se entiende tamaño muestral pequeño cuando es menor a 30.

Algunas propiedades de la distribución son:

1)Es una distribución contínua
2)Tiene forma de campana y es simétrica.
3) Hay una familia de distibuciones "T".
4) Todas tienen media igual a cero.
5) Sus desviaciones estándares difieren de acuerdo con el tamaño de muestra "n".
6) La forma de la distribución "T" es más extendida que la forma de la distribución Normal "Z".
7) A medida que aumenta "n" (el tamaño de muestra ) la distribución "T" se parece más a la distribución "Z".
8) La distribución "T" tiene grados de libertad, que son "n-1".
 
UA-5138250