viernes, 30 de octubre de 2009

Estadistica Descriptiva e Inferencial

La estadística descriptiva, describe la muestra.
La estadística inferencial, se ocupa de la población.
La población, es aquél conjunto grande, numeroso, del cual se quiere obtener información.
Por ser complicado, trabajar con un conjunto tan grande, es que se toman muestras.
Las muestras , son conjuntos pequeños, pero representativos de la población.
El puente, entre la estadística descriptiva, y la estadística inferencial, es la probabilidad.
De allí , su importancia en el estudio dentro de la Estadistica. 
Para pasar de la estadística descriptiva a la estadística inferencial se necesita de los modelos de probabilidad , y de los métodos de estimación.
Los métodos de estimación más usados, son los Intervalos de Confianza, y las Pruebas de Hipótesis.

jueves, 29 de octubre de 2009

Datos originales: cuartiles

Los datos a los que les calcularemos los cuartiles son:

2, 2, 4, 4, 8, 10

Para el cálculo del primer cuartil, usaremos dos fórmulas de posicionamiento.

Si el valor obtenido da con decimal , se aproxima al entero más cercano, mayor.
Luego se suman los valores de la variable, y se divide entre 2.



En este caso, buscamos los valores correspondientes a la posición 2, y 3.
Son los valores, 3 y 4.






Para el cálculo del tercer cuartil, hacemos lo mismo, buscamos dos lugares de posicionamiento
y si dan con decimal, se aproximan al entero mas cercano , menor.



En este caso, buscamos los valores de la variable, que ocupen el lugar 4 y 5.

O sea los valores 4 y 8.


Siempre se obtiene , un solo primer cuartil, y un solo tercer cuartil.

lunes, 26 de octubre de 2009

Datos sin agrupar: media moda mediana

Los datos sin agrupar, son los datos originales.
Como vienen dados de la encuesta que se realizó para obtenerlos.
En este post supondremos que la cantidad de datos es una cantidad par :


10, 2, 2, 4, 4, 8


Lo primero a realizar, es ordenarlos: 2, 2, 4, 4, 8, 10




Calcularemos la media:

El procedimiento es el mismo que si la cantidad de datos fuera impar.

Se suman todos los valores, y se divide entre la "n"










Para calcular la moda, o modo, se ve cual valor se repite más veces.
En este ejercicio, hay dos modas, el 2 y el 4 .
Se dice que la distribución es bimodal.


Para el cálculo de la mediana, utilizaremos dos fórmulas para los lugares de posicionamiento.








Buscamos los valores que ocupan el lugar 3, y el lugar 4 , que son respectivamente:4 y 4.

Luego se suman y se dividen entre 2.



jueves, 22 de octubre de 2009

Coeficiente de Variacion, Rango Intercuartílico

Otras medidas que componen el conjunto de medidas de posición, son el coeficiente de variación, que se expresa en porcentaje, y el rango intercuartílico.


Para el cálculo del coeficiente de variación, se debe calcular previamente, la desviacíon típica y la media.









Para el cálculo, del rango intercuartílico, se debe tener calculado previamente, el primer y el tercer cuartil.


Todos los cálculos anteriores se corresponden con el ejemplo que venimos desarrollando, en los post anteriores.

martes, 20 de octubre de 2009

Varianza, Desviación Típica:datos originales

La varianza y la desviación típica o estándar, constituyen parte de las medidas de dispersión.

Continuando con el ejemplo numérico, los valores de la variable a los que les aplicarmos las fórmulas son:

3, 3, 3, 4, 5, 8, 9, 9, 10

Para calcular la varianza utilizaremos la siguiente fórmula, que requiere del cálculo previo de la media ( que ya la tenemos calculada del post anterior) , recordemos que su valor era: 6



La desviación típica o estándar, es la raiz cuadrada de la varianza. Y es por eso que adquiere mayor relevancia, pues queda expresada en las unidades de la variable.









miércoles, 14 de octubre de 2009

Medidas de tendencia no central: datos originales

Continuaremos, con los números del ejemplo del post anterior:
3, 3, 3, 4, 5, 8, 9, 9, 10

Las medidas de tendencia no central, son los cuartiles, los deciles y los percentiles.
Los cuartiles, son los valores que dividen al conjunto de datos, en cuartos.

1) El primer cuartil, se localiza en el 25%, y se halla con la fórmula de posicionamiento:




Por lo tanto, el primer cuartil ocupa el lugar: 2,5. Este valor se redondea, por lo cual buscaremos el valor de la variable que ocupe el lugar 3. El primer cuartil es el valor 3. Aquí coincide, lugar de posicionamiento, y valor de la variable.





2) El tercer cuartil, se localiza en el 75% y se calcula con la fórmula de posicionamiento:

Ocupa el lugar: 7,5 este valor se redondea a lugar 7; así el valor de la variable que ocupa el lugar 7 es: 9

El tercer cuartil es 9.

El segundo cuartil, no se suele calcular, pues coincide con la mediana, ya que es el valor que acumula el 50%.



jueves, 8 de octubre de 2009

Medidas de Tendencia Central: datos originales.

Recordemos que las medidas de tendencia central son la media , la moda y la mediana.



Cuando los datos son originales, no vienen agrupados en distribuciones de frecuencias, son por ejemplo:

5 , 8 , 3 , 3 ,3 , 9 , 10, 4 ,9



1) Cálculo de la media: recordemos que es un promedio





2) Cálculo de la moda: es el valor de la variable que se repite más veces.


En este caso, es el número 3





Moda=3





3) Y para el cálculo de la mediana, primero se deben ordenar los valores de la variable, de menor a mayor:





3, 3, 3, 4, 5, 8, 9, 9, 10 y luego usaremos la fórmula de posicionamiento:













Ahora buscamos el valor de la variable, que ocupe el lugar 5

La mediana es : X=5

 
UA-5138250