lunes, 3 de junio de 2013

ANÁLISIS DE VARIANZA (ANOVA)

ANÁLISIS DE VARIANZA ANOVA


En estadística se denomina prueba F de Snedecor a cualquier prueba en la que el estadístico utilizado sigue una distribución F si la hipótesis nula no puede ser rechazada. El nombre fue acuñado en honor a Ronald Fisher.

En estadística aplicada se prueban muchas hipótesis mediante el test F, entre ellas:
La hipótesis de que las medidas de múltiples poblaciones normalmente distribuidas y con la misma desviación estándar son iguales. Esta es, quizás, la más conocida de las hipótesis verificada mediante el test F y el problema más simple del análisis de varianza.

La hipótesis de que las desviaciones estándar de dos poblaciones normalmente distribuidas son iguales, lo cual se cumple.


En muchos casos, el test F puede resolverse mediante un proceso directo. Se requieren dos modelos de regresión, uno de los cuales restringe uno o más de los coeficientes de regresión conforme a la hipótesis nula.

FORMULA:








n= numero de datos
v=grados de libertad
S2= varianza de la mestra
O2 =varianza del estudio

EJERCICIO:

Se toman 2 meses   de registros de temperatura de la cuidad de Bogotá en el año 2011; con una varianza de 0,585, cada muestra tienes 31 días:




































MUESTRA 1 DATOS
n 31
Media 14,825
Desv. típ. 0,943
Varianza 0,889
grado libertad             30
MUESTRA 2 DATOS
n 31
Media 15,485
Desv. típ. 1,027
Varianza 1,054
grado libertad 30

O2 = 0,585


F calculado = 0,9182

F teorico para grado de libertad 30/30

F(90%)= 1 ,606
F(95%)= 1,841



CONCLUSIONES:



  • La temática de probabilidad y estadística es muy necesaria para el analizáis de datos y problemáticas ambientales.

  • la temperatura media esta aumentando en 0,6°C en los últimos 10 años debido al calentamiento global y al efecto invernadero.

RECOMENDACIONES:
  • Disminuir la producción de gases de efecto invernadero.
  • utilizar energías renovables
  • reciclar y reutilizar
  • no contaminar el agua.
  • disminuir el uso de automóviles.






PRUEBA CHI CUADRADO

CHI CUADRADO



Es una distribución cuadrática de la probabilidad que utiliza básicamente variables aleatorias continuas. La Distribución Chi Cuadrado de la probabilidad se denota mediante la letra griega minúscula ji elevada al cuadrado (χ2), y consiste en establecer un espacio continuo delimitado por la suma de los cuadrados de n variables aleatorias que son independientes entre sí, espacio dentro del cual la variable X puede asumir cualquiera de los infinitos valores que lo conforman, y por tanto para establecer el valor aproximado de una variable X dentro de ese espacio se procede a incluir una estimación de sus posibles límites que están dados por los distintos «Grados de Libertad» que pueden existir entre las variables aleatorias analizadas que dan origen al referido espacio. En otras palabras, la Distribución Chi Cuadrado en un delimitado espacio conjuga un determinado número de variables aleatorias independientes entre sí, con unos valores de probabilidad ubicados entre 1 y 0 que son atribuibles a esas variables, y con unos límites de la probabilidad para el verdadero valor de X delimitados por los Grados de Libertad atribuibles a las variables aleatorias analizadas.



La Distribución Chi Cuadrado permite calcular la probabilidad existente para que una variable X, que tiene un determinado Grado de Libertad frente a otras variables del mismo conjunto, permanezca dentro de unos «límites ideales» previstos para X cuando tiene ese específico Grado de Libertad o independencia. En otras palabras, la Distribución Chi Cuadrado suministra un modelo ideal sobre los límites probables que deberían regir las fluctuaciones en la aparición de un determinado valor aleatorio X dependiendo del Grado de Libertad que tiene ese valor frente a otras variables similares dentro de un conjunto de datos analizados. La fórmula matemática para calcular la probabilidad de que una variable X permanezca dentro del límite ideal correspondiente al respectivo Grado de Libertad es la siguiente:

FORMULA


EJERCICIO:


Se sabe que la varianza de los registros del mes de octubre noviembre y diciembre del año 2011 es de 0,585 se toma un muestreo de 41 registros a partir de octubre de 2011 a diciembre de, y se encuentra una desviación típica de 0,658.

solución:

Datos:

desviación típica de la muestra s=  0,938
varianza de la muestra s2 =           0,88


desviación típica del estudio O =    0,7648
varianza del estudio O2 =              0,585


(n-1)grados de libertad = (41-1)=   40

 


X2 calculado=45,12



Xteórico 25%= 33, 7
Xteórico 50%= 39,3