pruebas hipotesis

Click here to load reader

Post on 13-Sep-2015

270 views

Category:

Documents

17 download

Embed Size (px)

DESCRIPTION

Pruebas o Contrastes Estadisticos

TRANSCRIPT

  • 69

    DEPARTAMENTO DE ESTADSTICA Y MATEMTICAS

    UNIDAD 3

    PRUEBAS DE HIPTESIS

    2.2. Dos muestras: Pruebas para diferencia de medias

    Se dispone de una muestra aleatoria de tamao n de una poblacin normal X que tiene

    media X y varianza 2

    X ; tambin se dispone de una muestra aleatoria de tamao m de

    una poblacin normal Y que tiene media Y y varianza 2

    Y . Queremos comparar las

    medias poblacionales. Para ello vamos a realizar las siguientes pruebas

    0 0 0 0 0 0

    0 0 0

    : : :

    1) 2) 3)

    : : :

    X Y X Y X Y

    a X Y a X Y a X Y

    H D H D H D

    vs vs vs

    H D H D H D

    La estadstica de prueba es X Y . Aceptamos H0 cuando la diferencia entre el valor observado de la estadstica de prueba en la muestra no sea muy diferente del valor

    propuesto 0D para X Y . Para buscar diferencias significativas entre estas cantidades

    utilizamos la distribucin de X Y para ello es necesario saber la manera en que se tomaron las muestras; es decir, es necesario saber si las muestras son dependientes o

    independientes; tambin se requiere conocer como son las distribuciones poblacionales,

    saber si las varianzas son o no conocidas y los tamaos muestrales.

    2.2.1. Contrastes basados en muestras independientes:

    Supongamos que se tienen muestra aleatorias independientes de tamaos n y m de dos

    poblaciones X e Y que son normales con medias X y Y y varianzas de una muestra 2

    X

    y 2Y conocidas. En este caso, la distribucin de la estadstica de prueba es:

    0

    2 2~ (0,1)

    X Y

    X Y DZ N

    n m

    Esta estadstica la utilizaremos para buscar diferencias significativas entre X Y y D0. Con base en esta estadstica se tiene que las regiones crticas de tamao y los valores p para los tres contrastes anteriores son las siguientes:

  • 70

    Prueba bilateral.

    0 0

    0

    :

    :

    X Y

    a X Y

    H D

    vs

    H D

    En este caso parece razonable rechazar H0 cuando el valor observado para X Y en la

    muestra sea suficientemente diferente del valor propuesto 0D para X Y . Entonces,

    valores grandes de la estadstica Z en cualquier direccin nos conducen a rechazar H0; por

    esta razn,

    2 2. . / o RC z z z z z Entonces, rechazamos H0 a favor de Ha y concluimos que 0X Y D cuando

    02 2

    ( ). .c

    X Y

    x y Dz R C

    n m

    El valor p para la prueba es:

    2 cp valor P Z z

    Prueba unilateral derecha.

    0 0

    0

    :

    :

    X Y

    a X Y

    H D

    vs

    H D

    En este caso parece razonable rechazar H0 cuando el valor observado para X Y en la

    muestra sea suficientemente mayor que el valor propuesto 0D para X Y ; por lo tanto, valores extremos en la cola derecha de la estadstica Z nos conducen a rechazar H0. Por esta

    razn, la regin crtica de tamao y el valor p son:

    . . /RC z z z

    Entonces, rechazamos H0 a favor de Ha y concluimos que 0X Y D cuando

    02 2

    ( ). .c

    X Y

    x y Dz R C

    n m

  • 71

    El valor p es:

    cp valor P Z z

    Prueba unilateral izquierda.

    0 0

    0

    :

    :

    X Y

    a X Y

    H D

    vs

    H D

    En este caso parece razonable rechazar H0 cuando el valor observado para X Y en la

    muestra sea suficientemente menor que el valor propuesto 0D para X Y ; por esta

    razn, la regin crtica y el valor p para un nivel de significancia preestablecido para esta prueba son:

    . . /RC z z z

    Entonces, rechazamos H0 a favor de Ha y concluimos que 0X Y D cuando

    02 2

    ( ). .c

    X Y

    x y Dz R C

    n m

    El valor p es:

    cp valor P Z z

    Observaciones:

    a) Los contrastes anteriores siguen siendo vlidos aun cuando las poblaciones no sean normales, siempre que los tamaos muestrales son grandes.

    b) Los contrastes anteriores siguen siendo vlidos aun cuando las varianzas poblacionales

    sean desconocidas, en este caso las reemplazamos por las varianzas muestrales 2 XS y 2

    YS , pero se requiere que los tamaos muestrales sean grandes. En este caso, la

    estadstica de prueba es

    02 2

    ~ (0,1)

    X Y

    X Y DZ N

    S S

    n m

    Adems, el valor calculado de la estadstica es:

    02 2

    ( )c

    X Y

    x y Dz

    s s

    n m

    Las regiones crticas y los valores p son los mismos que antes.

  • 72

    Ejemplo 4. Se cree que el promedio verbal para el nmero de respuestas correctas para la

    prueba SAT para los hombres es mayor que el de las mujeres por ms de 10 puntos. Las

    muestras aleatorias para ambos sexos arrojaron los siguientes resultados:

    Hombres Mujeres

    Tamao muestral = 125 100

    Media muestral = 480 460

    Desviacin estndar muestral = 60 52

    Asuma normalidad.

    a) Utilizar un nivel de significancia del 5% para determinar si se encuentra apoyada la creencia por la evidencia muestral. Cul es el p valor?

    b) Suponga que la verdadera diferencia es de 11 puntos. Cul es la potencia de la prueba anterior?

    Solucin:

    Sea X = Calificacin en la prueba verbal SAT para los hombres esta variable tiene una

    media poblacional X y una varianza 2

    X desconocida. De una muestra aleatoria de

    tamao n = 125 se obtiene 480, 60XX S

    De una muestra aleatoria de tamao m = 100 de Y que representa la calificacin en la

    prueba verbal SAT para los mujeres. Esta variable tiene una media poblacional Y y una

    varianza 2Y desconocida. De de la muestra se obtiene 460, 52YY S

    Se cree que el promedio para los hombres est por encima del de las mujeres por ms de 10

    puntos. Lo anterior lo podemos indicar como 10X Y , pues la cantidad X Y nos

    indica en qu cantidad la media poblacional de X est por encima de la de Y. Entonces

    a) Utilizar un nivel de significancia del 5% para probar la creencia; para ello, debemos realizar la siguiente prueba de hiptesis:

    0 : 10

    : 10

    X Y

    a X Y

    H

    vs

    H

    Esta es una prueba unilateral derecha para la diferencia de medias poblacionales de dos

    poblaciones independientes con varianzas poblacionales desconocidas y tamaos

    muestrales grandes, entonces la estadstica de prueba para el contraste es

    0

    2 2~ (0,1)

    X Y

    X Y DZ N

    S S

    n m

  • 73

    La regin crtica es

    0.05. . / 1.645RC z z z z

    Usando la informacin muestral se obtiene que el valor calculado de la estadstica de

    prueba es:

    2 2

    480 460 ( 10)1.34

    60 52

    125 100

    cz

    Como 1.34 . .cz R C entonces no es posible rechazar H0 y esto nos permite inferir que

    posible que los hombres superen a las mujeres en esa prueba pero no lo hacen por ms

    de 10 puntos.

    El valor p para la prueba es:

    1.34 0.0901 0.05p valor P Z Entonces rechazamos H0.

    b) Si la verdadera diferencia es 11 10X Y , entonces la hiptesis nula es falsa y para

    este valor la potencia de la prueba es:

    0 0Rechazar / es falsa

    1.645 / 11c X Y

    Potencia P H H

    P Z

    Para encontrar esta probabilidad hay que tener en cuenta

    2 2

    10c

    X Y

    X YZ

    S S

    n m

    Entonces,

    2 2

    101.645 / 11X Y

    X Y

    X YPotencia P

    S S

    n m

    Como la verdadera media no es 10 sino que es 11, entonces la estadstica anterior est

    mal estandarizada. Para corregir este problema restamos 1 en el numerador de la parte

    izquierda de la expresin anterior y esta misma cantidad se resta al lado derecho, y as se

    obtiene que

  • 74

    2 2 2 2

    2 2

    10 1 11.645

    11.645 1.51 0.0655

    60 52

    125 100

    X Y X Y

    X YPotencia P

    S S S S

    n m n m

    P Z

    Ejemplo 4.1. Un fabricante afirma que la tensin de ruptura promedio del hilo A excede a

    las hilo B en al menos 12 kilogramos. Para probar esta afirmacin se pusieron a prueba 50

    hilos de cada tipo bajo condiciones controladas. El hilo tipo A tuvo una tensin promedio

    de 86.7 kilogramos con una desviacin estndar de 6.28; mientras que el hilo tipo B tuvo

    una tensin promedio de 77.8 kilogramos con una desviacin estndar de 5.61. Utilice un

    nivel de significancia del 5% para probar la afirmacin del fabricante. Encuentre el valor p

    de la prueba.

    Solucin:

    Sea X = La tensin de ruptura del hilo tipo A y X es la tensin de ruptura promedio de

    hilo.

    Sea Y = La tensin de ruptura del hilo tipo B y Y es la tensin de ruptura promedio de

    hilo.

    En la muestra aleatoria de tamao n = 50 de X se obtiene 86.7 y 6.28Xx S y en la

    muestra de tamao m = 50 de Y se obtiene 77.8 y 5.61Yy S

    El fabricante afirma que la resistencia promedio del hilo tipo A excede a la del hilo tipo B

    en al menos 12 kilogramos y esto quiere decir que 12X Y , entonces debemos probar

    a un nivel de significancia 0.05 lo siguiente:

    0 : 12

    : 12

    X Y

    a X Y

    H

    vs

    H

    Esta es una prueba unilateral izquierda para la diferencia entre dos medias poblacionales de

    poblaciones independientes con varianzas poblaciones desconocidas y tamaos muestrales

    grandes; por lo tanto, la estadstica de prueba es:

    02 2

    ~ (0,1)

    X Y

    X Y DZ N

    S S

    n m

  • 75

    Entonces, la regin critica de para es

    0.05. . / 1.645RC z