curso de estadística no-paramé · pdf filecurso de estadística...

Click here to load reader

Post on 20-Sep-2018

217 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • Curso de Estadstica no-paramtricaSesin 1: Introduccin Inferencia no Paramtrica

    David Conesa

    Grup dEstadstica espacial i Temporal Departament dEstadsticaen Epidemiologia i Medi Ambient i Investigaci Operativa

    Universitat de Valncia

    Junio 2013

    Introduccin Est. paramtrica Est. no paramtrica Introduccin SPSS Anlisis 1 muestra var. continua

    Inferencia Estadstica

    Estadstica: recopilacin, presentacin, anlisis y uso de los datos con elobjetivo de tomar decisiones y resolver problemas.

    Necesaria? Los procesos de la vida real presentan variabilidad.el nmero de empresas que cierran por ao es diferente,la cantidad de lluvia recogida en un dia en una determinada zona vara,el precio de una accin vara continuamente, etc.

    La Probabilidad juega un papel destacado en el razonamiento cientfico:El azar est presente en gran parte de los procesos cotidianos.Los resultados experimentales presentan variabilidad atribuible afactores no controlados por el experimentador.La seleccin de las unidades experimentales se basa en mecanismosaleatorios.

    Las conclusiones de un anlisis estadstico se formulan en trminosprobabilsticos, ya que los modelos probabilsticos fundamentan lajustificacin terica de la Inferencia Estadstica.

    2 / 36

  • Introduccin Est. paramtrica Est. no paramtrica Introduccin SPSS Anlisis 1 muestra var. continua

    Inferencia estadstica (2)

    Distinguir entreEstadstica Descriptiva: mtodos para resumir y organizar datosInferencia Estadstica: mtodos para obtener conclusiones vlidas paratoda una poblacin a partir de los datos que nos aportan una parte dedicha poblacin.

    El esquema bsico:

    Poblacin muestra

    Seleccin aleatoria

    Inferencia Estadstica

    Estadstica Descriptiva

    RepresentatividadConclusiones en la Poblacin

    3 / 36

    Introduccin Est. paramtrica Est. no paramtrica Introduccin SPSS Anlisis 1 muestra var. continua

    Inferencia Paramtrica

    Poblacin: conjunto de individuos objeto de estudio; de dicha poblacinestudiamos una variable de inters: X .Poblacin: conjunto de valores de la variable observacional que obtendramos si serepitiera indefinidamente el proceso de obtencin de los datos.La variable de inters X tiene una distribucin de probabilidad asociada, ladistribucin poblacional (lo que habitualmente entendemos por poblacin).Tipos de variables aleatorias: Categricas (nominal u ordinal) y Cuantitativas(discreta o continua).Habitualmente (en problemas reales), la distribucin poblacional de la variable deinters es desconocida o al menos no es completamente conocida.En la mayora de los casos, lo que se conoce es la familia (o el tipo) a la cualpertenece la distribucin (exponencial, normal, etc.) pero lo que no se conocen sonsus parmetros.Los parmetros son las caractersticas de inters de la poblacin (media, varianza,proporcin poblacional, etc.).En los casos en los que no conocemos la distribucin (Estadstica no paramtrica)no tiene sentido preguntarse por los parmetros.

    4 / 36

  • Introduccin Est. paramtrica Est. no paramtrica Introduccin SPSS Anlisis 1 muestra var. continua

    Ejemplos: poblaciones e inferencia

    1 Siete empresas familiares voluntarias participaron en un estudio para determinar siuna campaa publicitaria podra elevar las ventas anuales de la empresa. Semidieron las ventas dos veces, una antes de la campaa y otra despus. Losresultados de las ventas (en miles de euros) aparecen en la siguiente tabla:

    EMPRESAS Antes Despus Diferencia1 46 56 102 47 52 53 41 47 64 45 48 35 37 37 06 48 51 37 58 62 4

    Cual es la poblacin? Muestra? Variable de inters? Tamao muestral? Quinferencia tiene sentido aqu?

    2 Once empresas fueron analizadas por un inspector de hacienda. Tres de ellasestaban en regla, y el resto no:Poblacin? Muestra? Parmetro de inters? Qu inferencia tiene sentido aqu?

    5 / 36

    Introduccin Est. paramtrica Est. no paramtrica Introduccin SPSS Anlisis 1 muestra var. continua

    Cmo hacemos inferencia paramtrica?

    Muestreo aleatorio: muestra, tamao muestral, representatividad.Una muestra aleatoria de observaciones de una variable X de tamaomuestral n es un conjunto de variables aleatorias X1,X2, . . . ,Xnindependientes e idnticamente distribuidas con la misma distribucinde la variable X .Estadsticos. Distribucin en el muestreo.Utilizar esta informacin para extrapolar los resultados obtenidos auna poblacin ms grande (Inferencia Estadstica):

    1 Estimacin: la estimacin trata de utilizar la informacin muestral paraaproximar el valor de los parmetros desconocidos del modelo

    Puntual.Por Intervalos de Confianza.

    2 Contraste de Hiptesis: a partir de las observaciones podemos obtenerevidencia a favor o en contra de hiptesis referidas a losparmetros desconocidos del modelo.

    Qu pasa si no conocemos la distribucin de la variable?6 / 36

  • Introduccin Est. paramtrica Est. no paramtrica Introduccin SPSS Anlisis 1 muestra var. continua

    Estimacin paramtrica

    MuestreoPoblacin muestra

    Estimacin y/o Contraste de HiptesisUtilizamos t(X) para explicar

    X Modelo() Parmetro(s)desconocido(s)

    X = (X1, . . . ,Xn)t(X) funcinde los datos

    7 / 36

    Introduccin Est. paramtrica Est. no paramtrica Introduccin SPSS Anlisis 1 muestra var. continua

    Estimacin paramtrica

    , Espacio Paramtrico: conjunto de valores posibles de los parmetros.S, Espacio Muestral: conjunto de todos los valores posibles que pueden tomar lasmuestras X = (X1, . . . ,Xn).Estimador es cualquier funcin del espacio muestral en el espacio paramtrico,t(X):

    T : S X t(X)

    Es decir, cualquier estadstico es un estimador y tiene asociado una distribucinmuestralEstimacin es cualquier realizacin del estimador.

    No todos los estimadores que se pueden obtener son igual de buenos. Buscamospues mtodos de obtencin de estimadores y criterios para su evaluacin:

    Que la distribucin del estimador est centrada en el parmetro,que tenga poca dispersin.

    Qu pasa si no conocemos la distribucin de la variable?

    8 / 36

  • Introduccin Est. paramtrica Est. no paramtrica Introduccin SPSS Anlisis 1 muestra var. continua

    Contraste de Hiptesis paramtricos

    En general una hiptesis estadstica tiene la forma: 0 .Por el propio objetivo de un contraste, este siempre tendr dos hiptesis:Hiptesis nula que denotaremos H0 y que representa la afirmacin que se quiere

    contrastar 0Hiptesis alternativa que denotaremos H1 HA y que contiene los otros valores

    posibles del parmetro 1Se suele denotar como: {

    H0 : 0HA : 1

    El tratamiento no es simtrico, aceptaremos H0 mientras no demostremos que esfalsa. Por eso, habitualmente, indicaremos en HA lo que es ms relevante y en H0lo que consideraremos como cierto mientras no se demuestre lo contrario.Qu pasa si no conocemos la distribucin de la variable?

    9 / 36

    Introduccin Est. paramtrica Est. no paramtrica Introduccin SPSS Anlisis 1 muestra var. continua

    Contraste de Hiptesis paramtricos

    Contrastar una hiptesis es realizar un experimento relacionado con el(los)valor(es) desconocido(s) de un parmetro y, a partir del resultado de estainformacin, decidir sobre el rechazo o aceptacin de la hiptesiscontrastada.

    Un test de hiptesis es una regla de decisin que asigna uno de los dosposibles resultados (Aceptar H0 y Rechazar H0) para cada posible valor delexperimento X S.

    Los valores para los cuales se rechaza H0 se denominan Regin Crtica.

    Los tests de hiptesis se describen en trminos de un estadstico T (X) quese denomina estadstico de contraste o test estadstico o estadstico del test.

    Y si queremos hacer no paramtrica?

    10 / 36

  • Introduccin Est. paramtrica Est. no paramtrica Introduccin SPSS Anlisis 1 muestra var. continua

    Ejemplo contrastes

    1 En el ejemplo de las empresas que hacen un estudio para valorar elfuncionamiento de la mejora de una campaa publicitaria, identificarsus elementos bsicos como un problema de contraste de hiptesis:

    Hiptesis Hiptesis estadsticas Poblacin Estadstica Parmetro Experimento Espacio Muestral Estadstico del contraste Test de hiptesis Regin crtica

    2 Anlogamente con el ejemplo de las empresas investigadas por uninspector.

    11 / 36

    Introduccin Est. paramtrica Est. no paramtrica Introduccin SPSS Anlisis 1 muestra var. continua

    Concepto de p-valor

    Los contrastes de hiptesis se pueden resolver como reglas de decisin sobrerechazar o no la hiptesis nula.Una alternativa muy popular se basa en la medicin de la credibilidad de lahiptesis nula a la luz de los datos obtenidos. Esta informacin sobre laconcordancia de los datos y la H0 se mide con probabilidades.Sea X1, . . . ,Xn una m.a. de una distribucin de probabilidad (modelo) conocida.

    Sea{

    H0 : 0H1 : 1

    una hiptesis que se desea contrastar y sea T un estadstico

    para el que los datos toman el valor T = t0 del que sabemos su distribucin.El p-valor correspondiente al valor observado t0 es la probabilidad (bajo H0) deobtener dicho valor t0 o valores ms extremos (en la direccin o direcciones de HA).La forma habitual de resolver el contraste es fijar un nivel de significatividad (errorde tipo I mximo que queremos cometer) y rechazar si el p-valor es menor quedicho nivel.Los pasos finales incluyen decidir que conclusin es la que vamos a tomar,interpretar los resultados obtenidos y reportar las conclusiones.

    12 / 36

  • Introduccin Est. paramtrica Est. no paramtrica Introduccin SPSS Anlisis 1 muestra var. continua

    Concepto de p-valor (2)

    Contrastes unilaterales

    A menudo est claro que la desviacin de la mediana solo puede darse en unsentido o solamente nos interesa demostrar que esa desviacin se da en unnico sentido.

    En estos casos utilizaremos una hiptesis alternativa dire