[an error occurred while processing this directive]

Publicado por Sergio Morant sergiomorant@yahoo.com.ar

Unidad 1. INTRODUCCIÓN Y FUNDAMENTOS DE LA ECONOMETRÍA

Definición

Unidad 2. REGRESIÓN LINEAL SIMPLE. EL MÉTODO DE LOS MÍNIMOS

CUADRADOS ORDINARIOS

2.1 Desarrollo del Método minimocuadrático.

2.2 Supuestos del método.

2.3 Propiedades de los estimadores minimocuadráticos: el teorema de Gauss- Markov.

2.4 Los coeficientes de correlación y de determinación.

2.5 Interpretación económica de los resultados. Significado de los parámetros obtenidos.

2.6 Formas funcionales de los modelos.

Función de regresión lineal simple. El método MCO.

1 Y

.t = a + bXt

2 y

t = a + bxt

3 Y

t= a + bxt + ut

4 Y

t = yt + ut

5 u

t = Yt - yt

6

S

(Incluir un ejemplo de determinantes de tres por tres)

Características:

I Los estimadores obtenidos (

Son puntuales (dan un solo valor).

II La línea de regresión que se obtiene pasa a través de las medias muestrales de X e Y (la

ecuación puede escribirse como

errores es cero y los errores no están relacionados con Y

estudio de la varianza)

Supuestos del método del modelo clásico de regresión lineal (MCRL).

El análisis de regresión es un análisis condicionado a los valores dados del o de los

regresores (exógenas) o simbólicamente: E(u

incluídos en el modelo no afectan sistemáticamente le valor de la media de Y.

1) Homoscedasticidad (igual varianza de los errores) var(u

para todas las observaciones (igual dispersión o igual varianza: las poblaciones de Y

correspondientes a diversos valores de X tienen la misma varianza. Si se cumple,

todos los valores de Y que corresponden a diversos valores de X serán igual de

confiables (cercanía o alejamiento con el cual están distribuídos los valores de Y

alrededor de sus medias). Todos los valores de Y corespondientes a diversos

valores de X son igualmente importantes.

2) No autocorrelación entre las perturbaciones (errores) (correlación=varianza

conjunta=covarianza). Simbólicamente:

Cov(u

Si la covarianza no fuera 0,querría decir que Y

u

a y b) MCO están expresados únicamente en términos de Y.`Y= a + `bX y `y =`Y ); además la media de lost ni con Xt . (lectura previa:t½Xt)=0, es decir, los factores que no estánt½Xt)=s2; varianza constantei,uj½Xi, Xj)=0t estaría dependiendo también det-1, puesto que este determina a ut.

(otros supuestos no tan importantes: n>k; los valores de X deben ser no todos iguales, pues

entre mayor sea la variación en X, mayor será la precisión con que Y puede ser estimada; a

medida que aumenta la muestra, también aumenta la precisión (la utilidad de lo anterior en

la medición de la precisión se verá en los problemas de inferencia estadística); el modelo

está correctamente especificado: ¿cuáles variables deben estar incluídas en el modelo?

¿cuál es la forma funcional correcta del modelo? Un sesgo de especificación: escoger la

forma funcional equivocada. Pero la teoría debe ser la base de la estimación, evitando los

modelo ad hoc. Todos los supuestos se cumplen en una FRP y no se duplican todos en la

FRM porque son supuestospara muestras grandes o asintóticas).

Ante un modelo con más de dos variables:

3) No multicolinealidad perfecta. En este supuesto se ve la utilidad de estudiar las

covarianzas entre los coeficientes estimados de la regresión.

Propiedades de los estimadores de mínimos cuadrados: el teorema de Gauss-Markov.

Un estimador se considera en mejor estimador lineal insesgado, si se cumple lo siguiente:

1 Es una función lineal de una variable aleatoria (Y).

2 Es insesgados: E(

3 Tiene varianza mínima: es eficiente (es decir, el mejor entre todo el conjunto de

estimadores lineales insesgados)

4 Consistente:

Teorema de Gauss- Markov: Dados los supuestos del MCRL, los estimadores de mínimos

cuadrados, dentro de la clase de los estimadores lineales insesgados, tienen varianza

mínima, es decir, son MELI. (checar propiedades en el libro).

Coeficiente de determinación y autocorrelación R

R

regresión (convendría pequeño cuestionario sobre la interpretación de R

en los errores. Tiene básicamente dos propiedades:

1 Cantidad no negativa.

2 Está entre 0 y 1.

Una cantidad estrechamente relacionada con r

es el coeficiente de correlación r = +

Sus características:

1 Puede tener signo positivo o negativo, dependiendo del sighno de covarianza

muestral de 2 variablesm, por tanto está entre –1 y +1.

2 Es simétrico: r

be) = b.be tiende a b cuando n tiende a N.2, medida de bondad de ajuste.2 mide la proporción o el porcentaje de la variación total en Y explicada por el modelo de2 y su contraparte2 pero conceptualmente muy diferente de ésteÖ r2 (coeficiente de correlación parcial).xy = r yx

3 Una r = 0 no necesariamente implica independencia estadística; pero si son

independientes su r es 0 (la r = 0 es necesaria pero no suficiente para la

independencia estadística).

4 Es medida sólo de asociación lineal, por lo que pierde sentido en relaciones no

lineales, además no implica relación de causalidad.

Interpretación económica de los resultados. Significado de los parámetros obtenidos.

Con respecto a la interpretación del intercepto, es necesario usar el sentido común para ello,

pues muy frecuentemente el intervalo muestral de los valores observados no contiene el

cero como uno de ellos; tal vez lo más indicado sea leerlo como el promedio del efecto

sobre Y de todas las variables omitidas en la regresión.

Formas funcionales de los modelos.

Modelos logarítmicos.

Semilogarítmico: log-lin. El coeficiente de la variable explicativa mide el cambio

proporcional constante, o relativo en Y para un cambio absoluto dado en X.

b

Cambio absoluto en X.

e = Cambio relativo en Y (multiplicado por 100, porcentual)

b

se denomina modelo de crecimiento (constante). Para la interpretación, es necesario

multiplicar

Semilogarítmico: lin-log. El coeficiente de la variable explicativa mide el cambio

absoluto en la variable dependiente, causado por un cambio porcentual en el regresor.

e = cambio porcentual o tasa de crecimiento. Cuando el regresor es el tiempo, el modelobe por 100.

b

cambio porcentual en X.

Es necesario dividir

e = Cambio absoluto en Ybe por 100 para leer en las unidades de Y.

Unidad 3. PRUEBAS DE INFERENCIA ESTADÍSTICA.

3.1 Intervalos de confianza para estimadores M.C.O.

3.2 Pruebas de hipótesis: la t de Student: significancia estadística de las variables

explicativas.

3.3 La predicción mediante modelos econométricos

Si el objetivo no es sólo la estimación puntual de los parámetros, sino también realizar

inferencias sobre la función de regresión poblacional, entonces debe suponerse que los

errores (u

regresión es estimar la FRP con base en la FRM, es decir, hacer inferencia sobre los

verdaderos valores de los parámetros; pero debido a fluctuaciones muestrales, el estimado

de la FRP es, en el mejor de los casos, una aproximación. Dado que los datos cambiarán de

una muestra a otra, los valores estimados cambiarán automáticamente, así que se necesita

una medida de confiabilidad de los estimadores

estándar de la distribución muestral de un estimador) mide la precisión de un valor

estimado. Dados los supuestos de Gauss, los errores estándar de los estimadores MCO se

pueden obtener así:

Var(

cuadrado de las desviaciones de X con respecto a su media). La varianza real de los errores

no puede ser calculada a partir de los datos, entonces, es necesario utilizar una

aproximación de ella. El estimador MCO de la verdadera

t) siguen alguna distribución de probabilidad. El objetivo principal del análisis dea y b. El error estándar (desviaciónbe) = s2/S(Xt -`X)2 (varianza homoscedástica de los errores sobre la sumatoria dels2 es el siguiente:

s

e

2

sumatoria de los errores al cuadrado dividida por los grados de libertad (para cualquier

número de regresores). Entonces, el error estándar: ee(

así:

ee(

El error estándar el la desviación estándar de los valores Y alrededor (+ o -) de la línea de

regresión estimada (media condicional de Y), el cual se usa frecuentemente como una

medida resumen de la <<bondad de ajuste>> de la línea Teniendo ya el error estándar,

puede hacerse ahora la estimación por intervalos, lo cual se trata de obtener un intervalo de

valores en el cual se encuentre el parámetro poblacional

de un estimador puntual se mide por su error estándar. En lugar de depender de un solo

estimador puntual, se puede construir un intervalo alrededor del estimador puntual, tal que

el intervalo tenga, por ejemplo, 95% de probabilidad de incluir el verdadero valor del

parámetro (siendo

arroje un valor de

numérico específico de

modo que la probabilidad de que

está). Si se conocen las distribuciones muestrales de los estimadores se pueden hacer

afirmaciones sobre los intervalos de confianza. La distribución de los estimadores MCO se

supone normal estándar . La distribución normal puede usarse para hacer afirmaciones

probabilísticas de

2= Suet/(n-k)be) = Övar(be), puede ser calculadobe) = se / Ö [S(Xt -`X)2]b. Sabemos que la confiabilidadbe aleatorio, pues no ha sido calculado en una muestra específica quebe). Una vez que se tenga una muestra específica y se obtenga un valorbe, el intervalo deja de ser aleatorio y se convierte en fijo, deb se encuentre en ese intervalo será de 0 o de 1 (está o nob si se conoce s2 (Teorema de Tchebycheff). Si se reemplaza s2 por

s

e

2, se obtiene la variable t de Student,(crítica o de tabla), la cual sigue la distribución t con

n-k

forma:

Pr[

grados de libertad, la cual puede usarse para construir un intervalo de confianza de labe - ta/2·ee(be) £ b £ be + ta/2·ee(be)] = 1 - a

Donde la amplitud del intervalo es proporcional al error estándar del estimador: a mayor

error estándar de

desconocido.

t

Interpretación si 1 -

casos (muestras) intervalos como (el anterior) contendrán el verdadero valor de

[Ejercicios de obtención de ee,

e

Prueba de hipótesis (p. 119)

Prueba de significancia de los coeficientes de la regresión, la prueba

Una prueba de significancia es un procedimiento mediante el cual se utilizan los resultados

muestrales para verificar la verdad o falsedad de una hipótesis nula.

Elementos:

H

H

Estadístico de prueba:

b mayor será la incertidumbre de estimar el verdadero valor del parámetroa/2 = valor de la t de Student a un nivel de significancia de a/2 (a a dos colas).a = 0.95: en el largo plazo (muestreo repetido) en 95 de cada 100b.s2, e intervalos de confianza.]t.0 : hipótesis nula, planteada o de investigación.A : hipótesis alterna, frente a la que se prueba la H0.tc

Bajo el supuesto de normalidad U

ee(

i~N(0,s2), la variable tc = be - b sigue la distribuciónbe)

t

Pasos a seguir:

1)Planteamiento de hipótesis:

H

H

2)Delimitación del área de no rechazo de la H

3)Calcular el valor

t

con n-k grados de libertad.0: b=0 (la variable con coeficiente b no es explicativa de la variable dependiente)A: ¹b00 y del área de rechazo.t=be - b

ee(

*Notas:

be)

§

241);

la prueba t para regresión múltiple se hace suponiendo muestras diferentes (pág.

§

aclarar bien cuándo una variable es aleatoria y cuándo no (b);

§

A medida que el valor de

mayor sea el valor absoluto de

Se dice que un estadístico es estadísticamente significativo, si el valor del estadístico de

prueba (

no estadísticamente significativo.

(págs. 122-125); (p. 126 5.8); regla práctica <<2-

selección de nivel de significancia,

Nivel exacto de significancia: valor

igual o mayor que la

probabilidad exacta de cometer un error de tipo I. Nivel de significancia más bajo al cual

puede rechazarse una H

valor

incluir las explicaciones de los errores de tipo I, tipo II y el valor p.b en la H0 se aleje del be,, el cociente (tc) será mayor; así que atc, será evidencia en contra de la H0.tc) cae en la región crítica o de rechazo (rechazo de H0) y, si pasa lo contrario, est>> p. 127; formación de las H0 y HA,p-value: p. 128-131.p. Probabilidad real de obtener un valor de la t de tablatc. También conocido como nivel exacto de significanciao la0. Se obtienen de los puntos porcentuales de la distribución t en ela que sería necesario para obtener el valor mayor o igual a tc..

(una cola y dos colas la estábamos tomando al revés, véase pie de pág. 791)

(establecer un orden lógico que debe de llevar las pruebas de los supuestos, la significancia,

la bondad, etc. para evaluar un modelo econométrico)

(leer p.137 5.12, antes de saber las violaciones a los supuestos).

En muestras pequeñas, las pruebas

3.3La predicción mediante modelos econométricos.

Después de obtener la regresión histórica (series de tiempo), uno de los usos puede ser

predecir el valor de la variable dependiente correspondiente a un valor de X dado. Hay dos

clases de predicciones: 1) la media condicional de Y

valor individual de Y

En e primer caso, la regresión proporciona una estimación puntual de la estimación media

dándole un valor a X. El error de predicción o de pronóstico se evalúa primero,

encontrando la distribución muestral de Y estimada (normalmente distribuida con media

igual a

e

t

una variable

confianza para la verdadera media de Y dado X.

t y F requieren el supuesto de normalidad.t correspondiente a Xt ; 2)predecir unt correspondiente a Xt (predicción media y predicción individual).b1 + b2X0) y con una varianza que, si se calcula en base a s2( de los u2) se obtienet con su distribución, misma que puede ser usada para construir intervalos de

UNIDAD 5: VIOLACIÓN A LOS SUPUESTOS MCO.

5.1 Autocorrelación. Origen, significado, consecuencias. Detección y corrección.

La autocorrelación es correlación entre miembros de series de observaciones ordenadas en

el tiempo o en el espacio. En presencia de autocorrelación y de heterocedasticidad, los

estimadores MCO dejan de ser MELI, pues ya no tienen varianza mínima.

Supesto de no autocorrelación:

E(u

Violación del supuesto:

E(u

Aquí, el término de perturbación relacionado con una opbservación cualquiera está

influenciado por el término de perturbación de cualquier otra observación.

(autocorrelación=correlación serial).

Dependiendo de cuál error esté influyendo en otro, será el

por su frecuencia es aquella donde un error influye sobre el inmediato posterior, es decir la

autocorrelación de primer orden. En presencia de autocorrelación se está violando el

supuesto de aleatoriedad y normalidad de los errores. Es generalmente más común en los

datos de series de tiempo, aunque también se presenta en datos de corte transversal. En el

análisis de corte transversal el ordenmiento de la información debe tener alguna lógica o

interés económico para dar sentido a cualquier determinación de si hay o no

autocorrelación.

¿Por qué se origina? Algunas razones son:

i,uj) = 0, i¹j.i,uj) ¹ 0, i¹j.<<orden>>. La más importante

§

económicos y según la etapa del ciclo en la que estén, puede marcarse una dirección

(observaciones sucesivas interdependientes).

Los datos económicos se mueven por inercia, por naturaleza presentan ciclos

§

Variables excluidas. Si un fenómeno se explica favorablemente con un número

variables, y por alguna razón se corre con

de la variable excluida se sume al efecto de la perturbación estocástica, por lo que

deja de ser tal.

Forma funcional incorrecta: al adaptar un modelo lineal a unos datos que no

presentan una dispersión lineal, los valores serán sobre y subestimados en diversos

momentos de la curva, y los errores reflejarán, como el caso anterior, la forma

funcional que debe aparecer.

Fenómeno de la telaraña: en situaciones de la economía donde un dato o fenómeno

surge efecto sobre otro después de un periodo de tiempo, no se esperan errores

aleatorios, porque los errores de un periodo modificarán el fenómeno del siguiente

(producen decisiones)

Rezagos. Si una variable es explicada también por el valor que obtuvo en un

periodo anterior y esto se ignora en el modelo, los errores de igual forma lo

reflejarán.

Consecuencias.

Si los errores se generan por un esquema autorregresivo de primer orden, es decir AR(1)

(poner), el valor p será el coeficiente de autocorrelación de primer orden. Es decir, el

desplazamiento de los errores consta de una parte de desplazamiento sistemático y una

parte aleatoria.

En presencia de autocorrelación, los estimadores MCO, aunque son lineales e insesgados y

consistentes, ya no son los mejores, pues su vaianza no es la mínima dentro de ese conjunto

de estimadores (disminuye la precisión de estimación, pues crece el error estándar del

parámetro. Por tanto, es probable que se declare a un coeficiente estadísticamente no

significativo aunque pueda serlo. (aclarar que el MCO no es el único método que existe y

que a veces es necesario usar otros, es decir, la máquina corrige los errores con otros

métodos).

Al usar el estimador MCO y su varianza definida:

1)es probable que se subestime la verdadera varianza residual y por tanto, R

de lo que debe ser en realidad.

2)las pruebas

conclusiones erróneas sobre la significancia estadística de los coeficientes de regresión

estimados.

Detección:

Método gráfico. Gaficar los residos obtenidos de la regresión frente al tiempo (gráfica de

secuencia de tiempo y obsevar si presenta un patrón sistemático (p. 408 y 395).

Prueba de rachas. Se anotan los signos (+ o -) de los residuales de la regresión. Cada

grupo de residuales del mismo signo cuanta como una racha, cuya longitud es el número de

elementos de ésta. Hay que hacer entonces una prueba de aleatoriedad de las rachas: ¿las

rachas observadas en el caso de n observaciones, son muchas o pocas en comparación con

el número de rachas esperadas en una secuencia de n observaciones estrictamente aleatoria?

Si hay muchas rachas, significa que los errores cambian de signo frecuentemente y denota

una autocorrelación negativa. Si hay muy pocas, puede sugerir positiva.

Sesgos de especificación:k dek-1, ello equivale a permitir que el efecto2 sea más altat y F dejan de ser válidas, pues al aplicarlas es probable que conduzcan a

La disciplina que estamos empezando a estudiar ha sido definida por varios autores,

definiciones de las que se presenta a continuación los elementos más importantes:

- Literalmente: “medición económica”

- Aplicación de la estadística matemática a la información económica.

- Análisis cuantitativo de fenómenos económicos reales sobre la base del desarrollo

simultáneo de teoría y la observación realizados con métodos apropiados de

inferencia.

- Aplicación de la teoría económica, las matemáticas y la inferencia estadística al

análisis de los fenómenos económicos.

Relación con otras ciencias:

La econometría es una amalgama de Teoría Económica, economía matemática, estadística

económica y estadística matemática.

- La econometría da contenido empírico a gran parte de la teoría económica, la cual

sólo hace afirmaciones cualitativas.

- La economía matemática tiene por objeto expresar matemáticamente la teoría,

aunque no sea capaz de verificarse. En econometría se convierten las ecuaciones

matemáticas en econométricas.

- La estadística económica se dedica a la recolección y ordenamiento de datos que se

generan en la economía. Con esos datos el econometrista verifica o refuta las

teorías.

- Finalmente, se requieren métodos adicionales a la estadística matemática para

analizar los datos generados en la economía, los cuales no son obtenidos mediante

experimentos controlados.

Metodología de la econometría.

1. Planteamiento de la teoría o hipótesis.

2. Establecer el modelo matemático.

3. Establecer el modelo econométrico.

4. Obtener los datos.

5. Estimación de los parámetros.

6. Realización de pruebas de hipótesis.

7. Pronóstico o predicción

8. Utilización del modelo para fines de control o de política.

Modelo matemático:

Incógnitas variables dependientes e independientes, constantes o parámetros.

Modelo uniecuacional y multiecuacional. Relación exacta o determinística.

Modelo econométrico: permite errores pues se agrega el término de perturbación

estocástica (aleatorio)

Recolección de datos: series, encuestas, registros. Graficación.

Estimación: Método de Mínimos Cuadrados Ordinarios: obtiene exactamente el

promedio condicional de esos cambios.

Prueba de hipótesis: significacncia estadística (en contraste con significancia

económica).

Proyección o predicción.

Control o política. (repasar álgebra).

(Diferencia entre econometría clásica y bayesiana)

Modelos multi y uniecuacionales.

Componentes de los modelos

Variables:

- dependientes, explicada, endógena, regresada;

- independientes, explicativas, exógenas, predeterminadas, regresores.

Constantes:

- autónoma o intercepto;

- coeficientes o parámetros.

Sentido en el que va la relación de un modelo uniecuacional de 2 o más variables

(establecer la variable dependiente y la o las independientes).

Concepto de regresión: Francis Galton

Función de regresión poblacional y función de regresión muestral:

Regresión: dependencia estadística y causalidad (conexión causal y correlación espuria)

Sentido común, leyes lógicas y naturales.

Diferencia entre la regresión y la correlación

Características de la variable dependiente: estadística, aleatoria o estocástica, por tanto

tiene una distribución de probabilidad.

De las variables explicativas: valores fijos en muestreo repetido

Existe, por lo anterior, la asimetría en el tratamiento de las variables que intervienen en una

regresión..

Correlación: ambas simétricas y aleatorias.

Análisis de regresión simple o con dos variables en contrate con el análisis de regresión

múiltiple o con más de dos variables.

Corte transversal y de series de tiempo. El porqué de los errores.

El resultado de la investigación estará en correspondencia con la calidad de los datos. (se

necesita noción de probabilidad condicional)

Definiciones de población y muestra.

Función de regresión poblacional. Una curva de RP es simplemente el lugar geométrico de

las medias condicionales o esperanzas de la variable dependiente para los valores fijos de

las variables independientes (con los datos de toda la población).

FRM: estimadores de los parámetros. Hablar de las propiedades de las funciones de

regresión (linealidad de los estimadores).

Técnicas de muestreo.

La disciplina que estamos empezando a estudiar ha sido definida por varios autores,

definiciones de las que se presenta a continuación los elementos más importantes:

- Literalmente: “medición económica”

- Aplicación de la estadística matemática a la información económica.

- Análisis cuantitativo de fenómenos económicos reales sobre la base del desarrollo

simultáneo de teoría y la observación realizados con métodos apropiados de

inferencia.

- Aplicación de la teoría económica, las matemáticas y la inferencia estadística al

análisis de los fenómenos económicos.

Relación con otras ciencias:

La econometría es una amalgama de Teoría Económica, economía matemática, estadística

económica y estadística matemática.

- La econometría da contenido empírico a gran parte de la teoría económica, la cual

sólo hace afirmaciones cualitativas.

- La economía matemática tiene por objeto expresar matemáticamente la teoría,

aunque no sea capaz de verificarse. En econometría se convierten las ecuaciones

matemáticas en econométricas.

- La estadística económica se dedica a la recolección y ordenamiento de datos que se

generan en la economía. Con esos datos el econometrista verifica o refuta las

teorías.

- Finalmente, se requieren métodos adicionales a la estadística matemática para

analizar los datos generados en la economía, los cuales no son obtenidos mediante

experimentos controlados.

Metodología de la econometría.

1. Planteamiento de la teoría o hipótesis.

2. Establecer el modelo matemático.

3. Establecer el modelo econométrico.

4. Obtener los datos.

5. Estimación de los parámetros.

6. Realización de pruebas de hipótesis.

7. Pronóstico o predicción

8. Utilización del modelo para fines de control o de política.

Modelo matemático:

Incógnitas variables dependientes e independientes, constantes o parámetros.

Modelo uniecuacional y multiecuacional. Relación exacta o determinística.

Modelo econométrico: permite errores pues se agrega el término de perturbación

estocástica (aleatorio)

Recolección de datos: series, encuestas, registros. Graficación.

Estimación: Método de Mínimos Cuadrados Ordinarios: obtiene exactamente el

promedio condicional de esos cambios.

Prueba de hipótesis: significacncia estadística (en contraste con significancia

económica).

Proyección o predicción.

Control o política. (repasar álgebra).

(Diferencia entre econometría clásica y bayesiana)

Modelos multi y uniecuacionales.

Componentes de los modelos

Variables:

- dependientes, explicada, endógena, regresada;

- independientes, explicativas, exógenas, predeterminadas, regresores.

Constantes:

- autónoma o intercepto;

- coeficientes o parámetros.

Sentido en el que va la relación de un modelo uniecuacional de 2 o más variables

(establecer la variable dependiente y la o las independientes).

Concepto de regresión: Francis Galton

Función de regresión poblacional y función de regresión muestral:

Regresión: dependencia estadística y causalidad (conexión causal y correlación espuria)

Sentido común, leyes lógicas y naturales.

Diferencia entre la regresión y la correlación

Características de la variable dependiente: estadística, aleatoria o estocástica, por tanto

tiene una distribución de probabilidad.

De las variables explicativas: valores fijos en muestreo repetido

Existe, por lo anterior, la asimetría en el tratamiento de las variables que intervienen en una

regresión..

Correlación: ambas simétricas y aleatorias.

Análisis de regresión simple o con dos variables en contrate con el análisis de regresión

múiltiple o con más de dos variables.

Corte transversal y de series de tiempo. El porqué de los errores.

El resultado de la investigación estará en correspondencia con la calidad de los datos. (se

necesita noción de probabilidad condicional)

Definiciones de población y muestra.

Función de regresión poblacional. Una curva de RP es simplemente el lugar geométrico de

las medias condicionales o esperanzas de la variable dependiente para los valores fijos de

las variables independientes (con los datos de toda la población).

FRM: estimadores de los parámetros. Hablar de las propiedades de las funciones de

regresión (linealidad de los estimadores).

Técnicas de muestreo.

.

Unidad 2. REGRESIÓN LINEAL SIMPLE. EL MÉTODO DE LOS MÍNIMOS

CUADRADOS ORDINARIOS

2.1 Desarrollo del Método minimocuadrático.

2.2 Supuestos del método.

2.3 Propiedades de los estimadores minimocuadráticos: el teorema de Gauss- Markov.

2.4 Los coeficientes de correlación y de determinación.

2.5 Interpretación económica de los resultados. Significado de los parámetros obtenidos.

2.6 Formas funcionales de los modelos.

Función de regresión lineal simple. El método MCO.

1 Y

.t = a + bXt

2 y

t = a + bxt

3 Y

t= a + bxt + ut

4 Y

t = yt + ut

5 u

t = Yt - yt

6

S

(Incluir un ejemplo de determinantes de tres por tres)

Características:

I Los estimadores obtenidos (

Son puntuales (dan un solo valor).

II La línea de regresión que se obtiene pasa a través de las medias muestrales de X e Y (la

ecuación puede escribirse como

errores es cero y los errores no están relacionados con Y

estudio de la varianza)

Supuestos del método del modelo clásico de regresión lineal (MCRL).

El análisis de regresión es un análisis condicionado a los valores dados del o de los

regresores (exógenas) o simbólicamente: E(u

incluídos en el modelo no afectan sistemáticamente le valor de la media de Y.

1) Homoscedasticidad (igual varianza de los errores) var(u

para todas las observaciones (igual dispersión o igual varianza: las poblaciones de Y

correspondientes a diversos valores de X tienen la misma varianza. Si se cumple,

todos los valores de Y que corresponden a diversos valores de X serán igual de

confiables (cercanía o alejamiento con el cual están distribuídos los valores de Y

alrededor de sus medias). Todos los valores de Y corespondientes a diversos

valores de X son igualmente importantes.

2) No autocorrelación entre las perturbaciones (errores) (correlación=varianza

conjunta=covarianza). Simbólicamente:

Cov(u

Si la covarianza no fuera 0,querría decir que Y

u

a y b) MCO están expresados únicamente en términos de Y.`Y= a + `bX y `y =`Y ); además la media de lost ni con Xt . (lectura previa:t½Xt)=0, es decir, los factores que no estánt½Xt)=s2; varianza constantei,uj½Xi, Xj)=0t estaría dependiendo también det-1, puesto que este determina a ut.

(otros supuestos no tan importantes: n>k; los valores de X deben ser no todos iguales, pues

entre mayor sea la variación en X, mayor será la precisión con que Y puede ser estimada; a

medida que aumenta la muestra, también aumenta la precisión (la utilidad de lo anterior en

la medición de la precisión se verá en los problemas de inferencia estadística); el modelo

está correctamente especificado: ¿cuáles variables deben estar incluídas en el modelo?

¿cuál es la forma funcional correcta del modelo? Un sesgo de especificación: escoger la

forma funcional equivocada. Pero la teoría debe ser la base de la estimación, evitando los

modelo ad hoc. Todos los supuestos se cumplen en una FRP y no se duplican todos en la

FRM porque son supuestospara muestras grandes o asintóticas).

Ante un modelo con más de dos variables:

3) No multicolinealidad perfecta. En este supuesto se ve la utilidad de estudiar las

covarianzas entre los coeficientes estimados de la regresión.

Propiedades de los estimadores de mínimos cuadrados: el teorema de Gauss-Markov.

Un estimador se considera en mejor estimador lineal insesgado, si se cumple lo siguiente:

1 Es una función lineal de una variable aleatoria (Y).

2 Es insesgados: E(

3 Tiene varianza mínima: es eficiente (es decir, el mejor entre todo el conjunto de

estimadores lineales insesgados)

4 Consistente:

Teorema de Gauss- Markov: Dados los supuestos del MCRL, los estimadores de mínimos

cuadrados, dentro de la clase de los estimadores lineales insesgados, tienen varianza

mínima, es decir, son MELI. (checar propiedades en el libro).

Coeficiente de determinación y autocorrelación R

R

regresión (convendría pequeño cuestionario sobre la interpretación de R

en los errores. Tiene básicamente dos propiedades:

1 Cantidad no negativa.

2 Está entre 0 y 1.

Una cantidad estrechamente relacionada con r

es el coeficiente de correlación r = +

Sus características:

1 Puede tener signo positivo o negativo, dependiendo del sighno de covarianza

muestral de 2 variablesm, por tanto está entre –1 y +1.

2 Es simétrico: r

be) = b.be tiende a b cuando n tiende a N.2, medida de bondad de ajuste.2 mide la proporción o el porcentaje de la variación total en Y explicada por el modelo de2 y su contraparte2 pero conceptualmente muy diferente de ésteÖ r2 (coeficiente de correlación parcial).xy = r yx

3 Una r = 0 no necesariamente implica independencia estadística; pero si son

independientes su r es 0 (la r = 0 es necesaria pero no suficiente para la

independencia estadística).

4 Es medida sólo de asociación lineal, por lo que pierde sentido en relaciones no

lineales, además no implica relación de causalidad.

Interpretación económica de los resultados. Significado de los parámetros obtenidos.

Con respecto a la interpretación del intercepto, es necesario usar el sentido común para ello,

pues muy frecuentemente el intervalo muestral de los valores observados no contiene el

cero como uno de ellos; tal vez lo más indicado sea leerlo como el promedio del efecto

sobre Y de todas las variables omitidas en la regresión.

Formas funcionales de los modelos.

Modelos logarítmicos.

Semilogarítmico: log-lin. El coeficiente de la variable explicativa mide el cambio

proporcional constante, o relativo en Y para un cambio absoluto dado en X.

b

Cambio absoluto en X.

e = Cambio relativo en Y (multiplicado por 100, porcentual)

b

se denomina modelo de crecimiento (constante). Para la interpretación, es necesario

multiplicar

Semilogarítmico: lin-log. El coeficiente de la variable explicativa mide el cambio

absoluto en la variable dependiente, causado por un cambio porcentual en el regresor.

e = cambio porcentual o tasa de crecimiento. Cuando el regresor es el tiempo, el modelobe por 100.

b

cambio porcentual en X.

Es necesario dividir

e = Cambio absoluto en Ybe por 100 para leer en las unidades de Y.

Unidad 3. PRUEBAS DE INFERENCIA ESTADÍSTICA.

3.1 Intervalos de confianza para estimadores M.C.O.

3.2 Pruebas de hipótesis: la t de Student: significancia estadística de las variables

explicativas.

3.3 La predicción mediante modelos econométricos

Si el objetivo no es sólo la estimación puntual de los parámetros, sino también realizar

inferencias sobre la función de regresión poblacional, entonces debe suponerse que los

errores (u

regresión es estimar la FRP con base en la FRM, es decir, hacer inferencia sobre los

verdaderos valores de los parámetros; pero debido a fluctuaciones muestrales, el estimado

de la FRP es, en el mejor de los casos, una aproximación. Dado que los datos cambiarán de

una muestra a otra, los valores estimados cambiarán automáticamente, así que se necesita

una medida de confiabilidad de los estimadores

estándar de la distribución muestral de un estimador) mide la precisión de un valor

estimado. Dados los supuestos de Gauss, los errores estándar de los estimadores MCO se

pueden obtener así:

Var(

cuadrado de las desviaciones de X con respecto a su media). La varianza real de los errores

no puede ser calculada a partir de los datos, entonces, es necesario utilizar una

aproximación de ella. El estimador MCO de la verdadera

t) siguen alguna distribución de probabilidad. El objetivo principal del análisis dea y b. El error estándar (desviaciónbe) = s2/S(Xt -`X)2 (varianza homoscedástica de los errores sobre la sumatoria dels2 es el siguiente:

s

e

2

sumatoria de los errores al cuadrado dividida por los grados de libertad (para cualquier

número de regresores). Entonces, el error estándar: ee(

así:

ee(

El error estándar el la desviación estándar de los valores Y alrededor (+ o -) de la línea de

regresión estimada (media condicional de Y), el cual se usa frecuentemente como una

medida resumen de la <<bondad de ajuste>> de la línea Teniendo ya el error estándar,

puede hacerse ahora la estimación por intervalos, lo cual se trata de obtener un intervalo de

valores en el cual se encuentre el parámetro poblacional

de un estimador puntual se mide por su error estándar. En lugar de depender de un solo

estimador puntual, se puede construir un intervalo alrededor del estimador puntual, tal que

el intervalo tenga, por ejemplo, 95% de probabilidad de incluir el verdadero valor del

parámetro (siendo

arroje un valor de

numérico específico de

modo que la probabilidad de que

está). Si se conocen las distribuciones muestrales de los estimadores se pueden hacer

afirmaciones sobre los intervalos de confianza. La distribución de los estimadores MCO se

supone normal estándar . La distribución normal puede usarse para hacer afirmaciones

probabilísticas de

2= Suet/(n-k)be) = Övar(be), puede ser calculadobe) = se / Ö [S(Xt -`X)2]b. Sabemos que la confiabilidadbe aleatorio, pues no ha sido calculado en una muestra específica quebe). Una vez que se tenga una muestra específica y se obtenga un valorbe, el intervalo deja de ser aleatorio y se convierte en fijo, deb se encuentre en ese intervalo será de 0 o de 1 (está o nob si se conoce s2 (Teorema de Tchebycheff). Si se reemplaza s2 por

s

e

2, se obtiene la variable t de Student,(crítica o de tabla), la cual sigue la distribución t con

n-k

forma:

Pr[

grados de libertad, la cual puede usarse para construir un intervalo de confianza de labe - ta/2·ee(be) £ b £ be + ta/2·ee(be)] = 1 - a

Donde la amplitud del intervalo es proporcional al error estándar del estimador: a mayor

error estándar de

desconocido.

t

Interpretación si 1 -

casos (muestras) intervalos como (el anterior) contendrán el verdadero valor de

[Ejercicios de obtención de ee,

e

Prueba de hipótesis (p. 119)

Prueba de significancia de los coeficientes de la regresión, la prueba

Una prueba de significancia es un procedimiento mediante el cual se utilizan los resultados

muestrales para verificar la verdad o falsedad de una hipótesis nula.

Elementos:

H

H

Estadístico de prueba:

b mayor será la incertidumbre de estimar el verdadero valor del parámetroa/2 = valor de la t de Student a un nivel de significancia de a/2 (a a dos colas).a = 0.95: en el largo plazo (muestreo repetido) en 95 de cada 100b.s2, e intervalos de confianza.]t.0 : hipótesis nula, planteada o de investigación.A : hipótesis alterna, frente a la que se prueba la H0.tc

Bajo el supuesto de normalidad U

ee(

i~N(0,s2), la variable tc = be - b sigue la distribuciónbe)

t

Pasos a seguir:

1)Planteamiento de hipótesis:

H

H

2)Delimitación del área de no rechazo de la H

3)Calcular el valor

t

con n-k grados de libertad.0: b=0 (la variable con coeficiente b no es explicativa de la variable dependiente)A: ¹b00 y del área de rechazo.t=be - b

ee(

*Notas:

be)

§

241);

la prueba t para regresión múltiple se hace suponiendo muestras diferentes (pág.

§

aclarar bien cuándo una variable es aleatoria y cuándo no (b);

§

A medida que el valor de

mayor sea el valor absoluto de

Se dice que un estadístico es estadísticamente significativo, si el valor del estadístico de

prueba (

no estadísticamente significativo.

(págs. 122-125); (p. 126 5.8); regla práctica <<2-

selección de nivel de significancia,

Nivel exacto de significancia: valor

igual o mayor que la

probabilidad exacta de cometer un error de tipo I. Nivel de significancia más bajo al cual

puede rechazarse una H

valor

incluir las explicaciones de los errores de tipo I, tipo II y el valor p.b en la H0 se aleje del be,, el cociente (tc) será mayor; así que atc, será evidencia en contra de la H0.tc) cae en la región crítica o de rechazo (rechazo de H0) y, si pasa lo contrario, est>> p. 127; formación de las H0 y HA,p-value: p. 128-131.p. Probabilidad real de obtener un valor de la t de tablatc. También conocido como nivel exacto de significanciao la0. Se obtienen de los puntos porcentuales de la distribución t en ela que sería necesario para obtener el valor mayor o igual a tc..

(una cola y dos colas la estábamos tomando al revés, véase pie de pág. 791)

(establecer un orden lógico que debe de llevar las pruebas de los supuestos, la significancia,

la bondad, etc. para evaluar un modelo econométrico)

(leer p.137 5.12, antes de saber las violaciones a los supuestos).

En muestras pequeñas, las pruebas

3.3La predicción mediante modelos econométricos.

Después de obtener la regresión histórica (series de tiempo), uno de los usos puede ser

predecir el valor de la variable dependiente correspondiente a un valor de X dado. Hay dos

clases de predicciones: 1) la media condicional de Y

valor individual de Y

En e primer caso, la regresión proporciona una estimación puntual de la estimación media

dándole un valor a X. El error de predicción o de pronóstico se evalúa primero,

encontrando la distribución muestral de Y estimada (normalmente distribuida con media

igual a

e

t

una variable

confianza para la verdadera media de Y dado X.

t y F requieren el supuesto de normalidad.t correspondiente a Xt ; 2)predecir unt correspondiente a Xt (predicción media y predicción individual).b1 + b2X0) y con una varianza que, si se calcula en base a s2( de los u2) se obtienet con su distribución, misma que puede ser usada para construir intervalos de

UNIDAD 5: VIOLACIÓN A LOS SUPUESTOS MCO.

5.1 Autocorrelación. Origen, significado, consecuencias. Detección y corrección.

La autocorrelación es correlación entre miembros de series de observaciones ordenadas en

el tiempo o en el espacio. En presencia de autocorrelación y de heterocedasticidad, los

estimadores MCO dejan de ser MELI, pues ya no tienen varianza mínima.

Supesto de no autocorrelación:

E(u

Violación del supuesto:

E(u

Aquí, el término de perturbación relacionado con una opbservación cualquiera está

influenciado por el término de perturbación de cualquier otra observación.

(autocorrelación=correlación serial).

Dependiendo de cuál error esté influyendo en otro, será el

por su frecuencia es aquella donde un error influye sobre el inmediato posterior, es decir la

autocorrelación de primer orden. En presencia de autocorrelación se está violando el

supuesto de aleatoriedad y normalidad de los errores. Es generalmente más común en los

datos de series de tiempo, aunque también se presenta en datos de corte transversal. En el

análisis de corte transversal el ordenmiento de la información debe tener alguna lógica o

interés económico para dar sentido a cualquier determinación de si hay o no

autocorrelación.

¿Por qué se origina? Algunas razones son:

i,uj) = 0, i¹j.i,uj) ¹ 0, i¹j.<<orden>>. La más importante

§

económicos y según la etapa del ciclo en la que estén, puede marcarse una dirección

(observaciones sucesivas interdependientes).

Los datos económicos se mueven por inercia, por naturaleza presentan ciclos

§

Variables excluidas. Si un fenómeno se explica favorablemente con un número

variables, y por alguna razón se corre con

de la variable excluida se sume al efecto de la perturbación estocástica, por lo que

deja de ser tal.

Forma funcional incorrecta: al adaptar un modelo lineal a unos datos que no

presentan una dispersión lineal, los valores serán sobre y subestimados en diversos

momentos de la curva, y los errores reflejarán, como el caso anterior, la forma

funcional que debe aparecer.

Fenómeno de la telaraña: en situaciones de la economía donde un dato o fenómeno

surge efecto sobre otro después de un periodo de tiempo, no se esperan errores

aleatorios, porque los errores de un periodo modificarán el fenómeno del siguiente

(producen decisiones)

Rezagos. Si una variable es explicada también por el valor que obtuvo en un

periodo anterior y esto se ignora en el modelo, los errores de igual forma lo

reflejarán.

Consecuencias.

Si los errores se generan por un esquema autorregresivo de primer orden, es decir AR(1)

(poner), el valor p será el coeficiente de autocorrelación de primer orden. Es decir, el

desplazamiento de los errores consta de una parte de desplazamiento sistemático y una

parte aleatoria.

En presencia de autocorrelación, los estimadores MCO, aunque son lineales e insesgados y

consistentes, ya no son los mejores, pues su vaianza no es la mínima dentro de ese conjunto

de estimadores (disminuye la precisión de estimación, pues crece el error estándar del

parámetro. Por tanto, es probable que se declare a un coeficiente estadísticamente no

significativo aunque pueda serlo. (aclarar que el MCO no es el único método que existe y

que a veces es necesario usar otros, es decir, la máquina corrige los errores con otros

métodos).

Al usar el estimador MCO y su varianza definida:

1)es probable que se subestime la verdadera varianza residual y por tanto, R

de lo que debe ser en realidad.

2)las pruebas

conclusiones erróneas sobre la significancia estadística de los coeficientes de regresión

estimados.

Detección:

Método gráfico. Gaficar los residos obtenidos de la regresión frente al tiempo (gráfica de

secuencia de tiempo y obsevar si presenta un patrón sistemático (p. 408 y 395).

Prueba de rachas. Se anotan los signos (+ o -) de los residuales de la regresión. Cada

grupo de residuales del mismo signo cuanta como una racha, cuya longitud es el número de

elementos de ésta. Hay que hacer entonces una prueba de aleatoriedad de las rachas: ¿las

rachas observadas en el caso de n observaciones, son muchas o pocas en comparación con

el número de rachas esperadas en una secuencia de n observaciones estrictamente aleatoria?

Si hay muchas rachas, significa que los errores cambian de signo frecuentemente y denota

una autocorrelación negativa. Si hay muy pocas, puede sugerir positiva.

Sesgos de especificación:k dek-1, ello equivale a permitir que el efecto2 sea más altat y F dejan de ser válidas, pues al aplicarlas es probable que conduzcan a

Powered by Coranto
[an error occurred while processing this directive]