Шпаргалка по эконометрике

Автор работы: Пользователь скрыл имя, 05 Июня 2013 в 18:37, шпаргалка

Описание работы

Работа содержит ответы на вопросы для экзамена по эконометрике.

Файлы: 1 файл

Эконометрика билеты.docx

— 419.66 Кб (Скачать файл)

Пятое условие:   распределены независимо от   при  . Это условие предполагает отсутствие систематической связи между значениями случайного члена в любых двух наблюдениях. Если один случайный член велик и положителен в одном направлении, не должно быть систематической тенденции к тому, что он будет таким же великим и положительным (то же можно сказать и о малых, и об отрицательных остатках). Теоретическая ковариация   должна равняться нулю, поскольку  . Теоретические средние для   и   равны нулю в силу третьего условия теоремы. При невыполнении этого условия оценки, полученные по методу наименьших квадратов, будут также неэффективны.

 

Билет 19. Отбор  факторных признаков для включения  в модель множественной линейной регрессии.

  1. Частный коэффициент эластичности, показывает, на сколько % изменяется результирующая переменная при изменении Xj  на 1%.
  2. Бета-коэффициент, показывает, на какую часть величины среднего квадратического отклонения результирующей переменной, изменяется переменная Y при изменении фактора Xj на величину своего среднего квадратического отклонения.
  3. Коэффициент множественной детерминации, показывает какая доля дисперсии результирующей переменной Y,  учтена в модели множественной регрессии и обусловлена влиянием объясняющей переменной включенной в модель. 
  4. Подправленный на число регрессоров коэффициент детерминации.
  5. дельта-коэффициент, показывает долю влияния на результирующую переменную фактора Xj в суммарном влиянии всех объясняющих факторов.

 

Билет 20. Явление  мультиколлинеарности факторов в регрессионной  модели. Способы определения наличия  и отсутствия мультиколлинеарности.

 

Под Мультиколлинеарность понимается высокая взаимная коррелированность объясняющих переменных. Мультиколлинеарность может провялятся в функциональной и стохастической формах.

Точных способов определения наличия  мультиколлинеарности не существует. Один из подходов заключается в анализе  корреляционной матрицы между объясняющими переменными X1,X2,…..Xn и выявлении пар переменных, имеющих высокие коэффициенты корреляции (обычно больше 0,8). Если такие коэффициенты существуют, то говорят о наличии мультиколлинеарности.

Так же полезно находить коэффициент  множественной детерминации между  одной из объясняющих переменных и некоторой группой из них. Наличие  высокого множественного коэффициента детерминации (обычно больше 0,6) свидетельствует  о мультиколлинеарности.

Другой подход состоит в исследовании обратной матрицы. Если определитель матрицы  либо ее минимальное собственное  значение близко к 0, то говорят о  наличии мультиколлинеарности.

Метод главных компонент является одним из основных методов исключения переменных из модели множественной  регрессии.

Данный метод используется для  исключения или уменьшения мультиколлинеарности факторных переменных модели регрессии. Суть метода заключается в сокращении числа факторных переменных до наиболее существенно влияющих факторов. Это  достигается с помощью линейного  преобразования всех факторных переменных xi (i=0,…,n) в новые переменные, называемые главными компонентами, т. е. осуществляется переход от матрицы факторных переменных Х к матрице главных компонент F. При этом выдвигается требование, чтобы выделению первой главной компоненты соответствовал максимум общей дисперсии всех факторных переменных xi (i=0,…,n), второй компоненте – максимум оставшейся дисперсии, после того как влияние первой главной компоненты исключается и т. д.

Метод пошагового включения переменных состоит в выборе из всего возможного набора факторных переменных именно те, которые оказывают существенное влияние на результативную переменную.

Метод пошагового включения осуществляется по следующему алгоритму:

1) из всех факторных переменных  в модель регрессии включаются  те переменные, которым соответствует  наибольший модуль линейного  коэффициента парной корреляции  с результативной переменной;

2) при добавлении в модель  регрессии новых факторных переменных  проверяется их значимость с  помощью F-критерия Фишера. При  том выдвигается основная гипотеза  о необоснованности включения  факторной переменной xk в модель множественной регрессии. Обратная гипотеза состоит в утверждении о целесообразности включения факторной переменной xk в модель множественной регрессии. Критическое значение F-критерия определяется как Fкрит(a;k1;k2), где а – уровень значимости, k1=1 и k2=n–l – число степеней свободы, n – объём выборочной совокупности, l – число оцениваемых по выборке параметров. Наблюдаемое значение F-критерия рассчитывается по формуле:

где q – число уже включённых в модель регрессии факторных переменных.

При проверке основной гипотезы возможны следующие ситуации.

Если наблюдаемое значение F-критерия (вычисленное по выборочным данным) больше критического значения F-критерия (определённого по таблице распределения  Фишера-Снедекора), т. е. Fнабл›Fкрит, то основная гипотеза о необоснованности включения факторной переменной xk в модель множественной регрессии отвергается. Следовательно, включение данной переменной в модель множественной регрессии является обоснованным.

Если наблюдаемое значение F-критерия (вычисленное по выборочным данным) меньше или равно критического значения F-критерия (определённого по таблице  распределения Фишера-Снедекора), т. е. Fнабл<=Fкрит, то основная гипотеза о необоснованности включения факторной переменной xk в модель множественной регрессии принимается. Следовательно, данную факторную переменную можно не включать в модель без ущерба для её качества

3) проверка факторных переменных  на значимость осуществляется  до тех пор, пока не найдётся  хотя бы одна переменная, для  которой не выполняется условие Fнабл›Fкрит.

 

 

 

 

 

 

 

 

 

Билет 21. Метод  наименьших квадратов для оценивания параметров модели множественной линейной регрессии. Матричная форма системы  нормальных уравнений. Решение системы  нормальных уравнений в матричной  форме.

 

В общем виде линейную модель множественной  регрессии можно записать следующим  образом:

yi=β0+β1x1i+…+βmxmi+εi,

где yi – значение i-ой результативной переменной,

x1i…xmi – значения факторных переменных;

β0…βm – неизвестные коэффициенты модели множественной регрессии;

εi – случайные ошибки модели множественной регрессии.

В результате оценивания данной эконометрической модели определяются оценки неизвестных  коэффициентов. Классический подход к  оцениванию параметров линейной регрессии  основан на методе наименьших квадратов (МНК). Суть метода наименьших квадратов  состоит в том, чтобы найти  такой вектор β оценок неизвестных коэффициентов модели, при которых сумма квадратов отклонений (остатков) наблюдаемых значений зависимой переменной у от расчётных значений ỹ (рассчитанных на основании построенной модели регрессии) была бы минимальной.

Матричная форма функционала F метода наименьших квадратов:

где

– случайный вектор-столбец значений результативной переменной размерности (n*1);

– матрица значений факторной переменной размерности (n*(m+1)). Первый столбец является единичным, потому что в модели регрессии коэффициент β0 умножается на единицу;

В процессе минимизации функции (1) неизвестными являются только значения коэффициентов β0…βm, потому что значения результативной и факторных переменных известны из наблюдений. Для определения минимума функции (1) необходимо вычислить частные производные этой функции по каждому из оцениваемых параметров и приравнять их к нулю. Результатом данной процедуры будет стационарная система уравнений для функции (1):

где

– вектор-столбец неизвестных коэффициентов модели регрессии размерности ((m+1)*1);

Общий вид стационарной системы  уравнений для функции (1):

Решением стационарной системы  уравнений будут МНК-оценки неизвестных  параметров линейной модели множественной  регрессии:

Оценим с помощью метода наименьших квадратов неизвестные параметры  линейной модели двухфакторной регрессии:

yi=β0+β1x1i+β2x2i+εi,

где

Чтобы рассчитать оценки неизвестных  коэффициентов β0,β1 и β2 данной двухфакторной модели регрессии, необходимо минимизировать функционал F вида:

Для определения экстремума функции  нескольких переменных, частные производные  по этим переменным приравниваются к  нулю. Результатом данной процедуры  будет стационарная система уравнений  для модели множественной линейной регрессии с двумя переменными:

В результате элементарных преобразований данной стационарной системы уравнений  получим систему нормальных уравнений:

Данная система называется системой нормальных уравнений относительно коэффициентов

для модели регрессии yi=β0+β1x1i+β2x2i+εi.

Полученная система нормальных уравнений является квадратной, т. к. количество уравнений равняется  количеству неизвестных переменных, поэтому коэффициенты

можно рассчитать с помощью метода Крамера или метода Гаусса.

Рассмотрим подробнее метод  Крамера решения квадратных систем нормальных уравнений.

Единственное решение квадратной системы линейных уравнений определяется по формуле:

где Δ – основной определитель квадратной системы линейных уравнений;

Δj – определитель, полученный из основного определителя путём замены j-го столбца на столбец свободных членов.

При использовании метода Крамера возможно возникновение следующих ситуаций:

1) если основной определитель  системы Δ равен нулю и все определители Δjтакже равны нулю, то данная система имеет бесконечное множество решений;

2) если основной определитель  системы Δ равен нулю и хотя бы один из определителей Δjтакже равен нулю, то система решений не имеет.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Билет 23 . проверки адекватности модели множественной линейной регрессии эмпирическим данным. 

Качество модели регрессии связывают с адекватностью модели наблюдаемым (эмпирическим) данным. Проверка адекватности (или соответствия) модели регрессии наблюдаемым данным проводится на основе анализа остатков -  . 
 
Анализ остатков позволяет получить представление, насколько хорошо подобрана сама модель и насколько правильно выбран метод оценки коэффициентов. Согласно общим предположениям регрессионного анализа, остатки должны вести себя как независимые (в действительности, почти независимые) одинаково распределенные случайные величины.  
 
Качество модели регрессии оценивается по следующим направлениям:

  1. проверка качества всего уравнения регрессии;
  2. проверка значимости всего уравнения регрессии;
  3. проверка статистической значимости коэффициентов уравнения регрессии;
  4. 4.проверка выполнения предпосылок МНК.

При анализе качества модели регрессии, в первую очередь, используется коэффициент  детерминации, который определяется следующим образом: 
 
 
 , (2.5) 
 
где   - среднее значение зависимой переменной, 
 
 - предсказанное (расчетное) значение зависимой переменной. 
 
^ Коэффициент детерминации показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т. е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов. Чем ближе   к 1, тем выше качество модели. 
 
Для оценки качества регрессионных моделей целесообразно также использовать коэффициент множественной корреляции (индекс корреляции) R 
 
R =  =   (2.6) 
 
Данный коэффициент является универсальным, так как он отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. Важным моментом является проверка значимости построенного уравнения в целом и отдельных параметров. 
Оценить значимость уравнения регрессии – это означает установить, соответствует ли математическая модель, выражающая зависимость между Y и Х, фактическим данным и достаточно ли включенных в уравнение объясняющих переменных Х для описания зависимой переменной Y. Оценка значимости уравнения регрессии производится для того, чтобы узнать, пригодно уравнение регрессии для практического использования (например, для прогноза) или нет. 

Для проверки значимости модели регрессии используется F-критерий Фишера. Если расчетное значение с n1= k и n= (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой. 
 
 (2.7)  
 
В качестве меры точности применяют несмещенную оценку дисперсии остаточной компоненты, которая представляет собой отношение суммы квадратов уровней остаточной компоненты к величине (n- k -1), где k – количество факторов, включенных в модель. Квадратный корень из этой величины ( ) называется стандартной ошибкой: 
 
 
 (2.8) 
 
 
значимость отдельных коэффициентов регрессии проверяется по t-статистике путем проверки гипотезы о равенстве нулю j-го параметра уравнения (кроме свободного члена): 
 
, (2.9) 
 
где Saj — это стандартное (среднеквадратическое) отклонение коэффициента уравнения регрессии aj. Величина Saj представляет собой квадратный корень из произведения несмещенной оценки дисперсии  и j -го диагонального элемента матрицы, обратной матрице системы нормальных уравнений. 
 
 
 
где   - диагональный элемент матрицы  . 
 
Если расчетное значение t-критерия с (n - k - 1) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели (при этом ее качество не ухудшится).

Информация о работе Шпаргалка по эконометрике