Автор работы: Пользователь скрыл имя, 17 Мая 2013 в 05:06, курсовая работа
Цель курсовой работы: исследование влияния социально-экономических показателей на объем инвестиций в основной капитал на душу населения.
Задачами данной работы являются:
Построить МНК-оценки коэффициентов линейной модели множественной регрессии и провести ее исследование.
Провести анализ построенной линейной модели множественной регрессии на наличие/отсутствие мультиколлинеарности; в случае необходимости устранить мультиколлинеарность.
Введение…………………………………………………………………………6
1 Классическая модель множественной регрессии……………………………..8
1.1 Понятие классической линейной модели множественной регрессии……..8
1.2 Оценка коэффициентов КЛММР методом наименьших квадратов……….9
1.3 Проверка гипотезы о значимости уравнения множественной регрессии…………………...…………………………………………………….10
2 Исследование модели на мультиколлинеарность……………………..…….14
3 Исследование модели на гетероскедастичность…………………………….16
3.1 Понятие гетероскедастичности……………………………………………..16
3.2 Тесты на гетероскедастичность…………………………………………….17
3.2.1 Тест ранговой корреляции Спирмана…………...………………..............17
3.2.2 Тест Голдфелда—Квандта………………………………………………...19
3.3 Несмещенная оценка ковариационной матрицы оценок коэффициентов регрессии………………………………………………………...……………….20
3.3.1 Стандартные ошибки в форме Уайта………………...…………………..20
3.3.2 Стандартные ошибки в форме Ньюи-Веста……………………………...21
4 Исследование модели на наличие автокорреляции регрессионных остатков…………………………………………………………………………..23
Заключение……………………………………………………………………….25
Список использованных источников…………………………………………...26
Приложение А…………………………………………………………………....27
Наличие гетероскедастичности можно предположить по графику зависимости остатков от упорядоченных по возрастанию значений той объясняющей переменной, вариацией которой возможно порождается гетероскедастичность. Для построения графика можно воспользоваться MS Excel.
Рисунок 4- График зависимости модуля значений регрессионных остатков и значений объясняющей переменной
На графике видно, что модули регрессионных остатков имеют тенденцию к росту при увеличении значений объясняющей переменной. Следовательно, можно заподозрить гетероскедастичность по переменной x4. Кроме визуального анализа, существуют различные критерии (тесты) с помощью которых выявляется гетероскедастичность.
3.2 Тесты на гетероскедастичность
3.2.1 Тест Ранговой корреляции Спирмана
Будем считать, что абсолютные величины остатков регрессии являются оценками , поэтому в случае гетероскедастичности абсолютные величины остатков и значения регрессоров будут коррелированы.
Для нахождения коэффициента ранговой корреляции следует ранжировать наблюдения по значениям переменной и остатков и вычислить по формуле [1]
где – разность между рангами значений и .
Используя MS Excel вычислим коэффициент ранговой корреляции Спирмана.
Рисунок 5 – Результат вычисления коэффициент ранговой корреляции Спирмана
Таким образом, . Проверим гипотезу о значимости коэффициента ранговой корреляции Спирмана.
(нет гетероскедастичности),
(есть гетероскедастичность).
Коэффициент ранговой корреляции значим на уровне значимости α при n > 10, если статистика распределенная по закону Стьюдента с n-2 степенями свободы
В данном случае , а . Таким образом, гипотеза отвергается, то есть коэффициент ранговой корреляции Спирмана значим. Данная модель обладает гетероскедастичностью остатков.
3.2.2 Тест Голдфелда—Квандта
Предположим наличие прямой зависимости дисперсии остатков от величины от сальдированного финансового результата на одно предприятие.
Рассмотрим следующие гипотезы:
(регрессионные остатки гомоскедастичны);
регрессионные остатки гетероскедастичны.
Для проверки данных гипотез выполним следующие действия [2]:
После выполнения вышеописанных действий нами были получены следующие модели регрессии
Таблица 3. Оценки коэффициентов регрессии, их среднеквадратичные отклонения и t-статистики для моделей регрессии построенных по выборкам первых и последних наблюдений
I модель |
II модель | |||||
i |
||||||
1 |
-183,605 |
165,889 |
-1,107 |
31,016 |
28,282 |
1,097 |
2 |
-1736,41 |
4965,024 |
-0,35 |
3,412 |
444,522 |
0,0077 |
3 |
0,264 |
0,124 |
2,133 |
3,341 |
1,449 |
2,306 |
4 |
0,0059 |
0,00089 |
6,615 |
-0,018 |
0,025 |
-0,7499 |
5 |
112,918 |
106,231 |
1,063 |
-95,2 |
72,191 |
-1,319 |
Сравнивая t-статистики с табличным значением можно сделать вывод, что для первой модели значим только регрессор , а для второй .
F-статистика для проверки гипотезы о гомоскедастичности остатков равна: F=14,307. И так как , гипотеза об отсутствии гетероскедастичности остатков отвергается.
3.3 Несмещенная оценка ковариационной матрицы оценок коэффициентов регрессии
3.3.1 Стандартные ошибки в форме Уайта
Так как, оценки коэффициентов регрессии полученные классическим методом наименьших квадратов состоятельны, а оценка ковариационной матрицы оценок коэффициентов регрессии не состоятельная и смещенная, найдем ее не смещенную оценку.
Предположим, что Ω, матрица ковариации вектора ошибок ε, диагональная. Тогда оценка матрицы ковариаций оценок коэффициентов регрессии рассчитывается по формуле
Для расчета матрицы был написан скрипт на языке Visual Basic for Applications (VBA) в MS Excel. Листинг, которого приведен в приложении А.
Таким образом матрица ковариации приведена в Таблице 4.
Таблица 4. Оценка матрицы ковариаций оценок коэффициентов регрессии
Номер регрессора |
1 |
2 |
3 |
4 |
5 |
1 |
745,749 |
-394,657 |
0,342 |
-0,00016 |
-90,3996 |
2 |
-394,657 |
153465,532 |
-3,452 |
0,0086 |
564,458 |
3 |
0,342 |
-3,452 |
0,0077 |
0,0000041 |
-1,323 |
4 |
-0,00016 |
0,0086 |
0,0000041 |
0,000000187 |
-0,018 |
5 |
-90,3996 |
564,458 |
-1,323 |
-0,018 |
3822,919 |
3.3.2 Стандартные ошибки в форме Ньюи-Веста
Для случая, когда в матрице Ω ковариаций ошибок ε ненулевые элементы стоят не только на главной диагонали, но и на соседних диагоналях, отстоящих от главной не более чем на L оценка матрицы ковариаций оценок коэффициентов регрессии рассчитывается как:
где весовые коэффициенты берутся по методу Перзен
В качестве оценки L возьмем рекомендуемую
Для расчета матрицы был написан скрипт на языке Visual Basic for Applications (VBA) в MS Excel. Листинг, которого приведен в приложении А.
В результате получим следующую оценку матрицы ковариаций оценок коэффициентов регрессии.
Таблица 5. Оценка матрицы ковариаций оценок коэффициентов регрессии
Номер регрессора |
1 |
2 |
3 |
4 |
5 |
1 |
727,342 |
-486,129 |
0,141 |
0,002 |
-100,239 |
2 |
-486,129 |
136602,323 |
-3,854 |
0,026 |
-3178,646 |
3 |
0,141 |
-3,854 |
0,0056 |
0,0000031 |
-0,971 |
4 |
0,002 |
0,026 |
0,0000031 |
0,00000012 |
-0,016 |
5 |
-100,239 |
-3178,646 |
-0,971 |
-0,016 |
3678,584 |
4 Исследование модели на наличие автокорреляции регрессионных остатков
При анализе
временных рядов часто
Для визуального анализа
Рисунок 6 – Регрессионные остатки
По графику регрессионных остатков можно предположить отсутствие в регрессионных остатках автокорреляции.
Кроме визуального анализа, существует критерий Дарбина-Уотсона, с помощью которого выявляется автокорреляции первого порядка.
Предполагается,
что регрессионные остатки
где - коэффициент корреляции между регрессионными остатками, - случайная величина, которая удовлетворяет всем условиям Гаусса-Маркова.
Рассмотрим следующие гипотезы:
автокорреляция
остатков регрессии
наличие автокорреляции остатков регрессии.
Для проверки данной гипотезы будем использовать статистику Дарбина-Уотсона [1]:
Для полученной нами модели d=2,262 , что, в силу того, что для 1% уровня значимости при количестве наблюдений n=47 и количестве регрессоров p=5, и так как , свидетельствует, что гипотеза об отсутствии автокорреляции остатков регрессии принимается, что не удивительно, так как выборка данных пространственная.
Заключение
В результате данной курсовой работы было получено уравнение регрессии, которое не подтвердилось на наличие автокорреляции, но в ней присутствует гетероскедастичность остатков.
Регрессионная зависимость объема инвестиций в основной капитал на душу населения от различных факторов описывается множественным уравнением регрессии:
(0,0758) (0,00056)
Уравнение оказалось значимым, коэффициент при объясняющей переменной так же значим, поэтому можно сделать вывод, что увеличение среднегодовой численности работников, занятых в промышленности на 1 человека увеличит объем инвестиций в основной капитал на душу населения на 0,292 рубля. А увеличение сальдированного финансового результата (прибыль минус убыток) на одно предприятие на 1 рубль увеличит объем инвестиций в основной капитал на душу населения на 0,006 рублей.
R2=0,817 обозначает, что вариация результативного признака на 81,7% объясняется вошедшим в модель фактором, а остальные 18,3% не учтенными в модели факторами.
Список использованных источников
Приложение А.
Скрипт на языке Visual Basic for Applications (VBA) для расчета матрицы используемой в вычислении стандартной ошибки в форме Уайта для модели с гетероскедастичностю.
Sub Wait()
Dim i As Integer
Dim j As Integer
Dim s As Integer
Dim X(1 To 6, 1 To 47) As Double
Dim e2(1 To 47) As Double
Dim Res(1 To 6, 1 To 6) As Double
For i = 1 To 47
e2(i) = CDbl(ActiveCell.Offset(i - 1, 7))
For j = 1 To 6
X(j, i) = CDbl(ActiveCell.Offset(i - 1, j - 1))
Next j
Next i
Dim sum As Double
For i = 1 To 6
For j = 1 To 6
sum = 0
For s = 1 To 47
sum = sum + e2(s) * X(i, s) * X(j, s)
Next s
Res(i, j) = sum
Next j
Next i
For i = 1 To 6
For j = 1 To 6
ActiveCell.Offset(55 + i, j - 1) = Res(i, j)
Next j
Next i
End Sub
Скрипт на языке Visual Basic for Applications (VBA) для расчета матрицы используемой в вычислении стандартной ошибки в форме Ньюи-Веста для модели с гетероскедастичностю.
Sub NewWest()
Dim i As Integer
Dim j As Integer
Dim s As Integer
Dim L As Integer
Dim w As Double
L = 3
Dim X(1 To 6, 1 To 47) As Double
Dim e2(1 To 47) As Double
Dim Res(1 To 6, 1 To 6) As Double
For i = 1 To 47
e2(i) = CDbl(ActiveCell.Offset(i - 1, 7))
For j = 1 To 6
X(j, i) = CDbl(ActiveCell.Offset(i - 1, j - 1))
Next j
Next i
Dim sum1 As Double
Dim sum2 As Double
For i = 1 To 6
For j = 1 To 6
sum1 = 0
sum2 = 0
Информация о работе Классическая модель множественной регрессии