Отбор факторов в модель множественной регрессии

Автор работы: Пользователь скрыл имя, 16 Января 2014 в 22:42, реферат

Описание работы

Невозможность использования «классических» подходов при построении эконометрических моделей в условиях плохой обратимости матрицы (X¢X) обусловливает необходимость применения при оценке их параметров специальных процедур и методов, которые позволяют снизить отрицательное влияние высокой корреляции между объясняющими переменными на точность и достоверность получаемых оценок.
Целью данной работы является изучение проблем мультиколлинеарности в регрессионных моделях, исследование некоторых приемов и методов оценки коэффициентов эконометрической модели в условиях сильной корреляционной зависимости (мультиколлинеарности) между объясняющими переменными и применение их в конкретных практических ситуациях.

Содержание работы

Введение
3
Глава 1. Причины возникновения, признаки обнаружения и методы устранения мультиколлинеарности
4
Установление наличия мультиколлинеарности
4
Причины возникновения мультиколлинеарности и её последствия
6
Методы устранения мультиколлинеарности
8
Глава 2. Отбор факторов в модель множественной регрессии
12
Метод исключения факторов
12
Пошаговый регрессионный анализ
17
Заключение
22
Литература

Файлы: 1 файл

nauchnaya_rabota_Beschastnoy_A.doc

— 394.00 Кб (Скачать файл)

Значение R2  возьмем из таблицы 3.

Анализ бета и дельта-коэффициентов показывает, что на объем реализации продукции наибольшее влияние из двух исследуемых факторов оказывает фактор – цена продукции, так как фактору соответствуют наибольшие (по абсолютной величине) значения коэффициентов [2].

    1. Пошаговый регрессионный анализ

На практике о наличии мультиколлинеарности обычно судят по матрице парных коэффициентов корреляции. Если один из элементов матрицы R больше 0,8, т. е. , то считают, что имеет место мультиколлинеарность и в уравнение регрессии следует включать только один из показателей xi или xj.

Чтобы избавиться от этого негативного явления, обычно используют алгоритм пошагового регрессионного анализа или строят уравнение  регрессии на главных компонентах. Рассмотрим применение этого алгоритма  на примере.

По данным n=20 сельскохозяйственных районов требуется построить регрессионную модель урожайности на основе следующих показателей:

y – урожайность  зерновых культур (ц/га);

x1 – число колесных тракторов (приведенной мощности) на 100 га;

x2 – число зерноуборочных комбайнов на 100 га;

x3 – число орудий поверхностной обработки почвы на 100 га;

x4 – количество удобрений, расходуемых на гектар;

x5 – количество химических средств оздоровления растений, расходуемых на гектар.

Исходные данные для анализа приведены в таблице.

Таблица4.Исходные данные для анализа

Номер наблюдения

y

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

9.70

8.40

9.00

9.90

9.60

8.60

12.50

7.60

6.90

13.50

9.70

10.70

12.10

9.70

7.00

7.20

8.20

8.40

13.10

8.70

1.59

0.34

2.53

4.63

2.16

2.16

0.68

0.35

0.52

3.42

1.78

2.40

9.36

1.72

0.59

0.28

1.64

0.09

0.08

1.36

0.26

0.28

0.31

0.40

0.26

0.30

0.29

0.26

0.24

0.31

0.30

0.32

0.40

0.28

0.29

0.26

0.29

0.22

0.25

0.26

2.05

0.46

2.46

6.44

2.16

2.69

0.73

0.42

0.49

3.02

3.19

3.30

11.51

2.26

0.60

0.30

1.44

0.05

0.03

1.17

0.32

0.59

0.30

0.43

0.39

0.32

0.42

0.21

0.20

1.37

0.73

0.25

0.39

0.82

0.13

0.09

0.20

0.43

0.73

0.99

0.14

0.66

0.31

0.59

0.16

0.17

0.23

0.08

0.08

0.73

0.17

0.14

0.38

0.17

0.35

0.15

0.08

0.20

0.20

0.42


 

Предварительно, с целью анализа взаимосвязи  показателей построена таблица  парных коэффициентов корреляции R.

y

1.00

0.43

0.37

0.40

0.58

0.33

0.43

1.00

0.85

0.98

0.11

0.34

0.37

0.85

1.00

0.88

0.03

0.46

0.40

0.98

0.88

1.00

0.03

0.28

0.58

0.11

0.03

0.03

1.00

0.57

0.33

0.34

0.46

0.28

0.57

1.00


 

Анализ матрицы  парных коэффициентов корреляции показывает, что результативный показатель наиболее тесно связан с показателем х4 – количеству удобрений, расходуемых на гектар ( ).

В то же время связь между признаками-аргументами достаточно тесная. Так, существует практически функциональная связь между числом колесных тракторов х1 и числом орудий поверхностной обработки почвы х3 .

О наличии мультиколлинеарности свидетельствуют также коэффициенты корреляции и .

Чтобы продемонстрировать отрицательное влияние мультиколлинеарности, рассмотрим регрессионную модель урожайности, включив в нее все исходные показатели:

                             (-0.01)       (0.72)       (0.13)       (2.90)      (-0.95)

В скобках указаны  - расчетные значения t – критерия для проверки гипотезы о значимости коэффициента регрессии Н0. Критическое значение tтабл.=1.76 найдено по таблице t – распределения при уровне значимости α = 0,1 и числе степеней свободы 14. Из уравнения следует, что статистически значимым является коэффициент регрессии только при х4, так как . Не поддаются экономической интерпретации отрицательные знаки коэффициентов регрессии при х1 и х5, из чего следует, что повышение насыщенности сельского хозяйства колесными тракторами х1 и средствами оздоровления растений х5 отрицательно сказывается на урожайности. Таким образом, полученное уравнение регрессии не приемлемо.

После реализации алгоритма пошагового регрессионного анализа с исключением переменных и учетом того, что в уравнение  должна войти только одна из трех тесно  связанных переменных х12 и х3, получаем окончательное уравнение регрессии:

                             (11.12)     (2.09)        (3.02)

В данное уравнение  включен x1,как определяющий из трех показателей.

Уравнение значимо  при α=0.05, т.к. =266 > =3.20, найденного по таблице F-распределения при α=0.05; γ1=3 и γ2=17. Значимы и все коэффициенты регрессии b1 и b4 в уравнении   (α=0,05; ν=17). Коэффициент регрессии b1 следует признать значимым (b1≠0) из экономических соображений, при этом лишь незначительно меньше . При α = 0,1 и b1 статистически значим. Из уравнения регрессии следует, что увеличение на 1 числа тракторов на 100 га пашни приводит к росту урожайности зерновых в среднем на 0,345 ц/га (b1=0,345).

Коэффициенты  эластичности Э1=0,068 и Э2=0,161 показывают, что при увеличении показателей х1 и х4 на 1% урожайность зерновых повышается соответственно на 0.068% и 0.161%, . Множественный коэффициент детерминации свидетельствует о том, что только 46,9% вариации урожайности объясняется вошедшими в модель показателями х1 и х4, то есть насыщенностью растениеводства тракторами и удобрениями. Остальная часть вариации обусловлена действием неучтенных факторов х2, х3, х5. Средняя относительная ошибка аппроксимации характеризует адекватность модели, также как и величина остаточной дисперсии [5].

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Заключение.

В работе рассмотрены проблемы мультиколлинеарности в регрессионных моделях, причины возникновения, признаки обнаружения и методы для устранения или уменьшения мультиколлинеарности. На практике решать проблему мультиколлинеарности путем исключения части взаимосвязанных между собой   независимых переменных часто бывает нецелесообразно, поскольку, их взаимосвязь может отражать явление ложной корреляции, а не вытекать из содержания отображаемых ими явлений. При этом каждая из этих переменных может быть чрезвычайно важна для выражения закономерностей развития независимой переменной [1].

Предложен алгоритм, метода пошагового включения факторов, реализующий отбор информативных признаков по показателям мультиколлинеарности. Проведен обзор некоторых подходов к снижению факторного пространства и проведены эксперименты по исследованию эффективности методов устранения мультиколлинеарности.

Приведены конкретные примеры, подтвердившие предположение о том, что при отбрасывании признаков по показателям мультиколлинеарности исключаются области, имеющие заметную корреляцию. В работе проведены исследования, связанные с применением показателей мультиколлинеарности в задачах регрессионного анализа. Показана возможность повышения качества регрессионной модели.

 

 

 

 

 

 

 

Литература

1. Айвазян, С.А. Прикладная статистика и основы эконометрики: / С.А. Айвазян, В.С. Мхитарян – М.: ЮНИТИ, 1998.- С.1022.

2. Гореева, Н.М. Эконометрика: /Н.М. Гореева, Л.Н. Демидова, Л.М. Клизогуб, С.А. Орехов, Н.А. Сердюкова, С.Т. Швецова // Учебное пособие в схемах и таблицах. – М.: Эксмо, 2008. – С. 224.

3. Кремер, Н.Ш. Эконометрика:/ Н.Ш. Кремер, Б.А. Путко - М.: Юнити-Дана, 2010. – С. 328.

4. Магнус, Я.Р. Эконометрика: /Я.Р. Магнус, П.К. Катышев, А.А. Пересецкий // Начальный курс 3-е изд.- М.: Дело, 1997.- С.400.

5. Мхитарян, В.С. Эконометрика: / В.С. Мхитарян, М.Ю.Архипова, В.П. Сиротин // Учебно-методический комплекс. – М.: Изд. центр ЕАОИ, 2008. – С. 144.

6. Орлов, А. И. Эконометрика: / А. И. Орлов – М.: Феникс, 2009. – С. 576.

7. Яковлева, А.В. Эконометрика. Конспект лекций:/ А.В. Яковлева – М.: ЮНИТИ, 2008.- С. 224.

 


Информация о работе Отбор факторов в модель множественной регрессии