Автор работы: Пользователь скрыл имя, 22 Февраля 2014 в 15:11, контрольная работа
Задание:
По 20 предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс. руб.) от ввода в действие новых основных фондов x1 (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих x2 (%) 
(p1 = 6, p2 = 8).
Требуется:
1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
4. С помощью F-критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации R_(yx_1 x_2)^2.
5. С помощью t-критерия Стьюдента оценить статистическую значимость параметров чистой регрессии.
6. С помощью частных F -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора x1 после x2 и фактора x2 после x1 .
7. Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.
8. Проверить вычисления в MS Excel.
Министерство образования и науки РФ
Хакасский технический институт –
 филиал федерального 
государственного автономного 
«Сибирский федеральный университет»
КОНТРОЛЬНАЯ РАБОТА ПО ЭКОНОМЕТРИКЕ
Выполнил: студент
заочного факультета
специальности
экономика (3,5)
Букатова П. А.
Проверил: кандидат
экономических наук, доцент
Ивановская Т.И.
Абакан – 2013
Задание
По 20 предприятиям региона 
изучается зависимость 
(p1 = 6, p2 = 8).
| Номер предприятия | y | x1 | x2 | Номер предприятия | y | x1 | x2 | 
| 1 | 7,0 | 4,2 | 11,0 | 11 | 9,0 | 6,8 | 21,0 | 
| 2 | 7,0 | 3,7 | 13,0 | 12 | 11,0 | 6,4 | 22,0 | 
| 3 | 7,0 | 3,9 | 15,0 | 13 | 9,0 | 6,9 | 22,0 | 
| 4 | 7,0 | 4,0 | 17,0 | 14 | 11,0 | 7,2 | 25,0 | 
| 5 | 7,0 | 4,4 | 18,0 | 15 | 12,0 | 7,2 | 28,0 | 
| 6 | 7,0 | 4,8 | 19,0 | 16 | 12,0 | 8,2 | 29,0 | 
| 7 | 8,0 | 5,3 | 19,0 | 17 | 12,0 | 8,1 | 30,0 | 
| 8 | 8,0 | 5,4 | 20,0 | 18 | 12,0 | 8,6 | 31,0 | 
| 9 | 8,0 | 5 | 20,0 | 19 | 14,0 | 9,6 | 32,0 | 
| 10 | 10,0 | 6,8 | 21,0 | 20 | 14,0 | 9,8 | 36,0 | 
Требуется:
1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
4. С помощью F-критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .
5. С помощью t-критерия Стьюдента оценить статистическую значимость параметров чистой регрессии.
6. С помощью частных F -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора x1 после x2 и фактора x2 после x1 .
7. Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.
8. Проверить вычисления в MS Excel.
Решение
Для удобства проведения расчетов занесу результаты промежуточных расчетов в таблицу:
Таблица 1
| № | y | ||||||||
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 
| 1 | 7,0 | 4,2 | 11,0 | 29,4 | 77 | 46,2 | 17,64 | 121 | 49 | 
| 2 | 7,0 | 3,7 | 13,0 | 25,9 | 91 | 48,1 | 13,69 | 169 | 49 | 
| 3 | 7,0 | 3,9 | 15,0 | 27,3 | 105 | 58,5 | 15,21 | 225 | 49 | 
| 4 | 7,0 | 4,0 | 17,0 | 28 | 119 | 68 | 16 | 289 | 49 | 
| 5 | 7,0 | 4,4 | 18,0 | 30,8 | 126 | 79,2 | 19,36 | 324 | 49 | 
| 6 | 7,0 | 4,8 | 19,0 | 33,6 | 133 | 91,2 | 23,04 | 361 | 49 | 
| 7 | 8,0 | 5,3 | 19,0 | 42,4 | 152 | 100,7 | 28,09 | 361 | 64 | 
| 8 | 8,0 | 5,4 | 20,0 | 43,2 | 160 | 108 | 29,16 | 400 | 64 | 
| 9 | 8,0 | 5 | 20,0 | 40 | 160 | 100 | 25 | 400 | 64 | 
| 10 | 10,0 | 6,8 | 21,0 | 68 | 210 | 142,8 | 46,24 | 441 | 100 | 
| 11 | 9,0 | 6,8 | 21,0 | 61,2 | 189 | 142,8 | 46,24 | 441 | 81 | 
| 12 | 11,0 | 6,4 | 22,0 | 70,4 | 242 | 140,8 | 40,96 | 484 | 121 | 
| 13 | 9,0 | 6,9 | 22,0 | 62,1 | 198 | 151,8 | 47,61 | 484 | 81 | 
| 14 | 11,0 | 7,2 | 25,0 | 79,2 | 275 | 180 | 51,84 | 625 | 121 | 
| 15 | 12,0 | 7,2 | 28,0 | 86,4 | 336 | 201,6 | 51,84 | 784 | 144 | 
| 16 | 12,0 | 8,2 | 29,0 | 98,4 | 348 | 237,8 | 67,24 | 841 | 144 | 
| 17 | 12,0 | 8,1 | 30,0 | 97,2 | 360 | 243 | 65,61 | 900 | 144 | 
| 18 | 12,0 | 8,6 | 31,0 | 103,2 | 372 | 266,6 | 73,96 | 961 | 144 | 
| 19 | 14,0 | 9,6 | 32,0 | 134,4 | 448 | 307,2 | 92,16 | 1024 | 196 | 
| 20 | 14,0 | 9,8 | 36,0 | 137,2 | 504 | 352,8 | 96,04 | 1296 | 196 | 
| Сумма | 192 | 126,3 | 449 | 1298,3 | 4605 | 3067,1 | 866,93 | 10931 | 1958 | 
| Ср. знач. | 9,6 | 6,315 | 22,45 | 64,915 | 230,25 | 153,355 | 43,3465 | 546,55 | 97,9 | 
Найду средние квадратические отклонения признаков:
1. Для нахождения параметров линейного уравнения множественной регрессии
необходимо решить систему линейных уравнений относительно неизвестных параметров либо воспользоваться готовыми формулами.
Рассчитаю сначала парные коэффициенты корреляции:
По готовым формулам нахожу коэффициенты чистой регрессии и параметр a:
Таким образом, получилось следующее уравнение множественно регрессии:
Уравнение регрессии показывает, что при увеличении ввода в действие основных фондов на 1% (при неизменном уровне удельного веса рабочих высокой квалификации) выработка продукции на одного рабочего увеличивается в среднем на а при увеличении удельного веса рабочих высокой квалификации в общей численности рабочих на 1% (при неизменном уровне ввода в действие новых основных фондов) выработка продукции на одного рабочего увеличивается в среднем на
После нахождения уравнения регрессии составим новую расчетную таблицу (табл. 2) для определения теоретических значений результативного признака, остаточной дисперсии и средней ошибки аппроксимации.
Таблица 2
| № | |||||||
| 1 | 7,0 | 4,2 | 11,0 | 6,52 | 0,479 | 0,23 | 6,84 | 
| 2 | 7,0 | 3,7 | 13,0 | 6,30 | 0,698 | 0,49 | 9,98 | 
| 3 | 7,0 | 3,9 | 15,0 | 6,69 | 0,308 | 0,09 | 4,40 | 
| 4 | 7,0 | 4,0 | 17,0 | 7,00 | 0,005 | 0,00 | 0,07 | 
| 5 | 7,0 | 4,4 | 18,0 | 7,45 | -0,451 | 0,20 | 6,45 | 
| 6 | 7,0 | 4,8 | 19,0 | 7,91 | -0,908 | 0,82 | 12,97 | 
| 7 | 8,0 | 5,3 | 19,0 | 8,34 | -0,343 | 0,12 | 4,29 | 
| 8 | 8,0 | 5,4 | 20,0 | 8,54 | -0,538 | 0,29 | 6,73 | 
| 9 | 8,0 | 5 | 20,0 | 8,19 | -0,190 | 0,04 | 2,38 | 
| 10 | 10,0 | 6,8 | 21,0 | 9,87 | 0,134 | 0,02 | 1,34 | 
| 11 | 9,0 | 6,8 | 21,0 | 9,87 | -0,866 | 0,75 | 9,62 | 
| 12 | 11,0 | 6,4 | 22,0 | 9,63 | 1,375 | 1,89 | 12,50 | 
| 13 | 9,0 | 6,9 | 22,0 | 10,06 | -1,061 | 1,13 | 11,79 | 
| 14 | 11,0 | 7,2 | 25,0 | 10,65 | 0,354 | 0,13 | 3,22 | 
| 15 | 12,0 | 7,2 | 28,0 | 10,97 | 1,030 | 1,06 | 8,58 | 
| 16 | 12,0 | 8,2 | 29,0 | 11,95 | 0,051 | 0,00 | 0,42 | 
| 17 | 12,0 | 8,1 | 30,0 | 11,97 | 0,030 | 0,00 | 0,25 | 
| 18 | 12,0 | 8,6 | 31,0 | 12,51 | -0,514 | 0,26 | 4,28 | 
| 19 | 14,0 | 9,6 | 32,0 | 13,49 | 0,507 | 0,26 | 3,62 | 
| 20 | 14,0 | 9,8 | 36,0 | 14,10 | -0,099 | 0,01 | 0,71 | 
| Сумма | 192 | 126,3 | 449 | 192,00 | 0,001 | 7,79 | 110,43 | 
| Ср. знач. | 9,6 | 6,315 | 22,45 | 9,60 | - | 0,39 | 5,52 | 
Остаточная дисперсия:
Средняя ошибка аппроксимации:
Качество модели, исходя из относительных отклонений по каждому наблюдению, признается хорошим, т.к. средняя ошибка аппроксимации не превышает 10%.
Коэффициенты стандартизованного уравнения регрессии находятся по формуле:
Соответственно уравнение 
будет выглядеть следующим 
Так как стандартизованные 
коэффициенты регрессии можно сравнивать 
между собой, то можно сказать, что 
ввод в действие новых основных фондов 
оказывает большее влияние на 
выработку продукции, чем удельный 
вес рабочих высокой 
Сравнивать влияние факторов 
на результат можно также при 
помощи средних коэффициентов 
Рассчитываю:
Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,57% или 0,25% соответственно. Таким образом, подтверждается большее влияние на результат y фактора , чем фактора .
2. Коэффициенты парной корреляции мы уже нашли:
Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т.к. При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения. Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии. При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:
Коэффициент множественной корреляции определить через матрицы
парных коэффициентов корреляции:
где
– определитель матрицы межфакторной корреляции.
Нахожу:
Коэффициент множественной корреляции:
Аналогичный результат получим при использовании формул:
Коэффициент множественной корреляции указывает на весьма сильную связь всего набора факторов с результатом.
3. Нескорректированный коэффициент множественной детерминации оценивает долю дисперсии результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 93,1% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.
Скорректированный коэффициент множественной детерминации
определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 90%) детерминированность результата y в модели факторами и .
4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает F -критерий Фишера:
В моем случае фактическое значение F -критерия Фишера:
Получил, что т.е. вероятность случайно получить такое значение F-критерия не превышает допустимый уровень значимости 5%. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .
5. Оценю статистическую значимость параметров чистой регрессии с помощью t-критерия Стьюдента. Рассчитаем стандартные ошибки коэффициентов регрессии по формулам:
Фактические значения t -критерия Стьюдента:
Табличное значение критерия при уровне значимости и числе степеней свободы k =17 составит
Таким образом, признается статистическая значимость параметра т.к. и случайная природа формирования параметра т.к.
Доверительные интервалы для параметров чистой регрессии:
и
6. С помощью частных F-критериев Фишера оценю целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул:
Найду и :
Имею:
Получил, что Следовательно, включение в модель фактора после того, как в модель включен фактор статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака оказывается незначительным, несущественным; фактор включать в уравнение после фактора не следует.
Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения после , то результат расчета частного F-критерия для будет иным. т.е. вероятность его случайного формирования меньше принятого стандарта = 0,05 (5%). Следовательно, значение частного F-критерия для дополнительно включенного фактора не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора является существенным. Фактор должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора .