Автор работы: Пользователь скрыл имя, 02 Декабря 2013 в 01:41, курсовая работа
У наш час великих обсягів інформації потрібен аналіз для того, щоб вірно оцінювати данні. Особливо це важливо в економіці, щоб знати чого очікувати, що змінюється,а без статистики просто глянути на таблиці і щось сказати неможливо так, як це дуже величезні масиви інформації про соціально-економічні явища і процеси.
Вступ 3
1. Постановка задачі 4
2. Теоретична частина 6
2.1 Проста лінійні регресійна модель 6
2.2 Багатофакторна модель 7
2.3 Етапи побудови багатофакторної регресійної моделі: 8
2.4 Мультиколініарність 13
2.5 Метод Фаррара-Глобера. 13
2.6 Гетероскедатичність 13
2.7 Тест Гольдфельда-Квандта 14
3. Розрахункова частина 16
3.1 Проста лінійна регресійна модель 16
3.1.1 Перевірка регресійної моделі на адеватність за допомогою коефіціента кореляціїї та критерію Фішера. 17
3.1.2Перервірка значущості коефіцієнтів 17
3.1.3 Інтервали довіри для , 18
3.1.4 Інтервал довіри для прогнозного значення 18
3.2 Багатофакторна регресійна модель 18
3.2.1 Матриця кореляції 19
3.2.2 Знаходження невідомих параметрів 19
3.2.3 Перевірка на адекватність багатофакторної регресійної моделі 21
3.2.4 Множинний коефіціет кореляції 21
3.2.5 Варіаційно-коваріаційна матриця параметрів багатофакторної регресійної моделі 22
3.2.6 Перевірка значущості коефіцієнтів побудованої багатофакторної регресії за допомогою критерію Стьюдента 22
3.2.7 Побудова інтервалів довіри для знайдених параметрів . 23
3.2.8 Знаходження прогнозованого значення і побудова інтервалів довіри для прогнозного значення та математичного сподівання. 23
3.3 Мультиколініарність 24
3.3.1Метод Фаррара-Глобера. 24
3.4Гетероскедатичність 24
3.5 Графічне представлення даних 26
Висновок 27
Література 29
F1,7= 130,6109584
Візьмемо за =0,05
Fкр( )=Fкр(0,05, 1,7)= 5,59
Так як F1,7більше ніж Fкр(0,05, 1. 7) ( ), то побудована регресивна модель є адекватна щодо спостережуваних даних.
Отже, зараз розрахуємо дисперсію для коефіцієнтів :
, .
14797411841
D(b1) =14797411841/2603442248756,22 = 0,01.
D(b0)= =6794372761,65.
Перевіримо для заданих :
σb0 = =82427,98531.
t роз0 = |183517,397226/82427,98531| = 2,226396733.
σb1 = = = 0,075390896.
t роз1 = |0,861606/0,075390896| = 11,42851738.
Перевіримо: =0,05
2,226396733< => нерівність виконується, статистично незначущий.
11,42851738> => нерівність виконується, статистично значимий.
2,226396733< => нерівність виконується, статистично незначущий.
11,42851738> => нерівність виконується, статистично значимий.
Для рівня значущості
0,861606 - 2,365 • 0,075390896 < ß1 < 0,861606 + 2,365 • 0,075390896;
0,683306699 < ß1 < 1,039905638.
183517,397226-2,365•82427,
-11424,78802 < ß0 <378459,5825.
Для рівня значущості
0,861606-3,499•0,075390896< ß1 <0,861606 + 3,499 • 0,075390896;
183517,661 < ß1 <1,125398915.
183517,397226-3,499•82427,
183517,1334< ß0 <183517,661
=14797411841[1+ ]=16442083734
= 183517,397226 + 0,861606 * 961424,4989 = 1011886,676.
1011886,676 - 2,365*128226,6889 < y n+1 < 1011886,676 + 2,365*128226,6889;
708630,5569 < y n+1 < 1315142,795.
1011886,676 - 3,499*128226,6889 < y n+1 < 1011886,676 + 3,499*128226,6889;
563221,4917 < y n+1 < 1460551,86.
Для початку із заданих нам статистичних даних треба вибрати всі можливі фактори, що впливають на показник, що вивчається. У нашому випадку можливими факторами є :
y – усього;
– Випуск (в основних цінах);
х2 – Податки за виключенням субсидій на продукти;
х3 – Проміжне споживання;
х4 – Валовий внутрішній продукт (у ринкових цінах).
усього |
Випуск |
Податки за виключенням субсидій на продукти |
Проміжне споживання |
Валовий внутрішній продукт | ||
у |
|
|
|
| ||
усього |
у |
1 |
0,9999542 |
0,9878702 |
0,9997853 |
0,9996437 |
Випуск |
|
0,9999542 |
1 |
0,9863383 |
0,9998583 |
0,9994448 |
Податки за виключенням субсидій на продукти |
|
0,9878702 |
0,9863383 |
1 |
0,98573 |
0,9900018 |
Проміжне споживання |
|
0,9997853 |
0,9998583 |
0,98573 |
1 |
0,9988759 |
Валовий внутрішній продукт |
|
0,9996437 |
0,9994448 |
0,9900018 |
0,9988759 |
1 |
Аналізуємо одержані значення коефіцієнтів кореляції. Виключаємо з моделі фактори х2, х3 та х4.
Після всіх перетворень отримуємо табл.
у |
| |
у |
1 |
0,9999542 |
|
0,9999542 |
1 |
Запишемо матрицю для х у табличному вигляді:
| |
1 |
373893 |
1 |
460520 |
1 |
504008 |
1 |
603704 |
1 |
809988 |
1 |
995630 |
1 |
1182179 |
1 |
1565055 |
1 |
2072172 |
Матриця для у:
|
Знаходимо параметри
1.
9 |
8567149 |
8567149 |
10758558025223 |
2.
0,4591595364586950 |
-0,0000003656334013 |
-0,0000003656334013 |
0,0000000000003841 |
3.
18066330 |
22720967679388 |
4.
-12216,9846398523 |
2,12162562618657 |
Тоді вектор , можна записати:
-12216,9846398523 |
2,12162562618657 |
Маємо модель у=-12216,9846398523+2,
Порахуємо ці значення:
781044 |
964834 |
1057099 |
1268617 |
1706274 |
2100137 |
2495924 |
3308244 |
4384156 |
Тепер розглядаємо нульову гіпотезу: проти альтернативної:
Будуємо F статистику Фішера з m i (n-m-1) ступенями вільності
F1,9-1-1===76362,42754
А рівень значущості
Fкр(1;7;0,05)=5,59
F1,9-1-1 > Fкр(1;7;0,05)
Тоді за цими даними можна зробити висновок, що модель адекватна спостережуваним даним.
Знайдемо цей критерій кореляції. Спочатку знайдемо та :
= 2007369,88888889
=2007370.
Тепер обчислимо :
= 0,999954169201549
- це є дисперсія випадкової величини : .
Оцінку будемо робити за допомогою величини:
.
=, або це можна знайти за формулою: .
=1074243487. 1074243487/8=134280435,875
=
61656142,6918365 |
-49,0974124970228 |
-49,0974124970228 |
0,0000515771154195875 |
Для перевірки нульової гіпотези будується так звана статистика:
.
0,000134267
0,076480592
Задаємо рівень значущості і по табличним значенням розподілу критичних точок Стьюдента знаходимо: .
=t(0,005,7)=
t(0,05/2; 9 – 1 – 1 )=t(0,025,7)= .
:
Параметр t1 значимий
:
Параметр t1 значимий
Для :
-12216,9846398523–3,499*
2,12162562618657-3,499*27,
-318386873,3< <318362439,3
-94,94310551< <99,18635676
Для :
-12216,9846398523–2,365*
2,12162562618657-2,365*27,
-215204003,8< <215179569,9
-63,48514463< <67,72839588
Візьмемо .
Тоді 9322935,771
Відомо, що дисперсія для прогнозного значення буде обчислюватися за формулою:
.
762412303,1
27611,81456
Інтервал довіри для індивідуального значення має вигляд:
:
9322935,771-3,499*27611,81456<
9226322,032<yj<9419549,51
:
9322935,771-2,365*27611,81456<
9257633,83<yj<9388237,712
Кореляційна матриця елементами якого є , де - це коефіцієнти кореляції між та факторами.
Розраховуємо число розрахункове:
;
6,95<11,34 6,95<7,82
Тобто в системі не присутнє явище мультиколінеарності.
Етап І:
Випуск (в основних цінах) |
373893 |
460520 |
504008 |
603704 |
809988 |
995630 |
1182179 |
1565055 |
2072172 |
Етап ІІ:
Задаємо величину: .
Залишок (n-C) спостережень ділиться на 2 рівні підвибірки однакового розміру , одна з яких включає малі значення x , інша – великі.
Вибірка з малими значеннями |
х1 |
373893 |
460520 |
504008 |
603704 |
Вибірка з великими значеннями |
х1 |
995630 |
1182179 |
1565055 |
2072172 |
Етап ІІІ:
Будуємо окремо регресію для кожної підвибірки і розраховуємо суму квадратів залишків. В результаті отримаємо:
Сума квадратів залишків для підвибірки з малими значеннями х:
Сума квадратів залишків для підвибірки з великими значеннями х:
k |
М | |||
|
|
|
| |
1 |
44012,197 |
2,013620756 |
=44012,197+2,013620756*x |
4175406885180,23 |
В | ||||
k |
|
|
|
|
1 |
-17678,243 |
2,126587174 |
=-17678,243+2,126587174*x |
155602549,105446 |
Ця величина має розподіл Фішера з ступенями вільності k та k , де k = k = .
= 0,0000372664397469206
При : F=161.
Отже не відхиляється, а саме нашій моделі не присутнє явище гетероскедостичності.
1. Використовуючи дані «Рахунок виробництва» ми знайшли просту лінійну регресію: y= 183517,397226+ 0,861606*x. Вона є відповідною реальним даним так, як згідно коефіцієнту кореляції та критерію Фішера регресія є адекватна.
2. =0,05
коефіцієнт статистично незначущий і статистично значимий.
=0,01
коефіцієнт статистично незначущий і статистично значимий.
ми отримали наступні інтервали довіри для ß0 та ß1:
для 0,05: 0,683306699 < ß1 < 1,039905638
-11424,78802 < ß0 < 378459,5825
для 0,01: 183517,661 < ß1 < 1,125398915
183517,1334 < ß0 < 183517,661.
Інтервал довіри для прогнозованого числа буде дорівнювати
для : 708630,5569 < y n+1 < 1315142,795,
для : 563221,4917 < y n+1 < 1460551,86.
3. Так як в простої лінійної регресії розглядався вплив лише одного фактору, а саме «Випуск (в основних цінах)», то ми побудували також багатофакторну модель, щоб знайти вплив інших факторів. При її побудові ми відкинули «Податки за виключенням субсидій на продукти», «Проміжне споживання», «Валовий внутрішній продукт (у ринкових цінах)» так, як ці фактори були залежними, і тому отримали:
у=-12216,9846398523+2,
Модель є адекватною, тобто будується на реальних даних.
4. Також були побудовані інтервали довіри для знайдених параметрів .
Для :
-12216,9846398523–3,499*
2,12162562618657-3,499*27,
-318386873,3< <318362439,3
-94,94310551< <99,18635676
Для :
-12216,9846398523–2,365*
2,12162562618657-2,365*27,
-215204003,8< <215179569,9
-63,48514463< <67,72839588
Також було знайдене прогнозне значення на майбутнє (наступний рік розгляду) і побудовані інтервали довіри для нього та його математичного сподівання.