Статистичний аналіз рахунок виробництва

Автор работы: Пользователь скрыл имя, 02 Декабря 2013 в 01:41, курсовая работа

Описание работы

У наш час великих обсягів інформації потрібен аналіз для того, щоб вірно оцінювати данні. Особливо це важливо в економіці, щоб знати чого очікувати, що змінюється,а без статистики просто глянути на таблиці і щось сказати неможливо так, як це дуже величезні масиви інформації про соціально-економічні явища і процеси.

Содержание работы

Вступ 3
1. Постановка задачі 4
2. Теоретична частина 6
2.1 Проста лінійні регресійна модель 6
2.2 Багатофакторна модель 7
2.3 Етапи побудови багатофакторної регресійної моделі: 8
2.4 Мультиколініарність 13
2.5 Метод Фаррара-Глобера. 13
2.6 Гетероскедатичність 13
2.7 Тест Гольдфельда-Квандта 14
3. Розрахункова частина 16
3.1 Проста лінійна регресійна модель 16
3.1.1 Перевірка регресійної моделі на адеватність за допомогою коефіціента кореляціїї та критерію Фішера. 17
3.1.2Перервірка значущості коефіцієнтів 17
3.1.3 Інтервали довіри для , 18
3.1.4 Інтервал довіри для прогнозного значення 18
3.2 Багатофакторна регресійна модель 18
3.2.1 Матриця кореляції 19
3.2.2 Знаходження невідомих параметрів 19
3.2.3 Перевірка на адекватність багатофакторної регресійної моделі 21
3.2.4 Множинний коефіціет кореляції 21
3.2.5 Варіаційно-коваріаційна матриця параметрів багатофакторної регресійної моделі 22
3.2.6 Перевірка значущості коефіцієнтів побудованої багатофакторної регресії за допомогою критерію Стьюдента 22
3.2.7 Побудова інтервалів довіри для знайдених параметрів . 23
3.2.8 Знаходження прогнозованого значення і побудова інтервалів довіри для прогнозного значення та математичного сподівання. 23
3.3 Мультиколініарність 24
3.3.1Метод Фаррара-Глобера. 24
3.4Гетероскедатичність 24
3.5 Графічне представлення даних 26
Висновок 27
Література 29

Скачать архив (336.54 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

ан_дан ВММ Курсова.docx

— 434.33 Кб (Скачать файл)

F_1,7= 130,6109584

Візьмемо за =0,05

F_кр()=F_кр(0,05, 1,7)= 5,59

Так як F_1,7більше ніж F_кр(0,05, 1. 7) (), то побудована регресивна модель є адекватна щодо спостережуваних даних.

3.1.2Перервірка значущості коефіцієнтів

Отже, зараз розрахуємо дисперсію для коефіцієнтів :

, .

14797411841

D(b₁) =14797411841/2603442248756,22 = 0,01.

D(b₀)= =6794372761,65.

Перевіримо для заданих :

σ_b0 = =82427,98531.

t ^роз₀ = |183517,397226/82427,98531| = 2,226396733.

σ_b1 = = = 0,075390896.

t ^роз₁ = |0,861606/0,075390896| = 11,42851738.

Перевіримо: =0,05

2,226396733< => нерівність виконується, статистично незначущий.

11,42851738> => нерівність виконується, статистично значимий.

2,226396733< => нерівність виконується, статистично незначущий.

11,42851738> => нерівність виконується, статистично значимий.

3.1.3 Інтервали довіри для ,

Для рівня значущості

0,861606 - 2,365 • 0,075390896 < ß₁< 0,861606 + 2,365 • 0,075390896;

0,683306699 < ß₁ < 1,039905638.

183517,397226-2,365•82427,98531< ß₀ <183517,397226 + 2,365 • 82427,98531;

-11424,78802 < ß₀ <378459,5825.

Для рівня значущості

0,861606-3,499•0,075390896< ß₁ <0,861606 + 3,499 • 0,075390896;

183517,661 < ß₁ <1,125398915.

183517,397226-3,499•82427,98531< ß₀ <183517,397226+3,499•82427,98531;

183517,1334< ß₀ <183517,661

3.1.4 Інтервал довіри для прогнозного значення

=14797411841[1+ ]=16442083734

⁼ 183517,397226 + 0,861606 * 961424,4989 = 1011886,676.

1011886,676 - 2,365*128226,6889 < y _n+1< 1011886,676 + 2,365*128226,6889;

708630,5569 < y _n+1 < 1315142,795.

1011886,676 - 3,499*128226,6889 < y _n+1< 1011886,676 + 3,499*128226,6889;

563221,4917 < y _n+1 < 1460551,86.

3.2 Багатофакторна регресійна модель

Для початку із заданих нам статистичних даних треба вибрати всі можливі фактори, що впливають на показник, що вивчається. У нашому випадку можливими факторами є :

y – усього;

– Випуск (в основних цінах);

х₂ – Податки за виключенням субсидій на продукти;

х₃ – Проміжне споживання;

х₄ – Валовий внутрішній продукт (у ринкових цінах).

3.2.1 Матриця кореляції

		усього	Випуск	Податки за виключенням субсидій на продукти	Проміжне споживання	Валовий внутрішній продукт
		у
усього	у	1	0,9999542	0,9878702	0,9997853	0,9996437
Випуск		0,9999542	1	0,9863383	0,9998583	0,9994448
Податки за виключенням субсидій на продукти		0,9878702	0,9863383	1	0,98573	0,9900018
Проміжне споживання		0,9997853	0,9998583	0,98573	1	0,9988759
Валовий внутрішній продукт		0,9996437	0,9994448	0,9900018	0,9988759	1

Аналізуємо одержані значення коефіцієнтів кореляції. Виключаємо з моделі фактори х_2, х₃ та х₄.

Після всіх перетворень отримуємо табл.

	у
у	1	0,9999542
	0,9999542	1

3.2.2 Знаходження невідомих параметрів

Запишемо матрицю для х у табличному вигляді:


1	373893
1	460520
1	504008
1	603704
1	809988
1	995630
1	1182179
1	1565055
1	2072172

Матриця для у:

у
799402
968440
1057248
1261662
1684110
2096962
2504418
3301984
4392104

Знаходимо параметри

9	8567149
8567149	10758558025223

0,4591595364586950	-0,0000003656334013
-0,0000003656334013	0,0000000000003841

18066330

22720967679388

-12216,9846398523

2,12162562618657

Тоді вектор , можна записати:

-12216,9846398523

2,12162562618657

Маємо модель у=-12216,9846398523+2,12162562618657х₁

Порахуємо ці значення:

781044
964834
1057099
1268617
1706274
2100137
2495924
3308244
4384156

3.2.3 Перевірка на адекватність багатофакторної регресійної моделі

Тепер розглядаємо нульову гіпотезу: проти альтернативної:

Будуємо F статистику Фішера з m i (n-m-1) ступенями вільності

F_1,9-1-1===76362,42754

А рівень значущості

F_кр(1;7;0,05)=5,59

F_1,9-1-1 > F_кр(1;7;0,05)

Тоді за цими даними можна зробити висновок, що модель адекватна спостережуваним даним.

3.2.4 Множинний коефіціет кореляції

Знайдемо цей критерій кореляції. Спочатку знайдемо та :

=2007369,88888889

=2007370.

Тепер обчислимо :

= 0,999954169201549

3.2.5 Варіаційно-коваріаційна матриця параметрів багатофакторної регресійної моделі

- це є дисперсія випадкової величини : .

Оцінку будемо робити за допомогою величини:

=, або це можна знайти за формулою:.

=1074243487. 1074243487/8=134280435,875

61656142,6918365	-49,0974124970228
-49,0974124970228	0,0000515771154195875

3.2.6 Перевірка значущості коефіцієнтів побудованої багатофакторної регресії за допомогою критерію Стьюдента

Для перевірки нульової гіпотези будується так звана статистика:

0,000134267

0,076480592

Задаємо рівень значущості і по табличним значенням розподілу критичних точок Стьюдента знаходимо: .

=t(0,005,7)=

t(0,05/2; 9 – 1 – 1 )=t(0,025,7)=.

Параметр t1 значимий

3.2.7 Побудова інтервалів довіри для знайдених параметрів .

Для :

-12216,9846398523–3,499*90990184,7180837<<-12216,9846398523+ 3,499*90990184,7180837

2,12162562618657-3,499*27,7407062<<2,12162562618657+ 3,499*27,7407062

-318386873,3<<318362439,3

-94,94310551<<99,18635676

Для :

-12216,9846398523–2,365*90990184,7180837<<-12216,9846398523+ 2,365*90990184,7180837

2,12162562618657-2,365*27,7407062<<2,12162562618657+ 2,365*27,7407062

-215204003,8<<215179569,9

-63,48514463<<67,72839588

3.2.8 Знаходження прогнозованого значення і побудова інтервалів довіри для прогнозного значення та математичного сподівання.

Візьмемо .

Тоді 9322935,771

Відомо, що дисперсія для прогнозного значення буде обчислюватися за формулою:

762412303,1

27611,81456

Інтервал довіри для індивідуального значення має вигляд:

9322935,771-3,499*27611,81456<y_j<9322935,771+3,499*27611,81456

9226322,032<y_j<9419549,51

9322935,771-2,365*27611,81456<y_j<9322935,771+2,365*27611,81456

9257633,83<y_j<9388237,712

3.3 Мультиколініарність

3.3.1Метод Фаррара-Глобера.

Кореляційна матриця елементами якого є , де - це коефіцієнти кореляції між та факторами.

Розраховуємо число розрахункове:

;

6,95<11,34 6,95<7,82

Тобто в системі не присутнє явище мультиколінеарності.

3.4Гетероскедатичність

Етап І:

Випуск (в основних цінах)
373893
460520
504008
603704
809988
995630
1182179
1565055
2072172

Етап ІІ:

Задаємо величину: .

Залишок (n-C) спостережень ділиться на 2 рівні підвибірки однакового розміру , одна з яких включає малі значення x , інша – великі.

Вибірка з малими значеннями

х₁

373893

460520

504008

603704

Вибірка з великими значеннями

х₁

995630

1182179

1565055

2072172

Етап ІІІ:

Будуємо окремо регресію для кожної підвибірки і розраховуємо суму квадратів залишків. В результаті отримаємо:

Сума квадратів залишків для підвибірки з малими значеннями х:

Сума квадратів залишків для підвибірки з великими значеннями х:

k	М
k
1	44012,197	2,013620756	=44012,197+2,013620756*x	4175406885180,23
	В
k
1	-17678,243	2,126587174	=-17678,243+2,126587174*x	155602549,105446

Ця величина має розподіл Фішера з ступенями вільності k та k , де k = k = .

= 0,0000372664397469206

При : F=161.

Отже не відхиляється, а саме нашій моделі не присутнє явище гетероскедостичності.

3.5 Графічне представлення даних

Висновок

1. Використовуючи дані «Рахунок виробництва» ми знайшли просту лінійну регресію: y= 183517,397226+ 0,861606*x. Вона є відповідною реальним даним так, як згідно коефіцієнту кореляції та критерію Фішера регресія є адекватна.

2. =0,05

коефіцієнт статистично незначущий і статистично значимий.

=0,01

коефіцієнт статистично незначущий і статистично значимий.

ми отримали наступні інтервали довіри для ß₀ та ß₁:

для 0,05: 0,683306699 < ß₁ < 1,039905638

-11424,78802 < ß₀ < 378459,5825

для 0,01: 183517,661 < ß₁ < 1,125398915

183517,1334 < ß₀ < 183517,661.

Інтервал довіри для прогнозованого числа буде дорівнювати

для : 708630,5569 < y _n+1 < 1315142,795,

для : 563221,4917 < y _n+1 < 1460551,86.

3. Так як в простої лінійної регресії розглядався вплив лише одного фактору, а саме «Випуск (в основних цінах)», то ми побудували також багатофакторну модель, щоб знайти вплив інших факторів. При її побудові ми відкинули «Податки за виключенням субсидій на продукти», «Проміжне споживання», «Валовий внутрішній продукт (у ринкових цінах)» так, як ці фактори були залежними, і тому отримали:

у=-12216,9846398523+2,12162562618657х₁

Модель є адекватною, тобто будується на реальних даних.

4. Також були побудовані інтервали довіри для знайдених параметрів .

Для :

-12216,9846398523–3,499*90990184,7180837<<-12216,9846398523+ 3,499*90990184,7180837

2,12162562618657-3,499*27,7407062<<2,12162562618657+ 3,499*27,7407062

-318386873,3<<318362439,3

-94,94310551<<99,18635676

Для :

-12216,9846398523–2,365*90990184,7180837<<-12216,9846398523+ 2,365*90990184,7180837

2,12162562618657-2,365*27,7407062<<2,12162562618657+ 2,365*27,7407062

-215204003,8<<215179569,9

-63,48514463<<67,72839588

Також було знайдене прогнозне значення на майбутнє (наступний рік розгляду) і побудовані інтервали довіри для нього та його математичного сподівання.

Информация о работе Статистичний аналіз рахунок виробництва