Статистичний аналіз рахунок виробництва

Автор работы: Пользователь скрыл имя, 02 Декабря 2013 в 01:41, курсовая работа

Описание работы

У наш час великих обсягів інформації потрібен аналіз для того, щоб вірно оцінювати данні. Особливо це важливо в економіці, щоб знати чого очікувати, що змінюється,а без статистики просто глянути на таблиці і щось сказати неможливо так, як це дуже величезні масиви інформації про соціально-економічні явища і процеси.

Содержание работы

Вступ 3
1. Постановка задачі 4
2. Теоретична частина 6
2.1 Проста лінійні регресійна модель 6
2.2 Багатофакторна модель 7
2.3 Етапи побудови багатофакторної регресійної моделі: 8
2.4 Мультиколініарність 13
2.5 Метод Фаррара-Глобера. 13
2.6 Гетероскедатичність 13
2.7 Тест Гольдфельда-Квандта 14
3. Розрахункова частина 16
3.1 Проста лінійна регресійна модель 16
3.1.1 Перевірка регресійної моделі на адеватність за допомогою коефіціента кореляціїї та критерію Фішера. 17
3.1.2Перервірка значущості коефіцієнтів 17
3.1.3 Інтервали довіри для , 18
3.1.4 Інтервал довіри для прогнозного значення 18
3.2 Багатофакторна регресійна модель 18
3.2.1 Матриця кореляції 19
3.2.2 Знаходження невідомих параметрів 19
3.2.3 Перевірка на адекватність багатофакторної регресійної моделі 21
3.2.4 Множинний коефіціет кореляції 21
3.2.5 Варіаційно-коваріаційна матриця параметрів багатофакторної регресійної моделі 22
3.2.6 Перевірка значущості коефіцієнтів побудованої багатофакторної регресії за допомогою критерію Стьюдента 22
3.2.7 Побудова інтервалів довіри для знайдених параметрів . 23
3.2.8 Знаходження прогнозованого значення і побудова інтервалів довіри для прогнозного значення та математичного сподівання. 23
3.3 Мультиколініарність 24
3.3.1Метод Фаррара-Глобера. 24
3.4Гетероскедатичність 24
3.5 Графічне представлення даних 26
Висновок 27
Література 29

Файлы: 1 файл

ан_дан ВММ Курсова.docx

— 434.33 Кб (Скачать файл)

F1,7= 130,6109584

Візьмемо за =0,05

Fкр( )=Fкр(0,05, 1,7)= 5,59

Так як F1,7більше ніж Fкр(0,05, 1. 7) ( ), то побудована регресивна модель є адекватна щодо спостережуваних даних.

3.1.2Перервірка  значущості коефіцієнтів

Отже, зараз розрахуємо дисперсію  для коефіцієнтів :

, .

14797411841

  D(b1) =14797411841/2603442248756,22 = 0,01.

 

D(b0)= =6794372761,65.

 

Перевіримо для заданих :

σb0 = =82427,98531.

t роз0 = |183517,397226/82427,98531| = 2,226396733.

σb1 = =  = 0,075390896.

t роз1 = |0,861606/0,075390896| = 11,42851738.

Перевіримо:      =0,05

 2,226396733< => нерівність виконується, статистично незначущий.

11,42851738>   => нерівність виконується, статистично значимий.

 

2,226396733< => нерівність виконується, статистично незначущий.

11,42851738>   => нерівність виконується, статистично значимий.

3.1.3 Інтервали довіри для
,

Для рівня значущості

0,861606 - 2,365 • 0,075390896  <  ß<  0,861606 + 2,365 • 0,075390896;

0,683306699  <   ß <  1,039905638.

183517,397226-2,365•82427,98531<  ß <183517,397226 + 2,365  • 82427,98531;

-11424,78802 <  ß <378459,5825.

 

Для рівня значущості

0,861606-3,499•0,075390896<  ß <0,861606 + 3,499 • 0,075390896;

183517,661 < ß <1,125398915.

183517,397226-3,499•82427,98531<  ß <183517,397226+3,499•82427,98531;

183517,1334<  ß <183517,661

3.1.4 Інтервал довіри для прогнозного значення

=14797411841[1+ ]=16442083734

= 183517,397226 + 0,861606 * 961424,4989 = 1011886,676.

 

1011886,676 - 2,365*128226,6889  <  y n+1  <  1011886,676 + 2,365*128226,6889;

708630,5569  <  y n+1  <  1315142,795.

1011886,676 - 3,499*128226,6889  <  y n+1  <  1011886,676 + 3,499*128226,6889;

563221,4917  <  y n+1  <  1460551,86.

3.2 Багатофакторна регресійна модель

Для початку із заданих  нам статистичних даних треба  вибрати всі можливі фактори, що впливають на показник, що вивчається. У нашому випадку можливими факторами  є :

y   – усього;

 – Випуск (в основних  цінах);

х – Податки за виключенням субсидій на продукти;

х3 – Проміжне споживання;

х4  – Валовий внутрішній продукт (у ринкових цінах).

3.2.1 Матриця кореляції

   

усього

Випуск

Податки за виключенням субсидій на продукти

Проміжне споживання

Валовий внутрішній продукт

 

у

усього

у

1

0,9999542

0,9878702

0,9997853

0,9996437

Випуск

0,9999542

1

0,9863383

0,9998583

0,9994448

Податки за виключенням субсидій на продукти

0,9878702

0,9863383

1

0,98573

0,9900018

Проміжне споживання

0,9997853

0,9998583

0,98573

1

0,9988759

Валовий внутрішній продукт

0,9996437

0,9994448

0,9900018

0,9988759

1


 

Аналізуємо одержані значення коефіцієнтів кореляції. Виключаємо з моделі фактори х2, х3 та х4.

 

Після всіх перетворень отримуємо  табл.

 

 

у

у

1

0,9999542

0,9999542

1


 

3.2.2 Знаходження невідомих параметрів

Запишемо матрицю для  х у табличному вигляді:

 

 

1

373893

1

460520

1

504008

1

603704

1

809988

1

995630

1

1182179

1

1565055

1

2072172


 

 

 

 

Матриця для у:

у

799402

968440

1057248

1261662

1684110

2096962

2504418

3301984

4392104



 

Знаходимо параметри

 

1.

9

8567149

8567149

10758558025223


 

2.

0,4591595364586950

-0,0000003656334013

-0,0000003656334013

0,0000000000003841


 

3.

18066330

22720967679388


 

4.

-12216,9846398523

2,12162562618657


 

Тоді вектор , можна записати:

-12216,9846398523

2,12162562618657


 

Маємо модель у=-12216,9846398523+2,12162562618657х1

 

 

 

 

Порахуємо ці значення:

781044

964834

1057099

1268617

1706274

2100137

2495924

3308244

4384156


3.2.3 Перевірка на адекватність багатофакторної регресійної моделі

Тепер розглядаємо нульову  гіпотезу:   проти альтернативної:

Будуємо F статистику Фішера з m i (n-m-1) ступенями вільності

F1,9-1-1===76362,42754

 

А рівень значущості

Fкр(1;7;0,05)=5,59

 

F1,9-1-1 > Fкр(1;7;0,05)

 

Тоді за цими даними можна  зробити висновок, що модель адекватна спостережуваним даним.

3.2.4 Множинний коефіціет кореляції

Знайдемо цей критерій кореляції. Спочатку знайдемо та :

= 2007369,88888889

=2007370.

 

Тепер обчислимо  :

= 0,999954169201549

3.2.5 Варіаційно-коваріаційна матриця параметрів багатофакторної регресійної моделі

- це є дисперсія випадкової  величини  : .

Оцінку  будемо робити за допомогою величини:

.

=, або це можна знайти за  формулою: .

=1074243487. 1074243487/8=134280435,875

 

=

61656142,6918365

-49,0974124970228

-49,0974124970228

0,0000515771154195875


3.2.6 Перевірка значущості коефіцієнтів
побудованої багатофакторної регресії за допомогою критерію Стьюдента

Для перевірки нульової гіпотези будується так звана статистика:

.

 

0,000134267

0,076480592

 

Задаємо рівень значущості і по табличним значенням розподілу критичних точок Стьюдента знаходимо: .

 

=t(0,005,7)=

t(0,05/2; 9 – 1 – 1 )=t(0,025,7)= .

 

:

Параметр t1 значимий

 

:

Параметр t1 значимий

 

 

 

3.2.7 Побудова інтервалів довіри для знайдених параметрів
.

Для :

-12216,9846398523–3,499*90990184,7180837< <-12216,9846398523+ 3,499*90990184,7180837

2,12162562618657-3,499*27,7407062< <2,12162562618657+ 3,499*27,7407062

-318386873,3< <318362439,3

-94,94310551< <99,18635676

 

Для :

-12216,9846398523–2,365*90990184,7180837< <-12216,9846398523+ 2,365*90990184,7180837

2,12162562618657-2,365*27,7407062< <2,12162562618657+ 2,365*27,7407062

-215204003,8< <215179569,9

-63,48514463< <67,72839588

3.2.8 Знаходження прогнозованого значення і побудова інтервалів довіри для прогнозного значення та математичного сподівання.

Візьмемо  .

Тоді  9322935,771

Відомо, що дисперсія для  прогнозного значення буде обчислюватися за формулою:

.

762412303,1

27611,81456

 

Інтервал довіри для індивідуального  значення має вигляд:

 

:

9322935,771-3,499*27611,81456<yj<9322935,771+3,499*27611,81456

9226322,032<yj<9419549,51

:

9322935,771-2,365*27611,81456<yj<9322935,771+2,365*27611,81456

9257633,83<yj<9388237,712

 

3.3 Мультиколініарність

3.3.1Метод Фаррара-Глобера.

Кореляційна матриця елементами якого є , де - це коефіцієнти кореляції між та факторами.

 

Розраховуємо число  розрахункове:

;  

   

 

6,95<11,34  6,95<7,82

Тобто в системі не присутнє явище мультиколінеарності.

3.4Гетероскедатичність

Етап І:

 

Випуск (в основних цінах)

373893

460520

504008

603704

809988

995630

1182179

1565055

2072172


 

 

Етап ІІ:

 

Задаємо величину: .

Залишок (n-C) спостережень ділиться на 2 рівні підвибірки однакового розміру , одна з яких включає малі значення x , інша – великі.

 

 

Вибірка з малими значеннями

х1

373893

460520

504008

603704


 

Вибірка з великими значеннями

х1

995630

1182179

1565055

2072172


 

Етап ІІІ:

 

Будуємо окремо регресію для  кожної підвибірки і розраховуємо суму квадратів залишків. В результаті отримаємо:

Сума квадратів залишків для підвибірки з малими значеннями х:

Сума квадратів залишків для підвибірки з великими значеннями х:

k

М

1

44012,197

2,013620756

=44012,197+2,013620756*x

4175406885180,23

 

В

k

1

-17678,243

2,126587174

=-17678,243+2,126587174*x

155602549,105446


Ця величина має розподіл Фішера з ступенями вільності  k та k , де k = k = .

= 0,0000372664397469206

При : F=161.

Отже  не відхиляється, а саме нашій моделі не присутнє явище гетероскедостичності.

3.5 Графічне представлення даних

 

 

Висновок

1. Використовуючи дані «Рахунок виробництва» ми знайшли просту лінійну регресію: y= 183517,397226+ 0,861606*x. Вона є відповідною реальним даним так, як згідно коефіцієнту кореляції та критерію Фішера регресія є адекватна.

 

2. =0,05

коефіцієнт  статистично незначущий і статистично значимий.

=0,01

коефіцієнт  статистично незначущий і статистично значимий.

ми отримали наступні інтервали  довіри для ß0 та ß1:

 для 0,05:                  0,683306699   <   ß1   <  1,039905638

-11424,78802   <   ß0   <  378459,5825

для 0,01:                    183517,661   <   ß1   <  1,125398915

183517,1334   <   ß0   <  183517,661.

 

Інтервал довіри для прогнозованого числа буде дорівнювати 

для :  708630,5569  <  y n+1  <  1315142,795,

для :  563221,4917  <  y n+1  <  1460551,86.

 

3. Так як в простої лінійної регресії розглядався вплив лише одного фактору, а саме «Випуск (в основних цінах)», то ми побудували також багатофакторну модель, щоб знайти вплив інших факторів. При її побудові ми відкинули «Податки за виключенням субсидій на продукти», «Проміжне споживання», «Валовий внутрішній продукт (у ринкових цінах)» так, як ці фактори були залежними, і тому отримали:

у=-12216,9846398523+2,12162562618657х1

Модель є адекватною, тобто будується на реальних даних.

 

4. Також були побудовані інтервали довіри для знайдених параметрів .

Для :

-12216,9846398523–3,499*90990184,7180837< <-12216,9846398523+ 3,499*90990184,7180837

2,12162562618657-3,499*27,7407062< <2,12162562618657+ 3,499*27,7407062

-318386873,3< <318362439,3

-94,94310551< <99,18635676

 

Для :

-12216,9846398523–2,365*90990184,7180837< <-12216,9846398523+ 2,365*90990184,7180837

2,12162562618657-2,365*27,7407062< <2,12162562618657+ 2,365*27,7407062

-215204003,8< <215179569,9

-63,48514463< <67,72839588

 

Також було знайдене прогнозне  значення на майбутнє (наступний рік розгляду) і побудовані інтервали довіри для нього та його математичного сподівання.

Информация о работе Статистичний аналіз рахунок виробництва