Статистичний аналіз рахунок виробництва

Автор работы: Пользователь скрыл имя, 02 Декабря 2013 в 01:41, курсовая работа

Описание работы

У наш час великих обсягів інформації потрібен аналіз для того, щоб вірно оцінювати данні. Особливо це важливо в економіці, щоб знати чого очікувати, що змінюється,а без статистики просто глянути на таблиці і щось сказати неможливо так, як це дуже величезні масиви інформації про соціально-економічні явища і процеси.

Содержание работы

Вступ 3
1. Постановка задачі 4
2. Теоретична частина 6
2.1 Проста лінійні регресійна модель 6
2.2 Багатофакторна модель 7
2.3 Етапи побудови багатофакторної регресійної моделі: 8
2.4 Мультиколініарність 13
2.5 Метод Фаррара-Глобера. 13
2.6 Гетероскедатичність 13
2.7 Тест Гольдфельда-Квандта 14
3. Розрахункова частина 16
3.1 Проста лінійна регресійна модель 16
3.1.1 Перевірка регресійної моделі на адеватність за допомогою коефіціента кореляціїї та критерію Фішера. 17
3.1.2Перервірка значущості коефіцієнтів 17
3.1.3 Інтервали довіри для , 18
3.1.4 Інтервал довіри для прогнозного значення 18
3.2 Багатофакторна регресійна модель 18
3.2.1 Матриця кореляції 19
3.2.2 Знаходження невідомих параметрів 19
3.2.3 Перевірка на адекватність багатофакторної регресійної моделі 21
3.2.4 Множинний коефіціет кореляції 21
3.2.5 Варіаційно-коваріаційна матриця параметрів багатофакторної регресійної моделі 22
3.2.6 Перевірка значущості коефіцієнтів побудованої багатофакторної регресії за допомогою критерію Стьюдента 22
3.2.7 Побудова інтервалів довіри для знайдених параметрів . 23
3.2.8 Знаходження прогнозованого значення і побудова інтервалів довіри для прогнозного значення та математичного сподівання. 23
3.3 Мультиколініарність 24
3.3.1Метод Фаррара-Глобера. 24
3.4Гетероскедатичність 24
3.5 Графічне представлення даних 26
Висновок 27
Література 29

Скачать архив (336.54 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

ан_дан ВММ Курсова.docx

— 434.33 Кб (Скачать файл)

Запишемо рівняння вибіркової багатофакторної регресійної моделі:

[3] ,

де

- значення показника і-го спостереження;

- значення факторів в і-ому спостережені;

- невідомі параметри нашої багатофакторної регресійної моделі.

Тобто, маємо систему рівнянь:

[3]

Введемо далі наступні позначення:

, , , .

Тоді вище записана система буде мати вигляд:

Для знаходження невідомих будемо використовувати метод найменших квадратів, тобто будемо шукати із умови мінімуму суми квадратів відхилень:

Невідомі параметри будемо знаходити із системи рівнянь:

[3] .

Розв’язок цієї системи буде мати вигляд :

, де

- матриця, транспонована до матриці х,

- матриця, обернена до матриці

Операції знаходження виконується у такому порядку:

Після отримання багатофакторної моделі потрібно перевірити її на адекватність.

Будемо використовувати критерій Фішера. Розглянемо нульову гіпотезу: проти альтернативної: .

Якщо не виконується нульова гіпотеза, то виконується альтернативна, що означає, що модель адекватна.

Для цього будуємо F статистику Фішера з m i (n-m-1) ступенями вільності

[3]

Задаємо рівень значущості і по таблицям розподілу критичних точок Фішера знаходимо . Якщо виконується умова, що > , то буде виконуватись гіпотеза Н1 , тобто модель буде адекватна спостережуваним даним.

Але цього не достатьно і потрібно ще перевірити ступень відповідності данних регресивної моделі.

Корисною мірою ступеня відповідності даних одержаних з регресійної моделі, фактичним даним є коефіцієнт множинної кореляції . Коефіцієнт множинної кореляції визначається, як коефіцієнт кореляції між змінними і . Тобто:

., де ,

- коефіцієнт коваріації між і ,

- дисперсія змінної ,

- дисперсія змінної .

Позитивне значення свідчить про прямий зв'язок, а негативне про зворотній.

Значення коефіцієнту лежить в межах . Якщо значення коефіцієнта кореляції близьке до нуля, то статистичний зв'язок між і відсутній. На практиці будемо вважати, що якщо - то статистичний зв'язок відсутній. А якщо значення коефіцієнта близьке до 1 , то вважається, що вплив є значним.

Отже, після знаходження множинного коефіціента побудуємо варіаційно-коваріаційної матриці параметрів багатофакторної регресійної моделі.

Застосування теорії матриць дозволяє знайти не тільки дисперсію параметрів множинної регресії, а й визначити коваріацію між їх попарними значеннями. Таким чином дисперсійно-коваріаційна матриця записується у вигляді:

, в матричному вигляді вона має вид:

Також відомо, що може бути обчислена за формулою:

- це є дисперсія випадкової величини : .

Оцінку будемо робити за допомогою величини:

, або це можна знайти за формулою:

Таким чином в матричному вигляді:

Після чого можно перевірити значущості коефіцієнтів побудованої багатофакторної регресії.

Для цього викоритсаємо критерій Стьюдента. Для перевірки на значущість вводимо в розгляд дві гіпотези:

, .

Для перевірки нульової гіпотези будується так звана статистика:

Задаємо рівень значущості і по табличним значенням розподілу критичних точок Стьюдента знаходимо: .

Якщо виконується умова, що , то нульова гіпотеза не виконується, таким чином відповідний параметр побудованої моделі є значимим.

Тепер можно побудувати інтервали довіри для знайдених параметрів . Він обчислюється за формулою:

Пісял цього можно побудвати інтервал довіри ля прогнозного значення на наступний рік.

Якщо побудована регресійна модель є адекватною, а це можна перевірити за допомогою критерія Фішера, то можна знаходити прогнозне значення залежної змінної . Нехай нам відомі значення -період. Тоді прогнозне значення нашого показника в цей період дорівнює:

. З іншого боку , де .

Таким чином точечну оцінку прогнозного значення можна знаходити за цими формулами. Для більшої достовірності використовують інтервальні оцінки (як для так і для )

Відомо, що дисперсія для прогнозного значення буде обчислюватися за формулою:

Інтервал довіри для індивідуального значення має вигляд:

Інтервал довіри для математичного сподівання індивідуального значення має вигляд:

, де

2.4 Мультиколініарність

При побудові структури регресії з одного боку потрібно включити в регресію всі фактори які мають суттєвий статистичний вплив на показник, а з іншого боку повинна бути виконана умова лінійної незалежності між факторами, якщо існує лінійна залежність хоча б між двома факторами, то кажуть, що в системі присутнє явище мультиколінеарності. Якщо між факторами і існує лінійна залежність то кажуть, що між цими факторами присутня строга мультиколінеарність. Враховуючи той факт, що фактори і - є випадковими величинами, то між ними існує приблизна лінійна залежність: , - деяке відхилення. В таких випадках кажуть, що між факторами існує нестрога мультиколінеарність. Якщо мультиколінеарність нестрога, то одержані оцінки регресії малонадійні. В цьому випадку незначні зміни вхідних даних приводять до значних змін оцінок параметрів.

2.5 Метод Фаррара-Глобера.

Для дослідження загальної мультиколінеарності і мультиколінеарності між окремими факторами використовують:

- кореляційна матриця елементами якого є , де - це коефіцієнти кореляції між та факторами, а також обернена матриця до матриці R.

Для дослідження загальної мультиколінеарності використовується критерій . Для цього розраховуємо число розрахункове:

Потім задається рівень значущості і для ступенів знаходимо табличне значення, яке залежить від і - .

Якщо виконується умова то можна стверджувати, що в системі присутнє явище мультиколінеарності.

2.6 Гетероскедатичність

Одним із основних припущень моделі класичної лінійної регресії є припущення про сталість дисперсії випадкової величини .

Якщо це припущення не задовольняється в деякому окремому випадку, тобто

то кажуть, що має місце явище гетероскедастичності.

Суть припущення гетероскедастичності полягає в тому, що дисперсія випадкової величини навколо її математичного сподівання є величиною сталою і не залежить від значення .

2.7 Тест Гольдфельда-Квандта

Цей тест застосовується до великих вибірок, для яких спостережень має бути хоча б вдвічі більше, ніж оцінюваних параметрів.

Тест припускає нормальний розподіл та незалежність випадкової величини .

Для застосування тесту сформулюємо нульову та альтернативну гіпотези:

- полягає в тому, що є гомоскедастичною.

- полягає в тому, що є гетероскедастична величина зі зростаючою дисперсією.

Тест складається з декількох етапів:

Етап І:

Ранжуємо спостереження незалежної змінної в порядку зростання. У разі багатофакторної регресії, коли ми маємо більше ніж одну незалежну змінну, обираємо одну з них і для неї проводимо ранжування.

Якщо важко апріорі визначити змінну для ранжування, то по черзі проводимо ранжування за кожною змінною і в кожному випадку застосовуємо тест Гольдфельда-Квандта.

Етап ІІ:

Задаємо величину - кількість центральних спостережень за незалежною змінною , які ми будемо виключати з подальшого аналізу: .

Залишок (n-C) спостережень ділиться на 2 рівні підвибірки однакового розміру , одна з яких включає малі значення x , інша – великі.

Етап ІІІ:

Будуємо окремо регресію для кожної підвибірки і розраховуємо суму квадратів залишків. В результаті отримаємо:

Сума квадратів залишків для підвибірки з малими значеннями х:

Сума квадратів залишків для підвибірки з великими значеннями х:

Для обох сум кількість ступенів вільностей , де k- кількість параметрів нашої моделі. Якщо кожну з цих сум поділити на кількість ступенів вільності, то отримаємо оцінки дисперсії величини у двох підвибірках. Обчислюємо значення відношення двох дисперсій:. Ця величина має розподіл Фішера з ступенями вільності k та k, де k = k=.

Якщо 2-і дисперсії рівні, то F=1. Якщо F1, то для заданого рівня значущості шукаємо табл. Значення розподілу Фішера, тобто . Якщо виконується умова, що F>, то це означає, що не виконується, тобто моделі присутнє явище гетероскедостичності і навпаки.

3. Розрахункова частина

3.1 Проста лінійна регресійна модель

Для побудови простої регресійної моделі між і виду [1]. За ми візьмемо строку « Усього », а за - « Випуск (в основних цінах)» (табл.1).

Табл.1

	2000	2001	2002	2003	2004	2005	2006	2007	2008
Ресурси
Випуск (в основних цінах)	373893	460520	504008	603704	809988	995630	1182179	1565055	2072172
Податки за виключенням субсидій на продукти	25808	23700	24616	27127	32067	52851	70030	85937	123880
Усього	399701	484220	528624	630831	842055	1048481	1252209	1650992	2196052
Використання
Проміжне споживання	229631	280030	302814	363487	496942	607029	708056	930261	1247996
Валовий внутрішній продукт (у ринкових цінах)	170070	204190	225810	267344	345113	441452	544153	720731	948056
Усього	399701	484220	528624	630831	842055	1048481	1252209	1650992	2196052
Споживання основного капіталу	–30223	–34303	–36160	–38885	–46576	–50545	–58265	–73071	–87914
Чистий внутрішній продукт	139847	169887	189650	228459	298537	390907	485888	647660	860142

Для скорочення зробимо заміну 2000 р. на 1, 2001 р. на 2 … 2008 р. на 9. Скомпонуємо данні у більш зручну таблицю (табл.2), та додамо необхідні нам у розрахунках стовпчики (, ) та рядкий

Табл.2

N
1	399701	373893	139795975449	149445405993
2	484220	460520	212078670400	222992994400
3	528624	504008	254024064064	266430724992
4	630831	603704	364458519616	380835198024
5	842055	809988	656080560144	682054445340
6	1048481	995630	991279096900	1043899138030
7	1252209	1182179	1397547188041	1480335183411
8	1650992	1565055	2449397153025	2583893284560
9	2196052	2072172	4293896797584	4550597464944
	9 033 165,00	8567149	10758558025223	11360483839694
	1 003 685,00	951 905,44	1195395336135,89	1262275982188,22

Та знайдемо b₁ та b₀:

b₀=183517,397226

b₁=0,861606

3.1.1 Перевірка регресійної моделі на адеватність за допомогою коефіціента кореляціїї та критерію Фішера.

Отже, розрахуємо коефіціент кореляціїї:

cov(x,y)= 306862766181

var(x)= 289271360972,91

var(y)= 325553794394,22

Г_ух= 0,999954169

Отже, розрахуємо критерій Фішера та перевіримо за допомогою цього критерія регресивну функцію на адекватність.

Информация о работе Статистичний аналіз рахунок виробництва