Автор работы: Пользователь скрыл имя, 02 Декабря 2013 в 01:41, курсовая работа
У наш час великих обсягів інформації потрібен аналіз для того, щоб вірно оцінювати данні. Особливо це важливо в економіці, щоб знати чого очікувати, що змінюється,а без статистики просто глянути на таблиці і щось сказати неможливо так, як це дуже величезні масиви інформації про соціально-економічні явища і процеси.
Вступ 3
1. Постановка задачі 4
2. Теоретична частина 6
2.1 Проста лінійні регресійна модель 6
2.2 Багатофакторна модель 7
2.3 Етапи побудови багатофакторної регресійної моделі: 8
2.4 Мультиколініарність 13
2.5 Метод Фаррара-Глобера. 13
2.6 Гетероскедатичність 13
2.7 Тест Гольдфельда-Квандта 14
3. Розрахункова частина 16
3.1 Проста лінійна регресійна модель 16
3.1.1 Перевірка регресійної моделі на адеватність за допомогою коефіціента кореляціїї та критерію Фішера. 17
3.1.2Перервірка значущості коефіцієнтів 17
3.1.3 Інтервали довіри для , 18
3.1.4 Інтервал довіри для прогнозного значення 18
3.2 Багатофакторна регресійна модель 18
3.2.1 Матриця кореляції 19
3.2.2 Знаходження невідомих параметрів 19
3.2.3 Перевірка на адекватність багатофакторної регресійної моделі 21
3.2.4 Множинний коефіціет кореляції 21
3.2.5 Варіаційно-коваріаційна матриця параметрів багатофакторної регресійної моделі 22
3.2.6 Перевірка значущості коефіцієнтів побудованої багатофакторної регресії за допомогою критерію Стьюдента 22
3.2.7 Побудова інтервалів довіри для знайдених параметрів . 23
3.2.8 Знаходження прогнозованого значення і побудова інтервалів довіри для прогнозного значення та математичного сподівання. 23
3.3 Мультиколініарність 24
3.3.1Метод Фаррара-Глобера. 24
3.4Гетероскедатичність 24
3.5 Графічне представлення даних 26
Висновок 27
Література 29
Міністерство освіти та науки України
Дніпропетровський національний університет ім. О.Гончара
Факультет прикладної математики
Кафедра комп’ютерних технологій
Курсова робота
з дисципліни «Аналіз даних»
Варіант №2
на тему «Статистичний аналіз рахунок виробництва»
Виконала:
студентка групи ПК-09-1
Вержбицька М.М.
______________________
______________________
Перевірили:
ст.в. ККТ ФПМ Лисиця Н.Н.
ст.в. ККТ ФПМ Сірик С.Ф.
______________________
______________________
м. Дніпропетровськ
2011 р.
Зміст
Вступ 3
1. Постановка задачі 4
2. Теоретична частина 6
2.1 Проста лінійні регресійна модель 6
2.2 Багатофакторна модель 7
2.3 Етапи побудови багатофакторної регресійної моделі: 8
2.4 Мультиколініарність 13
2.5 Метод Фаррара-Глобера. 13
2.6 Гетероскедатичність 13
2.7 Тест Гольдфельда-Квандта 14
3. Розрахункова частина 16
3.1 Проста лінійна регресійна модель 16
3.1.1 Перевірка регресійної моделі на адеватність за допомогою коефіціента кореляціїї та критерію Фішера. 17
3.1.2Перервірка значущості коефіцієнтів 17
3.1.3 Інтервали довіри для , 18
3.1.4 Інтервал довіри для прогнозного значення 18
3.2 Багатофакторна регресійна модель 18
3.2.1 Матриця кореляції 19
3.2.2 Знаходження невідомих параметрів 19
3.2.3 Перевірка на адекватність багатофакторної регресійної моделі 21
3.2.4 Множинний коефіціет кореляції 21
3.2.5 Варіаційно-коваріаційна матриця параметрів багатофакторної регресійної моделі 22
3.2.6 Перевірка значущості коефіцієнтів побудованої багатофакторної регресії за допомогою критерію Стьюдента 22
3.2.7 Побудова інтервалів довіри для знайдених параметрів . 23
3.2.8 Знаходження прогнозованого значення і побудова інтервалів довіри для прогнозного значення та математичного сподівання. 23
3.3 Мультиколініарність 24
3.3.1Метод Фаррара-Глобера. 24
3.4Гетероскедатичність 24
3.5 Графічне представлення даних 26
Висновок 27
Література 29
У наш час великих обсягів інформації потрібен аналіз для того, щоб вірно оцінювати данні. Особливо це важливо в економіці, щоб знати чого очікувати, що змінюється,а без статистики просто глянути на таблиці і щось сказати неможливо так, як це дуже величезні масиви інформації про соціально-економічні явища і процеси.
Тому в даній роботі ми розглядали реальні данні взяті з державного сайту, щоб побачити та навчитись як робиться аналіз даних. Для цього ми використовували кореляційний, регресивний та факторний аналіз обробки статистичних даних.
Також для здійснення розрахунків були використанні Microsoft Excel.
Для статистичних даних узятих зі сайту ukrstat.gov.ua потрібно:
За допомогою даних методів потрібно зробити статистичний аналіз рахунку виробництва:
Рахунок виробництва
(у фактичних цінах; млн.грн.)
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
2006 |
2007 |
2008 | |
Ресурси | |||||||||
Випуск (в основних цінах) |
373893 |
460520 |
504008 |
603704 |
809988 |
995630 |
1182179 |
1565055 |
2072172 |
Податки за виключенням субсидій на продукти |
25808 |
23700 |
24616 |
27127 |
32067 |
52851 |
70030 |
85937 |
123880 |
Усього |
399701 |
484220 |
528624 |
630831 |
842055 |
1048481 |
1252209 |
1650992 |
2196052 |
Використання | |||||||||
Проміжне споживання |
229631 |
280030 |
302814 |
363487 |
496942 |
607029 |
708056 |
930261 |
1247996 |
Валовий внутрішній продукт (у ринкових цінах) |
170070 |
204190 |
225810 |
267344 |
345113 |
441452 |
544153 |
720731 |
948056 |
Усього |
399701 |
484220 |
528624 |
630831 |
842055 |
1048481 |
1252209 |
1650992 |
2196052 |
Споживання основного капіталу |
–30223 |
–34303 |
–36160 |
–38885 |
–46576 |
–50545 |
–58265 |
–73071 |
–87914 |
Чистий внутрішній продукт |
139847 |
169887 |
189650 |
228459 |
298537 |
390907 |
485888 |
647660 |
860142 |
За наведеними даними потрібно побудувати просту регресійну модель між і виду:
[1] .
Для цьго потрібно знайти за формулою b1 та b0:
[1] , де - це середне значення х; - це сердне значення у.
[1] .
А для перевірки ціїї моделі на адекватність, потрібно знайти Відомо, що коефіціент кореляціїї розраховується за формулою:
коефіціент кореляціїї:
І, якщо коефіціент кореляції більше ніж 0,8, то вплив х на у є значним; якщо меньше, то не значний, а, якщо дорівнює 0,5, то потрібно додатково перевіряти за допомгою критерія Фішера.
Критерій Фішера розраховується за допомогою:
І, якщо Fроз. > Fтаб. , то побудована регрессивна модель є адекватна щодо спостережуванних данних.
Тепер потрібно перевірити значущості коефіцієнтів за допомогою критерію Стьюдента.
Обчислення розрахункове число Стьюдента за формулою:
А дисперсію будемо обчислювати за формулою:
Потім задаємо рівень значущості α або рівень довіри ϒ і користуючись таблицею критичних точок розподілу Стьюдента, знаходимо теоретичне значення розподілу Стьюдента
Якщо виконується умова , то даний коефіцієнт є значним.
Щодо інтервалів довіри, то вони знаходяться за формулою
[2]
А так як на основі спостережуванних данних можна побудувати просту лінійну вибіркову регерсію . Використовуючи цю формулу можна знайти прогнозне значення для
[2]
Візьмемо
Як бачимо із формули дисперсії, найкращий прогноз буде для тих значень х, які будуть наближенні до значень .
Багатофакторна узагальнена регресійна модель має вигляд:
,
де - деякий показник,
- незалежні фактори,
- неспостережувана випадкова
- деякі сталі .
Тобто багатофакторна узагальнена регресійна модель характеризує залежність деякого показника y від факторів х0,…,хm для усієї генеральної сукупності.
Використовуючи спостережувані дані, ми можемо побудувати багатофакторну вибіркову регресійну модель:
,
де - випадкові величини,
- це помилка або відхилення.
При побудові вибіркової багатофакторної лінійної моделі допускаються припущення:
1)
2) const
3)
4) Відсутність
Для початку із заданих нам статистичних даних треба вибрати всі можливі фактори, що впливають на показник, що вивчається. У нашому випадку можливими факторами є :
Це ми обрали наші х – фактори. Для подальшого аналізу будуємо матрицю кореляції R. Для зручності запишемо результати у таблицю, рахуючи
Одним із етапів побудови багатофакторної регресійної моделі є математично-статистичний аналіз факторів. На цьому етапі будується матриця кореляції R.
,
де - коефіцієнт кореляціі між факторами xi і xj .
Після того, як побудована матриця кореляції, починаємо аналізувати значення цих коефіцієнтів: якщо модуль значення коефіцієнта кореляції близьке до 1, то вважаємо, що між факторами існує явище мультиколініарності. І цьому випадку один із факторів xi або xj необхідно виключити з моделі. Виключається той фактор, значення коефіцієнта кореляції якого за модулем менше.
Після отримаємо незалежні фактори. Вони являються базою для нашої багатофакторної моделі. І тепер потрібно знайти невідомі праметри.