Статистичний аналіз рахунок виробництва

Автор работы: Пользователь скрыл имя, 02 Декабря 2013 в 01:41, курсовая работа

Описание работы

У наш час великих обсягів інформації потрібен аналіз для того, щоб вірно оцінювати данні. Особливо це важливо в економіці, щоб знати чого очікувати, що змінюється,а без статистики просто глянути на таблиці і щось сказати неможливо так, як це дуже величезні масиви інформації про соціально-економічні явища і процеси.

Содержание работы

Вступ 3
1. Постановка задачі 4
2. Теоретична частина 6
2.1 Проста лінійні регресійна модель 6
2.2 Багатофакторна модель 7
2.3 Етапи побудови багатофакторної регресійної моделі: 8
2.4 Мультиколініарність 13
2.5 Метод Фаррара-Глобера. 13
2.6 Гетероскедатичність 13
2.7 Тест Гольдфельда-Квандта 14
3. Розрахункова частина 16
3.1 Проста лінійна регресійна модель 16
3.1.1 Перевірка регресійної моделі на адеватність за допомогою коефіціента кореляціїї та критерію Фішера. 17
3.1.2Перервірка значущості коефіцієнтів 17
3.1.3 Інтервали довіри для , 18
3.1.4 Інтервал довіри для прогнозного значення 18
3.2 Багатофакторна регресійна модель 18
3.2.1 Матриця кореляції 19
3.2.2 Знаходження невідомих параметрів 19
3.2.3 Перевірка на адекватність багатофакторної регресійної моделі 21
3.2.4 Множинний коефіціет кореляції 21
3.2.5 Варіаційно-коваріаційна матриця параметрів багатофакторної регресійної моделі 22
3.2.6 Перевірка значущості коефіцієнтів побудованої багатофакторної регресії за допомогою критерію Стьюдента 22
3.2.7 Побудова інтервалів довіри для знайдених параметрів . 23
3.2.8 Знаходження прогнозованого значення і побудова інтервалів довіри для прогнозного значення та математичного сподівання. 23
3.3 Мультиколініарність 24
3.3.1Метод Фаррара-Глобера. 24
3.4Гетероскедатичність 24
3.5 Графічне представлення даних 26
Висновок 27
Література 29

Скачать архив (336.54 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

ан_дан ВММ Курсова.docx

— 434.33 Кб (Скачать файл)

Міністерство освіти та науки України

Дніпропетровський національний університет ім. О.Гончара

Факультет прикладної математики

Кафедра комп’ютерних технологій

Курсова робота

з дисципліни «Аналіз даних»

Варіант №2

на тему «Статистичний аналіз рахунок виробництва»

Виконала:

студентка групи ПК-09-1

Вержбицька М.М.

______________________

Перевірили:

ст.в. ККТ ФПМ Лисиця Н.Н.

ст.в. ККТ ФПМ Сірик С.Ф.

______________________

м. Дніпропетровськ

2011 р.

Зміст

Вступ 3

1. Постановка задачі 4

2. Теоретична частина 6

2.1 Проста лінійні регресійна модель 6

2.2 Багатофакторна модель 7

2.3 Етапи побудови багатофакторної регресійної моделі: 8

2.4 Мультиколініарність 13

2.5 Метод Фаррара-Глобера. 13

2.6 Гетероскедатичність 13

2.7 Тест Гольдфельда-Квандта 14

3. Розрахункова частина 16

3.1 Проста лінійна регресійна модель 16

3.1.1 Перевірка регресійної моделі на адеватність за допомогою коефіціента кореляціїї та критерію Фішера. 17

3.1.2Перервірка значущості коефіцієнтів 17

3.1.3 Інтервали довіри для , 18

3.1.4 Інтервал довіри для прогнозного значення 18

3.2 Багатофакторна регресійна модель 18

3.2.1 Матриця кореляції 19

3.2.2 Знаходження невідомих параметрів 19

3.2.3 Перевірка на адекватність багатофакторної регресійної моделі 21

3.2.4 Множинний коефіціет кореляції 21

3.2.5 Варіаційно-коваріаційна матриця параметрів багатофакторної регресійної моделі 22

3.2.6 Перевірка значущості коефіцієнтів побудованої багатофакторної регресії за допомогою критерію Стьюдента 22

3.2.7 Побудова інтервалів довіри для знайдених параметрів . 23

3.2.8 Знаходження прогнозованого значення і побудова інтервалів довіри для прогнозного значення та математичного сподівання. 23

3.3 Мультиколініарність 24

3.3.1Метод Фаррара-Глобера. 24

3.4Гетероскедатичність 24

3.5 Графічне представлення даних 26

Висновок 27

Література 29

Вступ

Тому в даній роботі ми розглядали реальні данні взяті з державного сайту, щоб побачити та навчитись як робиться аналіз даних. Для цього ми використовували кореляційний, регресивний та факторний аналіз обробки статистичних даних.

Регресійний аналіз – це могутній і гнучкий метод установлення форми і вивчення зв'язків між метричної залежної перемінною й однієї чи декількома незалежними перемінними. Був введений в статистику в кінці минулого століття Гальтоном.
Кореляційний аналіз – предметом вивчення є взаємозв’язок випадкових величин. За допомогою кореляційного аналізу установлюється ступінь цього зв’язку. Цей аналіз був розроблений наприкінці XIX, початку XX ст. Пірсоном.
Факторний аналіз – метод аналізу взаємозалежності, оскільки у факторному аналізі перевіряються усілякі варіанти взаємозалежних зв'язків. Основною задачею факторного аналізу є побудова матриці факторів і інтерпретація цих факторів. Вихідними даними для факторного аналізу є кореляційна матриця, отримана в ході кореляційного аналізу.

Також для здійснення розрахунків були використанні Microsoft Excel.

1. Постановка задачі

Для статистичних даних узятих зі сайту ukrstat.gov.ua потрібно:

Побудувати рівняння простої лінійної регресії
Знайти коефіцієнт кореляції і зробити висновок про його адекватність
Зробити перевірку регресивної моделі на адекватність за допомогою критерію Фішера
Перевірити значущості коефіцієнтів за допомогою критерію Стьюдента
Побудувати інтервали довіри для знайдених
Знайти два довільних прогнозних значень та побудувати інтервали довіри для двох значень
Зробити математично-статистичний аналіз багатофакторної лінійної регресивної моделі на мультиколініарність
Побудувати багатофакторну лінійну регресивну модель
Зробити перевірки на адекватність багатофакторної лінійної регресивної моделі за допомогою критерію Фішера
Побудувати множинного коефіцієнту кореляції
Знайти варіаційно-коваріаційної матриці параметрів багатофакторної регресійної моделі.
Зробити перевірку значущості коефіцієнтів побудованої багатофакторної регресивної моделі
Побудова інтервалів довіри для знайдених параметрів .
Побудувати інтервали довіри для деякого прогнозного значення і для його математичного сподівання
Зробити перевірку присутності загальної мультиколініарності за допомогою теста Фаррара-Глобера.
Зробити оцінку наявності гетероскедатичності за допомогою текста Гольдфельда-Квандта
Представити графічно побудоване рівняння і спостережувані дані

За допомогою даних методів потрібно зробити статистичний аналіз рахунку виробництва:

Рахунок виробництва

(у фактичних цінах; млн.грн.)

	2000	2001	2002	2003	2004	2005	2006	2007	2008
Ресурси
Випуск (в основних цінах)	373893	460520	504008	603704	809988	995630	1182179	1565055	2072172
Податки за виключенням субсидій на продукти	25808	23700	24616	27127	32067	52851	70030	85937	123880
Усього	399701	484220	528624	630831	842055	1048481	1252209	1650992	2196052
Використання
Проміжне споживання	229631	280030	302814	363487	496942	607029	708056	930261	1247996
Валовий внутрішній продукт (у ринкових цінах)	170070	204190	225810	267344	345113	441452	544153	720731	948056
Усього	399701	484220	528624	630831	842055	1048481	1252209	1650992	2196052
Споживання основного капіталу	–30223	–34303	–36160	–38885	–46576	–50545	–58265	–73071	–87914
Чистий внутрішній продукт	139847	169887	189650	228459	298537	390907	485888	647660	860142

2. Теоретична частина

2.1 Проста лінійні регресійна модель

За наведеними даними потрібно побудувати просту регресійну модель між і виду:

[1].

Для цьго потрібно знайти за формулою b₁ та b_0:

[1], де - це середне значення х; - це сердне значення у.

[1].

А для перевірки ціїї моделі на адекватність, потрібно знайти Відомо, що коефіціент кореляціїї розраховується за формулою:

коефіціент кореляціїї:

І, якщо коефіціент кореляції більше ніж 0,8, то вплив х на у є значним; якщо меньше, то не значний, а, якщо дорівнює 0,5, то потрібно додатково перевіряти за допомгою критерія Фішера.

Критерій Фішера розраховується за допомогою:

І, якщо F_роз. > F_таб., то побудована регрессивна модель є адекватна щодо спостережуванних данних.

Тепер потрібно перевірити значущості коефіцієнтів за допомогою критерію Стьюдента.

Обчислення розрахункове число Стьюдента за формулою:

А дисперсію будемо обчислювати за формулою:

Потім задаємо рівень значущості α або рівень довіри ϒ і користуючись таблицею критичних точок розподілу Стьюдента, знаходимо теоретичне значення розподілу Стьюдента

Якщо виконується умова , то даний коефіцієнт є значним.

Щодо інтервалів довіри, то вони знаходяться за формулою

[2]

А так як на основі спостережуванних данних можна побудувати просту лінійну вибіркову регерсію . Використовуючи цю формулу можна знайти прогнозне значення для

[2]

Візьмемо

Як бачимо із формули дисперсії, найкращий прогноз буде для тих значень х, які будуть наближенні до значень .

2.2 Багатофакторна модель

Багатофакторна узагальнена регресійна модель має вигляд:

де - деякий показник,

- незалежні фактори,

- неспостережувана випадкова величина,

- деякі сталі .

Тобто багатофакторна узагальнена регресійна модель характеризує залежність деякого показника y від факторів х0,…,хm для усієї генеральної сукупності.

Використовуючи спостережувані дані, ми можемо побудувати багатофакторну вибіркову регресійну модель:

де - випадкові величини,

- це помилка або відхилення.

При побудові вибіркової багатофакторної лінійної моделі допускаються припущення:

2) const

4) Відсутність мультиколініарності між факторами , тобто фактори повинні бути незалежними між собою.

2.3 Етапи побудови багатофакторної регресійної моделі:

Вибір та аналіз усіх можливих факторів, які впливають на показник.
Математично-статистичний аналіз.
Вибір методу та побудова багатофакторної моделі.
Оцінка невідомих параметрів регресійної моделі.
Перевірка моделі на адекватність.
Побудова інтервалів довіри для знайдених параметрів і перевірка їх на значущість.

Для початку із заданих нам статистичних даних треба вибрати всі можливі фактори, що впливають на показник, що вивчається. У нашому випадку можливими факторами є :

за рахунок власних коштів
за рахунок державного бюджету
за рахуно коштів іноземних інвесторів
за рахунок коштів інших джерел

Це ми обрали наші х – фактори. Для подальшого аналізу будуємо матрицю кореляції R. Для зручності запишемо результати у таблицю, рахуючи

Одним із етапів побудови багатофакторної регресійної моделі є математично-статистичний аналіз факторів. На цьому етапі будується матриця кореляції R.

де - коефіцієнт кореляціі між факторами xi і xj .

Після того, як побудована матриця кореляції, починаємо аналізувати значення цих коефіцієнтів: якщо модуль значення коефіцієнта кореляції близьке до 1, то вважаємо, що між факторами існує явище мультиколініарності. І цьому випадку один із факторів xi або xj необхідно виключити з моделі. Виключається той фактор, значення коефіцієнта кореляції якого за модулем менше.

Після отримаємо незалежні фактори. Вони являються базою для нашої багатофакторної моделі. І тепер потрібно знайти невідомі праметри.

Информация о работе Статистичний аналіз рахунок виробництва