Статистичний аналіз рахунок виробництва

Автор работы: Пользователь скрыл имя, 02 Декабря 2013 в 01:41, курсовая работа

Описание работы

У наш час великих обсягів інформації потрібен аналіз для того, щоб вірно оцінювати данні. Особливо це важливо в економіці, щоб знати чого очікувати, що змінюється,а без статистики просто глянути на таблиці і щось сказати неможливо так, як це дуже величезні масиви інформації про соціально-економічні явища і процеси.

Содержание работы

Вступ 3
1. Постановка задачі 4
2. Теоретична частина 6
2.1 Проста лінійні регресійна модель 6
2.2 Багатофакторна модель 7
2.3 Етапи побудови багатофакторної регресійної моделі: 8
2.4 Мультиколініарність 13
2.5 Метод Фаррара-Глобера. 13
2.6 Гетероскедатичність 13
2.7 Тест Гольдфельда-Квандта 14
3. Розрахункова частина 16
3.1 Проста лінійна регресійна модель 16
3.1.1 Перевірка регресійної моделі на адеватність за допомогою коефіціента кореляціїї та критерію Фішера. 17
3.1.2Перервірка значущості коефіцієнтів 17
3.1.3 Інтервали довіри для , 18
3.1.4 Інтервал довіри для прогнозного значення 18
3.2 Багатофакторна регресійна модель 18
3.2.1 Матриця кореляції 19
3.2.2 Знаходження невідомих параметрів 19
3.2.3 Перевірка на адекватність багатофакторної регресійної моделі 21
3.2.4 Множинний коефіціет кореляції 21
3.2.5 Варіаційно-коваріаційна матриця параметрів багатофакторної регресійної моделі 22
3.2.6 Перевірка значущості коефіцієнтів побудованої багатофакторної регресії за допомогою критерію Стьюдента 22
3.2.7 Побудова інтервалів довіри для знайдених параметрів . 23
3.2.8 Знаходження прогнозованого значення і побудова інтервалів довіри для прогнозного значення та математичного сподівання. 23
3.3 Мультиколініарність 24
3.3.1Метод Фаррара-Глобера. 24
3.4Гетероскедатичність 24
3.5 Графічне представлення даних 26
Висновок 27
Література 29

Файлы: 1 файл

ан_дан ВММ Курсова.docx

— 434.33 Кб (Скачать файл)

Міністерство освіти та науки  України

Дніпропетровський національний університет ім. О.Гончара

Факультет прикладної математики

Кафедра комп’ютерних технологій

 

 

 

 

 

 

 

 

 

 

 

Курсова робота

з дисципліни «Аналіз даних»

Варіант №2

на тему «Статистичний  аналіз рахунок виробництва»

 

 

 

 

 

 

 

 

 

 

 

 

 

Виконала:

студентка групи ПК-09-1

Вержбицька М.М.

______________________

______________________

 

Перевірили:

ст.в. ККТ ФПМ Лисиця Н.Н.

ст.в. ККТ ФПМ Сірик  С.Ф.

______________________

______________________

 

 

 

 

 

м. Дніпропетровськ

2011  р.

 

Зміст

 

Вступ 3

1. Постановка задачі 4

2. Теоретична частина 6

2.1 Проста лінійні регресійна модель 6

2.2 Багатофакторна модель 7

2.3 Етапи побудови багатофакторної регресійної моделі: 8

2.4 Мультиколініарність 13

2.5 Метод Фаррара-Глобера. 13

2.6 Гетероскедатичність 13

2.7 Тест Гольдфельда-Квандта 14

3. Розрахункова частина 16

3.1 Проста лінійна регресійна модель 16

3.1.1 Перевірка регресійної моделі на адеватність за допомогою коефіціента кореляціїї та критерію Фішера. 17

3.1.2Перервірка значущості коефіцієнтів 17

3.1.3 Інтервали довіри для ,  18

3.1.4 Інтервал довіри для прогнозного значення 18

3.2 Багатофакторна регресійна модель 18

3.2.1 Матриця кореляції 19

3.2.2 Знаходження невідомих параметрів 19

3.2.3 Перевірка на адекватність багатофакторної регресійної моделі 21

3.2.4 Множинний коефіціет кореляції 21

3.2.5 Варіаційно-коваріаційна матриця параметрів багатофакторної регресійної моделі 22

3.2.6 Перевірка значущості коефіцієнтів побудованої багатофакторної регресії за допомогою критерію Стьюдента 22

3.2.7 Побудова інтервалів довіри для знайдених параметрів 23

3.2.8 Знаходження прогнозованого значення і побудова інтервалів довіри для прогнозного значення та математичного сподівання. 23

3.3 Мультиколініарність 24

3.3.1Метод Фаррара-Глобера. 24

3.4Гетероскедатичність 24

3.5 Графічне представлення даних 26

Висновок 27

Література 29

 

 

 

Вступ

У наш час великих обсягів  інформації потрібен аналіз для того, щоб вірно оцінювати данні. Особливо це важливо в економіці, щоб знати  чого очікувати, що змінюється,а без  статистики просто глянути на таблиці  і щось сказати неможливо так, як  це дуже величезні масиви інформації про соціально-економічні явища і процеси.

Тому в даній роботі ми розглядали реальні данні взяті з державного сайту, щоб побачити та навчитись як робиться аналіз даних. Для цього ми використовували кореляційний, регресивний та факторний аналіз обробки статистичних даних.

  1. Регресійний аналіз – це могутній і гнучкий метод установлення форми і вивчення зв'язків між метричної залежної перемінною й однієї чи декількома незалежними перемінними. Був введений в статистику в кінці минулого століття Гальтоном.
  2. Кореляційний аналіз – предметом вивчення є взаємозв’язок випадкових величин. За допомогою кореляційного аналізу установлюється ступінь цього зв’язку. Цей аналіз був розроблений наприкінці XIX, початку XX ст. Пірсоном.
  3. Факторний аналіз – метод аналізу взаємозалежності, оскільки у факторному аналізі перевіряються усілякі варіанти взаємозалежних зв'язків. Основною задачею факторного аналізу є побудова матриці факторів і інтерпретація цих факторів. Вихідними даними для факторного аналізу є кореляційна матриця, отримана в ході кореляційного аналізу.

Також для здійснення розрахунків  були використанні Microsoft Excel.

 

1. Постановка задачі

Для статистичних даних узятих зі сайту ukrstat.gov.ua потрібно:

  1. Побудувати рівняння простої лінійної регресії
  2. Знайти коефіцієнт кореляції і зробити висновок про його адекватність
  3. Зробити перевірку регресивної моделі на адекватність за допомогою критерію Фішера
  4. Перевірити значущості коефіцієнтів за допомогою критерію Стьюдента
  5. Побудувати інтервали довіри для знайдених
  6. Знайти два довільних прогнозних значень та побудувати інтервали довіри для двох значень
  7. Зробити математично-статистичний аналіз багатофакторної лінійної регресивної моделі на мультиколініарність
  8. Побудувати багатофакторну лінійну регресивну модель
  9. Зробити перевірки на адекватність багатофакторної лінійної регресивної моделі за допомогою критерію Фішера
  10. Побудувати множинного коефіцієнту кореляції
  11. Знайти варіаційно-коваріаційної матриці параметрів багатофакторної регресійної моделі.
  12. Зробити перевірку значущості коефіцієнтів побудованої багатофакторної регресивної моделі
  13. Побудова інтервалів довіри для знайдених параметрів .
  14. Побудувати інтервали довіри для деякого прогнозного значення і для його математичного сподівання
  15. Зробити перевірку присутності загальної мультиколініарності за допомогою теста Фаррара-Глобера.
  16. Зробити оцінку наявності гетероскедатичності за допомогою текста Гольдфельда-Квандта
  17. Представити графічно побудоване рівняння і спостережувані дані

За допомогою даних  методів потрібно зробити статистичний аналіз рахунку виробництва:

 

Рахунок виробництва

(у фактичних цінах; млн.грн.)

 

2000

2001

2002

2003

2004

2005

2006

2007

2008

Ресурси

Випуск (в основних цінах)

373893

460520

504008

603704

809988

995630

1182179

1565055

2072172

Податки за виключенням субсидій на продукти

25808

23700

24616

27127

32067

52851

70030

85937

123880

Усього

399701

484220

528624

630831

842055

1048481

1252209

1650992

2196052

Використання

Проміжне споживання

229631

280030

302814

363487

496942

607029

708056

930261

1247996

Валовий внутрішній продукт (у ринкових цінах)

170070

204190

225810

267344

345113

441452

544153

720731

948056

Усього

399701

484220

528624

630831

842055

1048481

1252209

1650992

2196052

Споживання основного  капіталу

–30223

–34303

–36160

–38885

–46576

–50545

–58265

–73071

–87914

Чистий внутрішній продукт

139847

169887

189650

228459

298537

390907

485888

647660

860142


 

 

2. Теоретична частина

2.1 Проста лінійні регресійна модель

За наведеними даними потрібно побудувати  просту регресійну модель між  і виду:

 [1] .

Для цьго потрібно знайти за формулою b1 та b0:

[1] , де - це середне значення х; - це сердне значення у.

[1] .

А для перевірки ціїї моделі на адекватність, потрібно знайти Відомо, що коефіціент кореляціїї розраховується за формулою:

коефіціент кореляціїї:

І, якщо коефіціент кореляції  більше ніж 0,8, то вплив х на у є значним; якщо меньше, то не значний, а, якщо дорівнює 0,5, то потрібно додатково перевіряти за допомгою критерія Фішера.

Критерій Фішера розраховується за допомогою:

І, якщо Fроз. > Fтаб. , то побудована регрессивна модель є адекватна щодо спостережуванних данних.

Тепер потрібно перевірити значущості коефіцієнтів за допомогою критерію Стьюдента.

Обчислення розрахункове число Стьюдента за формулою:

А дисперсію будемо обчислювати за формулою:

Потім задаємо рівень значущості α або рівень довіри ϒ і користуючись таблицею критичних точок розподілу  Стьюдента, знаходимо теоретичне значення розподілу Стьюдента

Якщо виконується умова  , то даний коефіцієнт є значним.

Щодо інтервалів довіри, то вони знаходяться за формулою

[2]

 

А так як на основі спостережуванних данних можна побудувати просту лінійну вибіркову регерсію . Використовуючи цю формулу можна знайти прогнозне значення для

[2]

 

 

Візьмемо 

Як бачимо із формули дисперсії, найкращий прогноз буде для тих  значень х, які будуть наближенні до значень  .

2.2 Багатофакторна модель

Багатофакторна узагальнена  регресійна модель має вигляд:

,

де  - деякий показник,

- незалежні фактори,

- неспостережувана випадкова величина,

- деякі сталі .

Тобто багатофакторна узагальнена  регресійна модель характеризує залежність деякого показника y від факторів х0,…,хm для усієї генеральної  сукупності.

Використовуючи спостережувані дані, ми можемо побудувати багатофакторну вибіркову регресійну модель:

,

де  - випадкові величини,

- це помилка або відхилення.

 

При побудові вибіркової багатофакторної  лінійної моделі допускаються припущення:

1)

2) const

3)

4) Відсутність мультиколініарності  між факторами  , тобто фактори повинні бути незалежними між собою.

2.3 Етапи побудови багатофакторної регресійної моделі:

  1. Вибір та аналіз усіх можливих факторів, які впливають на показник.
  2. Математично-статистичний аналіз.
  3. Вибір методу та побудова багатофакторної моделі.
  4. Оцінка невідомих параметрів регресійної моделі.
  5. Перевірка моделі на адекватність.
  6. Побудова інтервалів довіри для знайдених параметрів і перевірка їх на значущість.

Для початку із заданих  нам статистичних даних треба  вибрати всі можливі фактори, що впливають на показник, що вивчається. У нашому випадку можливими факторами  є :

    • за рахунок власних коштів
    • за рахунок державного бюджету
    • за рахуно коштів іноземних інвесторів
    • за рахунок коштів інших джерел

Це ми обрали наші х –  фактори. Для подальшого аналізу  будуємо матрицю кореляції R.  Для зручності запишемо результати у таблицю, рахуючи 

 

Одним із етапів побудови багатофакторної  регресійної моделі є математично-статистичний аналіз факторів. На цьому етапі  будується матриця кореляції R.

  ,


 

де  - коефіцієнт кореляціі між факторами xi і xj .

Після того, як побудована матриця  кореляції, починаємо аналізувати  значення цих коефіцієнтів: якщо модуль значення коефіцієнта кореляції  близьке до 1, то вважаємо, що між факторами існує явище мультиколініарності. І цьому випадку один із факторів xi або xj необхідно виключити з моделі. Виключається той фактор, значення коефіцієнта кореляції якого за модулем менше.

Після отримаємо незалежні  фактори. Вони являються базою для  нашої багатофакторної моделі. І  тепер потрібно знайти невідомі праметри.

Информация о работе Статистичний аналіз рахунок виробництва