Статистическое исследование корреляционной связи

Автор работы: Пользователь скрыл имя, 20 Ноября 2012 в 21:43, курсовая работа

Описание работы

Цель статистики в экономике – это возможность правильно выбрать решения в условиях неопределенности сложившейся ситуации, умение спрогнозировать и предугадать социально-экономические явления, сделать правильные выводы и внести свой вклад в развитие экономической жизни.
Выявление взаимосвязей – одна из важнейших задач применения статистики в экономике.

Содержание работы

Введение ………………………………………………………………………...3
1. Корреляционная связь………………………………………………………..5
1.1 Понятие корреляционной связи…………………………………..…….5
1.2 Коэффициенты корреляции………………………………………...…...8
1.3 Коэффициент корреляции Пирсона………………………………...…11
1.4.Корреляционно-регрессионный метод анализа………………...….…13
1.5.Непараметрические показатели связи…………………………...……14
2. Исследование корреляционной зависимости в социально-экономических процессах…………………………………………………………………..…...…17
2.1 Формула Пирсона ..……………………………………...…..……...…17
2.2. Задачи регрессионного анализа………………………………...…..…19
2.3. Выявление закономерности, выраженной в виде корреляционного уравнения……………………………………………………………………..……21
Заключение…………………………………………...…………….…………...…22
Список используемой литературы………………………………….……………24
Приложение 1……………………………………………………………….….26
Приложение 2…………………………………………………………………. 27

Файлы: 1 файл

курсовая Статистика.doc

— 267.50 Кб (Скачать файл)

Число степеней свободы  k=n-2.

 

1.4. Корреляционно-регрессионный метод анализа

Методы регрессионного анализа рассчитаны, главным образом, на случай устойчивого нормального распределения, в котором изменения от опыта к опыту проявляются лишь в виде независимых испытаний.

Выделяются различные  формальные задачи регрессионного анализа. Они могут быть простыми или сложными по формулировкам, по математическим средствам и трудоемкости.

Первая задача — выявить факт изменчивости изучаемого явления при определенных, но не всегда четко фиксированных условиях.

Вторая задача — выявить тенденцию как периодическое изменение признака. Сам по себе этот признак может быть зависим или не зависим от переменной-условия (он может зависеть от неизвестных или неконтролируемых исследователем условий).

Проверка гипотез об отсутствии или наличии тенденции  может выполняться с использованием критерия Аббе.

Критерий Аббе предназначен для проверки гипотез о равенстве средних значений, установленных для 4<n<60 взаимно независимых нормально распределенных выборок.

Эмпирическое значение критерия Аббе вычисляется по формуле:

   (2)

где    —   среднее арифметическое из выборки;

п – число значений в выборке.

Согласно критерию, гипотеза о равенстве средних отклоняется (принимается альтернативная гипотеза), если значение статистики . Табличное (критическое) значение статистики определяется из таблицы для q-критерия Аббе.

В качестве таких величин, для которых применим критерий Аббе, могут выступать выборочные доли или проценты, средние арифметические и другие статистики выборочных распределений, если они близки к нормальному (или предварительно нормализованы). Поэтому критерий Аббе может найти широкое применение в психолого-педагогических исследованиях. Рассмотрим пример выявления тенденции с помощью критерия Аббе.

Третья задача – это выявление закономерности, выраженной в виде корреляционного уравнения (регрессии).

 

1.5. Непараметрические показатели связи

В статистической практике могут встречаться такие случаи, когда качества факторных и результативных признаков не могут быть выражены численно. Поэтому для измерения тесноты зависимости необходимо использовать другие показатели. Для этих целей используются так называемые непараметрические методы.

Наибольшее распространение имеют ранговые коэффициенты корреляции, в основу которых положен принцип нумерации значений статистического ряда. При использовании коэффициентов корреляции рангов коррелируются не сами значения показателей х и у, а только номера их мест, которые они занимают в каждом ряду значений. В этом случае номер каждой отдельной единицы будет ее рангом.

Коэффициент корреляции рангов Спирмэна (р) основан на рассмотрении разности рангов значений результативного и факторного признаков и может быть рассчитан по формуле

где d = Nx - Ny , т.е. разность рангов каждой пары значений х и у; n - число наблюдений.

Ранговый коэффициент корреляции Кендэла ( ) можно определить по формуле

где S = P + Q.

К непараметрическим  методам исследования можно отнести коэффициент ассоциации Кас и коэффициент контингенции Ккон , которые используются, если, например, необходимо исследовать тесноту зависимости между качественными признаками, каждый из которых представлен в виде альтернативных признаков.

Для определения этих коэффициентов создается расчетная таблица (см. Приложение 2.)

Коэффициент ассоциации можно расcчитать по формуле

Коэффициент контингенции рассчитывается по формуле

Нужно иметь в виду, что для одних и тех же данных коэффициент контингенции (изменяется от -1 до +1) всегда меньше коэффициента ассоциации.

Если необходимо оценить  тесноту связи между альтернативными  признаками, которые могут принимать любое число вариантов значений, применяется коэффициент взаимной сопряженности Пирсона (КП ).

Таблица 3.

Для исследования такого рода связи первичную статистическую информацию располагают в форме таблицы:

Признаки

A

B

C

Итого

D

m11

m12

m13

∑m1j

E

m21

m22

m23

∑m2j

F

m31

m32

m33

∑m3j

Итого

∑mj1

∑mj2

∑mj3

П


Здесь mij - частоты взаимного сочетания двух атрибутивных признаков; П - число пар наблюдений.

Коэффициент Фехнера, характеризующий элементарную степень тесноты связи, который целесообразно использовать для установления факта наличия связи, когда существует небольшой объем исходной информации. Данный коэффициент определяется по формуле

где na - количество совпадений знаков отклонений индивидуальных величин от их средней арифметической; nb - соответственно количество несовпадений.

Коэффициент Фехнера  может изменяться в пределах -1,0 ≤ Кф  ≤ +1,0.

 

 

2. Исследование корреляционной зависимости в социальных экономический процессах

2.1. Пример 1 формула  Пирсона

 10 школьникам были даны тесты на наглядно-образное и вербальное мышление. Измерялось среднее время решения заданий теста в секундах. Исследователя интересует вопрос: существует ли взаимосвязь между временем решения этих задач? Переменная X — обозначает среднее время решения наглядно-образных, а переменная Y— среднее время решения вербальных заданий тестов.

Решение.

Представим исходные данные в виде таблицы 2, в которой введены дополнительные столбцы, необходимые для расчета по формуле (1).

Таблица 4

№ испы-туемых

x

y

хi-

i- )2

yi-

(yi- )2

1

19

17

-16,7

278,9

-7,2

51,84

120,24

2

32

7

-3,7

13,69

-17,2

295,84

63,64

3

33

17

-2,7

7,29

-7,2

51,84

19,44

4

44

28

8,3

68,89

3,8

14,44

31,54

5

28

27

-7,7

59,29

2,8

7,84

-21,56

6

35

31

-0,7

0,49

6,8

46,24

-4,76

7

39

20

3,3

10,89

-4,2

17,64

-13,86

8

39

17

3,3

10,89

-7,2

51,84

-23,76

9

44

35

8,3

68,89

10,8

116,64

89,64

10

44

43

8,3

68,89

18,8

353,44

156,04

Сумма

357

242

 

588,1

 

1007,6

416,6

Среднее

35,7

24,2

         

 

  

Рассчитываем эмпирическую величину коэффициента корреляции по формуле (1):

При нахождении критических  значений для вычисленного коэффициента линейной корреляции Пирсона число  степеней свободы рассчитывается как

k = n – 2 = 8.

ккрит=0,72 > 0,54 , следовательно, гипотеза Н1 отвергается и принимается гипотеза H0, иными словами, связь между временем решения наглядно-образных и вербальных заданий теста не доказана.

2.2. Задачи регрессионного анализа

В табл. 5 представлена динамика процента студентов IV курса, на «отлично» сдававших экзамены в зимние сессии на протяжении 10 лет работы  одного из  факультетов университета.  Требуется установить, есть ли тенденция к повышению успеваемости.

Таблица 5.

Динамика процента отличников четвертого курса за 10 лет работы факультета

Учебный год

%

1995-96

10,8

1996-97

16,4

1997-98

17,4

1998-99

22,0

1999-00

23,0

2000-01

21,5

2001-02

26,1

2002-03

17,2

2003-04

27,5

2004-05

33,0




 

  

 

 

 

 

 

 

 

В качестве нулевой проверяем гипотезу об отсутствии тенденции, т. е. о равенстве процентов.

Усредняем проценты, приведенные в табл. 5, находим, что =21,5. Вычисляем разности между последующими и предыдущими значениями в выборке, возводим их в квадрат и суммируем:

Аналогично вычисляет знаменатель в формуле (1), суммируя квадраты разностей между каждым измерением и средним арифметическим:

Теперь по формуле (2) получаем:

В таблице критерия Аббе находим, что при n=10 и уровне значимости 0,05 критическое значение qкрит=0,5311 что больше полученного нами 0,41, следовательно гипотезу о равенстве процента «отличников» приходится отклонить, и можно принять альтернативную гипотезу о наличии тенденции.

 

 

2.3. Пример  это выявление закономерности, выраженной в виде корреляционного уравнения.

Эстонский исследователь Я. Микк, изучая трудности понимания текста, установил «формулу читаемости», которая представляет собой множественную линейную регрессию:

 — оценка трудности понимания  текста,

где х1 - длина самостоятельных предложений в количестве печатных знаков,

х2 - процент различных незнакомых слов,

х3 - абстрактность повторяющихся понятий, выраженных существительными.

Сравнивая между собой  коэффициенты регрессии, выражающие степень  влияния факторов, можно видеть, что трудность понимания текста определяется прежде всего его абстрактностью. Вдвое меньше (0,27) трудность понимания текста зависит от числа незнакомых слов и практически она совсем не зависит от длины предложении.

 

 

 

Заключение

В своей курсовой работе я попытался изложить основной теоретический  материал  по корреляционной связи.

 Корреляция — статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом, изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Математической мерой корреляции двух случайных величин служит коэффициент корреляции.

Некоторые виды коэффициентов  корреляции могут быть положительными или отрицательными (возможна также  ситуация отсутствия статистической взаимосвязи — например, для независимых случайных величин). Если предполагается, что на значениях переменных задано отношение строгого порядка, то отрицательная корреляция — корреляция, при которой увеличение одной переменной связано с уменьшением другой переменной, при этом коэффициент корреляции может быть отрицательным; положительная корреляция в таких условиях — корреляция, при которой увеличение одной переменной связано с увеличением другой переменной, при этом коэффициент корреляции может быть положительным.

Корреляционный  анализ — метод обработки статистических данных, заключающийся в изучении коэффициентов корреляции между переменными. При этом сравниваются коэффициенты корреляции между одной парой или множеством пар признаков для установления между ними статистических взаимосвязей.

Цель корреляционного  анализа — обеспечить получение  некоторой информации об одной переменной с помощью другой переменной. В  случаях, когда возможно достижение цели, говорят, что переменные коррелируют. В самом общем виде принятие гипотезы о наличии корреляции означает что изменение значения переменной А, произойдет одновременно с пропорциональным изменением значения Б.

Информация о работе Статистическое исследование корреляционной связи