Взаимосвязанные признаки и графики связи

Автор работы: Пользователь скрыл имя, 24 Сентября 2013 в 23:33, курсовая работа

Описание работы

Для полного усвоения корреляционно-регрессионного анализа в эконо¬мических исследованиях в аналитической части работы будет приведено еще одно решение задачи.
Данная работа посвящена изучению возможности обработки статис-тических данных методами корреляционного и регрессионного анализа
с использованием пакета прикладных программ Microsoft Excel.

Файлы: 1 файл

Prakticheskaya_chast_reshennye_zadachi.docx

— 1.02 Мб (Скачать файл)

                              Σ Σ ,


                              Σ Σ Σ .

Параметры уравнения гиперболы  можно вычислить по формулам

,

.

Параболическая  регрессия одного фактора

Связь одного фактора, при  которой результативный признак  увеличивается быстрее, чем факторный, отображается уравнением параболы второго порядка: . Для определения параметров параболы по методу наименьших квадратов находят минимум функции .

 

При этом получают следующую  систему нормальных уравнений:

                           ;


                           ;

                           .

Первое уравнение почти  полностью воспроизводит само уравнение  параболы, второе уравнение старше первого на , третье - старше первого на .

 

4. Корреляционная таблица

Парная таблица с большим  числом наблюдений часто становится мало обозримой, и по ней неудобно вести расчеты. Поэтому для табличного изображения парной связи, решения  уравнения регрессии и определения  показателей тесноты связи используют корреляционную (двумерную) таблицу. В корреляционной таблице можно отобразить только парную связь, т. е. связь результативного признака с одним фактором. Она позволяет найти уравнение регрессии и вычислить линейный коэффициент корреляции. Само уравнение регрессии может иметь линейную, параболическую, гиперболическую, показательную и др. формы. При нахождении уравнения регрессии и линейного коэффициента по корреляционной таблице не теряется информация о связи, обусловленная усреднением данных. В корреляционной таблице связь между признаками выступает более рельефно, чем при рассмотрении средних значений факторного и результативного признаков. Однако, если обеспечивается возможность счета по каждой паре взаимосвязанных данных, необходимо ею воспользоваться и прибегать к корреляционной таблице лишь в отдельных случаях – при группировке данных.

Для составления корреляционной таблицы парной связи материал предварительно группируется по обоим признакам. Затем  строится таблица, в которой по строкам  откладываются группы одного (например, результативного) признака, а по столбцам размещаются группы другого (теперь факторного) признака. В клетках  этой таблицы отмечается число единиц, имеющих определенную величину того и другого признаков. Итоги по строкам ( ) покажут число единиц в каждой группе результативного признака (если он размещен в строках). Итоги по колонкам  ( ) покажут распределение факторного признака. В клетке, в которой итоги по строке сходятся с итогами по колонке, получаем число наблюдений: .

Корреляционная зависимость  задается таблицей:

                                                                                                   Таблица 1

х             у


 

Корреляционная таблица  дает общее представление о направлении  связи. Когда оба признака расположены  в возрастающем порядке, числа предприятий  в клетках сосредотачиваются  в направлении диагонали слева  направо, что указывает на прямую связь между признаками. Все числа  предприятий сосредотачиваются  в эллипсе, вытянутом по этой диагонали, называемом корреляционным эллипсом. Чем более сжат этот эллипс, тем  кучнее частоты располагаются около  его диагонали, тем теснее связь  между признаками.

 

5. Эмпирическое корреляционное отношение

Теснота или сила связи  между двумя признаками может  быть измерена показателем, называемым эмпирическим корреляционным отношением. Этот показатель назван эмпирическим, поскольку он может быть рассчитан  на основе обычной группировки по факторному и результативному признаку, то есть на основе корреляционной таблицы. Эмпирическое корреляционное отношение  получается из правила сложения дисперсий, согласно которому , где - общая дисперсия; - межгрупповая дисперсия; - внутригрупповая (средняя из частных) дисперсия. Межгрупповая дисперсия является мерой колеблемости, обусловленной факторным признаком. Средняя из частных дисперсий является мерой колеблемости, обусловленной всеми остальными(кроме факторного) признаками. Тогда отношение выражает долю колеблемости, возникающей за счет факторного признака, в общей колеблемости. Квадратный корень из этого отношения и называется эмпирическим корреляционным отношением:

.

Отсюда следует правило, что чем больше межгрупповая дисперсия, тем сильнее факторный признак  влияет на вариации результативного  признака. Составляющие отношения дисперсий вычисляются по данным корреляционной таблицы по следующим формулам:

;    
,

где - частные средние; - общая средняя; - итоги по признаку ; - итоги по признаку ; - число наблюдений. То же соотношение сохраняется и для условных значений , полученных числовым преобразованием .

Само отношение дисперсий (подкоренное выражение) называется коэффициентом детерминации (оно  равно также квадрату эмпирического  корреляционного отношения). Эмпирическое корреляционное отношение изменяется в широких пределах (от 0 до 1). Если оно равно нулю, значит факторный признак на корреляционный не влияет. Если =1, значит, результативный признак полностью зависит от факторного. Если же эмпирическое корреляционное отношение представляет дробь, близкую единице, то говорят о тесной связи между факторным и результативным признаками. Если эта дробь мала (близка нулю), то говорят о слабой связи между ними.

 

6. Коэффициент линейной корреляции  
и индекс корреляции

Мерой тесноты связи между  двумя статистически связанными признаками служит коэффициент линейной корреляции или просто коэффициент корреляции. Он имеет тот же смысл, что и эмпирическое корреляционное отношение, но может принимать как положительное, так и отрицательное значение. Коэффициент корреляции имеет строгое математическое выражение для линейной связи. Положительное значение будет указывать на прямую связь между признаками, отрицательное – на обратную.

Парный коэффициент корреляции в случае линейной формы связи  вычисляют по формуле 

,

а его выборочное значение – по формуле 

При малом числе наблюдений выборочный коэффициент корреляции удобно вычислять по следующей формуле:

Величина коэффициента корреляции изменяется в интервале  .

При между двумя переменными существует функциональная связь, при - прямая функциональная связь. Если , то значение Х и У в выборке некоррелированы; в случае, если система случайных величин имеет двумерное нормальное распределение, то величины Х и У будут  
и независимыми.

Если коэффициент корреляции находится в интервале  , то между величинами Х и У существует обратная корреляционная связь. Это находит подтверждение и при визуальном анализе исходной информации.  
В этом случае отклонение величины У от среднего значения взяты с обратным знаком.

Если каждая пара значений величин Х и У чаще всего одновременно оказывается выше (ниже) соответствующих средних значений, то между величинами существует прямая корреляционная связь и коэффициент корреляции находится в интервале .

Если же отклонение величины Х от среднего значения одинаково  часто вызывают отклонения величины У вниз от среднего значения и при этом отклонения оказываются все время различными, то можно предполагать, что значение коэффициента корреляции стремится к нулю.

Следует отметить, что значение коэффициента корреляции не зависит  от единиц измерения и выбора начала отсчета. Это означает, что если переменные Х и У уменьшить (увеличить) в К раз либо на одно и то же число С, то коэффициент корреляции не изменится.

Для упрощения расчетов меры тесноты корреляционной связи часто  применяется индекс корреляционной связи, который определяется по следующим  формулам:

      ,     
,

где - остаточная дисперсия, характеризующая вариацию результативного признака под влиянием прочих неучтенных факторов.

 

7. Множественная корреляция

Множественная корреляция –  зависимость результативного и двух или более факторных признаков, включенных в исследование.

Показатель тесноты связи  между результативным и двумя  или более факторными признаками называется множественным или совокупным коэффициентом корреляции и обозначается R. Совокупный коэффициент предполагает наличие линейной связи между каждой парой признаков, которая может быть выражена при помощи парных коэффициентов корреляции. Если находится совокупная мера тесноты связи между результативным признаком ( ) и двумя факторными признаками( и ), то расчет совокупного коэффициента корреляции ведется по формуле:

,

Где подстрочные знаки  обозначают, между какими признаками изучается парная связь.

В формулах расчетов парных коэффициентов корреляции изменяются лишь символы, обозначающие тот или  иной фактор. Так, если коэффициент  корреляции между  и вычисляется по формуле , то коэффициент корреляции между и вычисляется: ; между и - так:

 

Расчетная часть

Задание 1

Имеются следующие выборочные данные (выборка 20%-ная механическая) о ценах на первичном рынке жилья (тыс. руб. за кв. м.) и среднемесячной прибыли (млн. руб.) по 30 строительным организациям-застройщикам одного из регионов:

Таблица 1

№ организации п/п

Цена на первичном рынке  жилья,

тыс. руб. за кв. м.

Прибыль, млн. руб.

№ организации п/п

Цена на первичном рынке  жилья,

тыс. руб. за кв. м.

Прибыль, млн. руб.

1

34,4

0,81

16

29,8

0,55

2

33,5

0,71

17

29,4

0,44

3

26,9

0,42

18

30,9

0,61

4

33,3

0,70

19

24,8

0,25

5

23,0

0,19

20

24,3

0,28

6

27,6

0,43

21

26,5

0,36

7

26,8

0,40

22

32,3

0,70

8

27,8

0,42

23

24,6

0,33

9

24,2

0,27

24

32,0

0,68

10

29,7

0,46

25

31,1

0,56

11

24,9

0,43

26

28,1

0,47

12

26,8

0,34

27

23,6

0,24

13

26,7

0,32

28

35,2

0,86

14

29,3

0,50

29

27,3

0,41

15

20,6

0,11

30

21,3

0,15

Информация о работе Взаимосвязанные признаки и графики связи