Статистический анализ безработицы в Российской Федерации

Автор работы: Пользователь скрыл имя, 05 Апреля 2014 в 14:27, курсовая работа

Описание работы

В течение последних нескольких лет всё чаще можно слышать с экранов телевизоров обсуждения, касающиеся критического уровня в развитых и развивающихся странах такого ключевого показателя, как уровень безработицы. Ведутся активные дискуссии, проходят массовые демонстрации, принимаются новые законы, вводятся и реализуются различные программы, касающиеся этой области. Однако в России в настоящее время наблюдаются совершенно иные тенденции: уровень безработицы в стране в среднем снижается от года к году, а в декабре 2012 года достиг своего наименьшего значения.

Файлы: 1 файл

ВКР_Пашкова Алёна_С41_исправленная2.docx

— 504.69 Кб (Скачать файл)

Можно предположить, что каждый из перечисленных показателей в той или иной мере влияет на значение уровня безработицы в Российской Федерации. Так, удельный вес убыточных организаций может влиять с той точки зрения, что обычно в связи с неблагоприятным экономическим положением на фирме часть работников вынуждены ее покинуть и начать искать себе новое место работы. Демографические факторы также могут повлиять на уровень безработицы, так как при увеличении численности людей или мигрантов увеличивается конкуренция на рынке труда. Такой показатель, как удельный вес домохозяйств, имевших персональный компьютер с доступом к сети Интернет должен коррелировать с зависимой переменной, так как в современном мире общение между работодателем и потенциальным работником осуществляется именно в Интернете. Более того, глобальная сеть помогает контактировать тем участникам на рынке труда, которые могут находиться друг от друга в тысячах километров.

 

3.1.1. Корреляционно-регрессионный анализ

Регрессионный анализ - есть метод исследования зависимости результативного признака у (случайной величины) от нескольких случайных величин х1,х2,…,хk, называемых факторами или регрессорами. Исследование причинно-следственной связи между показателями является одной из основных задач общей теории статистики.

Одной из предпосылок регрессионного анализа является нормальность распределения изучаемых факторов и, главным образом, результирующей переменной. Также, изучаемые единицы должны быть качественно однородными. С целью приведения всех признаков к одинаковым единицам обычно используют принцип нормировки, то есть каждую центрированную величину признака делят на среднее квадратическое отклонение: , где – значение l-го признака у j-го объекта, - среднее арифметическое значение l-го признака, а          – среднее квадратическое отклонение.

После того как все признаки были нормированы, мы проверяем зависимую переменную «уровень безработицы» на нормальность её распределения по правилу 3-х сигм. Данное правило является частным случаем при рассмотрении закона о нормальном распределении и формулируется следующим образом: вероятность отклонения случайной величины от своего математического ожидание на величину, большую, чем утроенное среднее квадратичное отклонение (сигма), стремится к нулю. Таким образом, после применения данного правила к результирующей переменной с целью приведения распределения к нормальному виду были удалены из рассмотрения республика Калмыкия, республика Ингушетия, республика Тыва и Чеченская республика, так как уровень безработицы там в несколько раз превосходит соответствующий уровень в оставшихся регионах. В результате, количество наблюдений у нас равно 80.

Далее производится проверка всех факторов на нормальный закон распределения (приложение 1), используя одновыборочный критерий Колмогорова-Смирнова. Мы проверяем гипотезу о том, что каждая переменная является нормально распределённой на уровне значимости α=0,05, при конкурирующей гипотезе   (  не принадлежит нормальному закону распределения).

 

Таблица 1

Одновыборочный критерий Колмогорова-Смирнова

 

y

x1

x2

x3

x4

x5

x6

x7

x8

x9

x10

x11

x12

x13

x14

N

80

80

80

80

80

80

80

80

80

80

80

80

80

80

80

Сред.

0,00

0,00

0,00

0,00

0,02

0,00

0,02

0,02

0,03

0,03

0,02

0,02

0,00

0,00

0,00

Стд. Откл.

1,01

1,01

1,01

1,01

0,99

1,01

0,99

0,99

0,99

0,99

0,99

0,99

1,01

1,01

1,01

Статистика Z Колмогорова-Смирнова

0,74

1,34

0,98

0,80

1,00

0,85

1,00

0,73

0,65

0,91

0,98

0,48

0,92

1,15

1,96

Асимпт. знч. (двухсторонняя)

0,64

0,06

0,30

0,55

0,27

0,46

0,27

0,66

0,80

0,38

0,29

0,98

0,36

0,14

0,00


 

 

На основании получившихся значений, можно сделать вывод о том, что гипотеза о принадлежности каждой переменной нормальному закону распределения не отвергается на уровне значимости α=0,05, за исключением . Т.е. переменные – нормально распределённые величины. Таким образом, предпосылка регрессионного анализа о нормальности распределения показателей выполняется, и мы можем переходить к следующему этапу исследования ( мы также включим пока в анализ ввиду предположения о влиянии размера среднемесячной заработной платы в регионе на уровень безработицы).

 Перед тем как воспользоваться методом регрессионного анализа необходимо выяснить, какие факторы из вышеперечисленных было бы целесообразнее всего использовать для включения в модель. Зачастую, включение большего количества показателей в модель не улучшают её статистические свойства, а наоборот ухудшают, ввиду, к примеру, наличия мультиколлинеарности между переменными. Наиболее обоснованным методом для выбора факторов является.

Корреляционный анализ является одним из методов статистического анализа взаимозависимости нескольких признаков. На данный момент, он определяется как метод, применяемый в случае, когда наблюдение считается случайным и выбранным из генеральной совокупности, распределённой по многомерному нормальному закону распределения. Основной задачей данного анализа является оценка корреляционной матрицы  генеральной совокупности  по выборке и определении частных и множественных коэффициентов корреляции и детерминации на её основе оценок. Другими словами, корреляционный анализ позволяет обработать статистические данные, с целью измерения тесноты связи между двумя или более переменными.

Для определения необходимости включения в уравнение множественной регрессии тех или иных факторов, а также для оценки полученного уравнения на соответствие выявленным связям (используя коэффициент детерминации) мы построим матрицу парных коэффициентов корреляции :

, где , а .

Согласно корреляционной матрице (приложение 2), на уровне 0,01 оказались значимыми корреляции между уровнем безработицы и средним временем поиска работы безработными (связь является положительной), удельным весом городского населения в общей численности населения (отрицательная зависимость), коэффициентом пенсионной нагрузки (отрицательная взаимосвязь), общими коэффициентами рождаемости (коэффициент имеет положительный знак), коэффициентами миграционного прироста (отрицательная взаимосвязь), удельным весом домохозяйств, имевших персональный компьютер с доступом к сети Интернет (коэффициент корреляции отрицателен), а также среднемесячная номинальная начисленная заработная плата работников организаций (корреляция является также отрицательной). В то же время, на уровне 0,05 значима связь между уровнем безработицы и такими показателями как индекс потребительских цен и мощность амбулаторно-поликлинических учреждений.

Надо заметить, что коррелированных между собой показателей достаточно много, однако при этом мультиколлинеарность между факторами не наблюдается. Таким образом, в регрессионную модель могут войти все переменные, кроме показателей удельного веса убыточных организаций (х2), ожидаемой продолжительности жизни при рождении (х6), общих коэффициентов брачности (х7), индекса физического объема инвестиций в основной капитал (х9), ввода в действие жилых домов (х10).

После проведения корреляционного анализа у нас остались 9 переменных, которые имеют значимую корреляцию на том или ином уровне значимости. Однако включение всех этих факторов в модель может оказаться бессмысленным и увеличение такой характеристики качества построенной модели как коэффициент детерминации может быть результатом добавления в модель большого количества регрессоров. Таким образом, проверим оставшиеся переменные на существенность их включения с помощью дисперсионного анализа.

Дисперсионный анализ предназначен для проверки зависимостей нормально распределённой случайной величины, являющейся результативным признаком, от нескольких величин – факторных признаков, или факторов, среди которых могут быть как случайные, так и неслучайные величины, измеряемые в любой из шкал: интервальной, порядковой или номинальной4.

В работе приведён анализ однофакторного комплекса. По очереди изучается влияние 9 факторов на уровень безработицы в Российской Федерации.  Исследование существенности влияния каждого фактора на уровень безработицы в РФ заключается в проверке основной гипотезы дисперсионного анализа: уровни факторного признака не влияют на изменение результативной переменной. В данной работе все расчеты производятся на уровне значимости 0,05. Сведем результаты всех расчетов в одну таблицу (приложение 3) и проверим значимость влияния каждого признака в отдельности с помощью F-статистики.

Таким образом, для переменных х1, х5, х8, х11 и х13 наблюдаемое значение F-статистики превосходит ее критическое значение, т.е. гипотеза о несущественности влияния фактора на изменение результативного признака отвергается с вероятностью ошибки, равной 0,05. Следовательно, можно считать, что следующие переменные существенно влияют на уровень безработицы РФ:

  • среднее время поиска работы безработными (месяцев);
  • общие коэффициенты рождаемости (число родившихся на 1000 человек населения);
  • коэффициенты миграционного прироста на 10000 человек населения;
  • удельный вес домохозяйств, имевших персональный компьютер с доступом к сети Интернет;
  • мощность амбулаторно-поликлинических учреждений на 10000 человек населения (на конец года, тысяч посещений в смену).

В результате проведенных корреляционного и дисперсионного анализов мы определили, какие переменные далее будут включены в регрессионный анализ, для проверки их статистической значимости. Далее необходимо предоставить дескриптивные статистики для каждой переменной, описать математическую модель зависимости показателей, построить уравнение регрессии, описывающее изменение коррелируемых величин и определяющее среднее значение результативного признака при каком-либо значении факторного.

Переобозначим все оставшиеся переменные, которые будут использованы в последующем анализе. Так, зависимым признаком будет являться уровень безработицы в РФ (Y), а независимыми – следующие, упомянутые выше показатели:

  1. среднее время поиска работы безработными (месяцев);
  2. общие коэффициенты рождаемости (число родившихся на 1000 человек населения);
  3. коэффициенты миграционного прироста на 10000 человек населения;
  4. удельный вес домохозяйств, имевших персональный компьютер с доступом к сети Интернет;
  5. мощность амбулаторно-поликлинических учреждений на 10000 человек населения (на конец года, тысяч посещений в смену).

Рассчитаем основные дескриптивные статистики для отобранных переменных и представим результаты в виде следующей таблицы:

 

Таблица 2

Описательные статистики

 

y

x1

x2

x3

x4

x5

N

80

80

80

80

80

80

Среднее

7,18

8,04

12,69

0,64

48,11

265,07

Медиана

6,95

7,85

12,40

-1,50

48,15

257,75

Стд. отклонение

2,22

1,07

2,28

61,24

11,68

51,47

Минимум

1,40

6,10

8,60

-121,00

13,60

113,90

Максимум

14,20

12,10

22,70

160,00

75,60

495,60

Информация о работе Статистический анализ безработицы в Российской Федерации