Статистический анализ безработицы в Российской Федерации

Автор работы: Пользователь скрыл имя, 05 Апреля 2014 в 14:27, курсовая работа

Описание работы

В течение последних нескольких лет всё чаще можно слышать с экранов телевизоров обсуждения, касающиеся критического уровня в развитых и развивающихся странах такого ключевого показателя, как уровень безработицы. Ведутся активные дискуссии, проходят массовые демонстрации, принимаются новые законы, вводятся и реализуются различные программы, касающиеся этой области. Однако в России в настоящее время наблюдаются совершенно иные тенденции: уровень безработицы в стране в среднем снижается от года к году, а в декабре 2012 года достиг своего наименьшего значения.

Файлы: 1 файл

ВКР_Пашкова Алёна_С41_исправленная2.docx

— 504.69 Кб (Скачать файл)

 

 

В среднем, уровень безработицы в России по 80 регионам составляет по данным 2011 года 7,18%. При этом, в 40 регионах уровень безработицы держится ниже уровня 6,95%, что является относительно низким показателям в сравнении с имеющимися в предшествующих годах. Самая низкая безработица наблюдается в г. Москве, что, возможно, связано с тем, что в столицу люди приезжают именно с целью поиска работы и готовы принять наименее выгодные предложения ввиду необходимости денежных средств.

В России, среднее время поиска работы в 2011 году в среднем было чуть более 8 месяцев, при этом стандартное отклонение составляет всего 1 месяц. Таким образом, этот фактор является наиболее однородным, чего нельзя сказать о коэффициенте миграции. В данном случае отток населения из региона приблизительно равен притоку – среднее значение коэффициента составило всего 0,64. При этом, средний коэффициент рождаемости составил 12,69 родившихся на 1000 человек, что говорит об увеличении численности населения внутри самих регионов. Однако, чтобы оценить естественный прирост необходимо рассмотреть значения коэффициентов смертности.

Среднее и медианное значения удельного веса домохозяйств, имеющих компьютер с выходом в Интернет составили в 2011 году 48%, что говорит о том, что половина населения имеет возможность искать и иметь удаленную работу, что вероятнее всего положительным образом сказывается на общем уровне безработицы. Лучше всего информационно оснащен г. Санкт-Петербург, а после него идет г. Москва, что является достаточно логичным, так как данные регионы считаются наиболее экономически развитыми. Всего 13,6% населения  имеют выход в Интернет в республике Дагестан, что связано, скорее всего, с их текущим экономико-политическим положением в регионе.

Описав все факторы можно переходить к непосредственному построению математической модели. Следует еще раз заметить, что для анализа мы используем нормированные величины каждой переменной, чтобы уменьшить вариацию каждого признака и сделать их более однородными (привести к одной размерности).

Существует несколько видов уравнений регрессии. В рамках данной работы мы будем анализировать множественную модель линейной регрессии ввиду её простоты и ясности интерпретации. Данная модель выглядит следующим образом: , где t – это номер наблюдения в выборке, а j – номер фактора. - является коэффициентом регрессии, который определяет, на сколько изменится результирующий признак у при изменении факторного признака на единицу. Для определения параметров и чаще всего используют метод наименьших квадратов, который основан на том, что теоретические значения результативного признака должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических значений, что можно представить в виде формулы:             .

Таким образом, используя алгоритм шагового отбора5, мы построили следующую линейную модель регрессии:

 

6

 

Проверка на значимость данного уравнения регрессии, используя F-статистику, а также проверка за значимость отдельных его коэффициентов с помощью t-статистики показала, что в обоих случаях гипотеза о незначимости отвергается на уровне . Кроме того, множественный коэффициент детерминации показывает, что данное уравнение регрессии описывает 55,8% вариации результирующего признака вошедшими в модель показателями, а остальная часть вариации обусловлена действием неутонченных факторов.

Из полученного уравнения следует, что увеличение на одну нормированную единицу общего коэффициента рождаемости (при фиксированных значениях х3 и х4) приводит к увеличению уровня безработицы в среднем на 0,456 (в нормированных единицах). Аналогично, при увеличении на одну нормированную единицу коэффициента миграционного прироста и удельного веса домохозяйств, имеющих компьютер с выходом в Интернет, уровень безработицы снижается в среднем (в нормированных единицах) соответственно на 0,338 (при фиксированных значениях х2 и х4 ) и 0,315 (при фиксированных значениях х2 и х3). Стоит отметить, что также была построена модель с принудительным включением всех переменных, однако согласно статистическим тестам, она оказалась незначимой.

Для того, чтобы быть уверенным в том, что модель адекватно отражает статистическую связь между показателями, остатки (приложение 5) оцененной регрессии необходимо проверить на нормальность, гомоскедастичность и отсутствие автокорреляции.

Проверка на нормальность распределения остатков с помощью одновыборочного критерия Колмогорова-Смирнова показала, что с 95% уверенностью мы можем сказать, что остатки являются нормально распределенными (приложение 6).

Тестирование остатков на гомоскедастичность, что дает нам право полагать об эффективности полученных МНК-оценок и несмещенности и состоятельности оценки ковариационной матрицы этих параметров,  основано на предположении о том, что при условии выполнения гипотезы дисперсия ошибок не зависит от значений регрессоров. В данном случае, наблюдаемое значение в рамках теста Бреуша-Пагана-Годфри (приложение 7) не превысило критическое, т.е. гипотеза об отсутствии гетероскедастичности ошибок принимается на уровне значимости 0,05.

В заключение, с помощью теста Дарбина-Уотсона, построенная модель была проверена на наличие автокорреляции остатков первого порядка, наличие чего может привести также к неэффективности МНК-оценок и к завышению тестовых статистик, по которым проверяется качество модели. Рассчитанная статистика данного теста показала, что нулевая гипотеза Н0 о незначимости коэффициента авторегрессии принимается на уровне значимости  .

В результате корреляционно-регрессионного анализа данных за 2011 год мы получили статистически значимую и адекватную модель. Согласно данной модели уровень безработицы положительно зависит от общего коэффициента рождаемости и отрицательно от коэффициента миграции и удельного веса домохозяйств, имеющих персональный компьютер с выходом в Интернет.  

Положительную зависимость уровня безработицы от числа родившихся на 1000 человек населения (что имеет наибольшее влияние на результирующую переменную при прочих равных) можно объяснить с нескольких точек зрения. Во-первых, растет число человек в регионе, а новые рабочие места не открываются. Более того, в течение последнего десятилетия стали закрываться большие промышленные организации, которые зачастую предоставляли  вакантные места для целых городов или поселений. Однако это скорее оказывает влияние в долгосрочной перспективе. С другой стороны, увеличивается число рождений, а следовательно, женщин, оставивших в связи с родами и последующим уходом за грудным ребёнком свое прежнее место работы. По прошествии некоторого времени,  эти женщины начинают обращаться в биржи труда с целью поиска работы, тем самым увеличивая уровень безработицы в регионе.

Отрицательная зависимость между уровнем безработицы и коэффициентом миграционного прироста в регионе, то есть при положительном приросте миграции уровень безработицы сокращается, связана с тем, что миграция зачастую связана именно с работой. Другими словами, те люди, которые меняют свое место жительство, часто мигрируют туда, где либо они уже нашли место работы, либо туда, где они намерены устроиться на неё. Таким образом, в регионе уровень безработицы снижается за счет увеличения рабочей силы в общем и числа занятых в частности.

Наличие значимой обратной зависимости между уровнем безработицы и долей домохозяйств, имеющих персональный компьютер с выходом в Интернет, подтверждает выдвинутое в начале анализа предположение о том, что данный  фактор оказывает влияние на результирующий показатель. Во-первых, это связано с тем, что, как уже было описано выше, Интернет позволяет «стереть» километры между потенциальным работником и работодателем, например, имея возможность работать над проектами удаленно. Во-вторых, глобальная сеть помогает найти работу, минуя биржу труда, контактируя с работодателем напрямую, тем самым позволяя найти работу, на устраиваемых безработного условиях.

 

3.1.2. Компонентный анализ

Стремление описать экономическое явление всегда приводит к рассмотрению большого количества исходных переменных, что в итоге вытекает к ненаглядной модели, оценки которой являются неэффективными. В данном случае сначала были выдвинуты к рассмотрению четырнадцать переменных, которые на первый взгляд оказывают влияние на уровень безработицы. Однако, в ходе корреляционно-регрессионного анализа мы получили модель, в которую вошли три переменные из предположенных в начале анализа. Но, несмотря на то, что данная модель описывает около 56% вариации результирующего признака, исключение не вошедших в модель переменных могло повлечь за собой потерю информации.

Для того чтобы построить наглядную модель, исключая незначимые факторы и максимально сохранив информацию и структуру исходных данных применяются такие способы снижения размерности как компонентный анализ. Отличительной особенностью такого анализа является то, что, во-первых, главные компоненты имеют нулевую корреляцию между собой, а во-вторых появляется возможность выявить неявные, непосредственно не измеряемые, но объективно существующие закономерности,  которые обусловлены действием как внутренних, так и внешних причин.

Модель компонентного анализа имеет вид:   , где – «вес», факторная нагрузка, v-ой главной компоненты на j-ой переменной; - значение v-ой главной компоненты для i-го наблюдения (объекта), где v=1,2,…,k. Для анализа будут выбраны все 14 факторов, вероятно влияющих неким образом на уровень безработицы. Однако, количество главных компонент, включенных в окончательную модель, будут определены их вкладом в суммарную дисперсию.

В ходе компонентного анализа получили следующие результаты полной объяснённой дисперсии:

 

Таблица 3

Результаты полной объясненной дисперсии

Компонента

Начальные собственные значения

Итого

% Дисперсии

Кумулятивный %

1

3,456

24,685

24,685

2

2,826

20,183

44,868

3

1,648

11,771

56,638

4

1,163

8,304

64,942

5

1,039

7,421

72,363

6

0,865

6,176

78,539

7

0,768

5,489

84,028

8

0,608

4,340

88,369

9

0,447

3,191

91,560

10

0,363

2,593

94,153

11

0,300

2,146

96,299

12

0,258

1,841

98,140

13

0,149

1,062

99,201

14

0,112

0,799

100,000


 

 

Считается, что можно ограничиться несколькими первыми главными компонентами, если их суммарная объясненная дисперсия превышает 70%. Как видно из таблицы 3, кумулятивный процент объясненной дисперсии первых пяти компонент составляет 72,4%, что является достаточным для использования их в дальнейшем анализе. 

Одним из недостатков компонентного анализа является достаточно сложная смысловая интерпретация главных компонент. Однако рассмотрим с какими переменными тесно связана каждая из них (приложение 8) и попробуем их проинтерпретировать.

Первая главная компонента (z1), согласно соответствующей матрице, тесно связана со следующими переменными: среднее время поиска работы безработными, удельный вес городского населения в общей численности населения, ожидаемая продолжительность жизни при рождении, общие коэффициенты брачности на 1000 человек населения, удельный вес домохозяйств, имевших персональный компьютер с доступом к сети Интернет, мощность амбулаторно-поликлинических учреждений на 10000 человек населения и среднемесячная номинальная начисленная заработная плата работников организаций. Таким образом, данная компонента отражает социально-экономическую сторону жизни безработных.

Вторая главная компонента (z2) имеет тесную связь с коэффициентами пенсионной нагрузки, рождаемости и миграционного прироста. Другими словами, она описывает демографические процессы в регионах. 

Третья (z3) и четвертая (z4) компоненты тесно связаны с вводом в действие жилых домов на 1000 человек населения и с индексом потребительских цен соответственно. Таким образом, их можно проинтерпретировать как обеспеченность жильем и инфляция.

Последняя, пятая главная компонента (z5) имеет тесную связь с удельным весом убыточных организаций, а также с индексом физического объема инвестиций в основной капитал. Ввиду отношения обеих переменных к организациям данная компонента может быть проинтерпретирована как экономическое положение организаций.

В продолжение анализа, построим линейное уравнение регрессии на главные компоненты, используя пошаговый метод исключения переменных. В результате оценки имеем следующую модель7:

 

 

8

 

Если проверить данное уравнение на значимость с помощью F-cтатистики Фишера и его коэффициенты – с помощью t-критерия Стьюдента, то во всех случаях отвергается гипотеза о незначимости коэффициентов и уравнения в целом на 95%-ом уровне значимости. Незначимой является только константа, значение которой стремится к нулю.

Остатки данной модели (приложение 10), согласно одновыборочному критерию Колмогорова-Смирнова, являются нормально распределенными. Кроме того, тест Бреуша-Пагана-Годфри на отсутствие гетероскедастичности остатков показал, что остатки гомоскедастичны. В заключение, остатки были проверены на независимость, используя статистику Дарбина-Уотсона, которая указала на отсутствие автокорреляции первого порядка. Таким образом, построенную линейную регрессию на первые две главные компоненты можно считать адекватной.

Информация о работе Статистический анализ безработицы в Российской Федерации