Контрольная работа по "эконометрике"

Автор работы: Пользователь скрыл имя, 23 Апреля 2014 в 08:53, контрольная работа

Описание работы

Цель данного исследования – выяснить, какие факторы и каким образом влияют на размер расходов домашних хозяйств США, затрачиваемых на продукты и безалкогольные напитки, потребляемые в домашних условиях.
Для достижения поставленной цели необходимо выполнить ряд следующих задач:
построить экономическую модель на основе исходных данных и выдвинуть соответствующие гипотезы;
провести предварительный анализ данных и построить эконометрические модели;
произвести оценку качества построенных моделей, на основе которой попытаться дать экономическую интерпретацию полученных результатов.

Файлы: 1 файл

ДКР.docx

— 225.68 Кб (Скачать файл)

Введение

Цель и задачи исследования

Цель данного исследования – выяснить, какие факторы и каким образом влияют на размер расходов домашних хозяйств США, затрачиваемых на продукты и безалкогольные напитки, потребляемые в домашних условиях.

Для достижения поставленной цели необходимо выполнить ряд следующих задач:

  • построить экономическую модель на основе исходных данных и выдвинуть соответствующие гипотезы;
  • провести предварительный анализ данных и построить эконометрические модели;
  • произвести оценку качества построенных моделей, на основе которой попытаться дать экономическую интерпретацию полученных результатов.

 

 

 

  1. Экономическая модель

1.1 Описание данных

Поскольку результирующим признаком являются расходы на продукты и напитки, потребляемые домохозяйствами в домашних условиях, то в роли независимых признаков могут выступить следующие факторы:

  • общий объём расходов домохозяйств, т.к. данный фактор отражает совокупные затраты семей, приходящиеся на удовлетворение различных нужд и потребностей, в числе которых потребность в ежедневном питании. Расходы на удовлетворение данной потребности занимают определённую долю в этом общем объёме и, следовательно, их размер может изменяться в зависимости от численного количества последнего;
  • количество детей (в возрасте до 15 лет) в семье: как мальчиков, девочек, так и детей младше 2-х лет. Поскольку дети в этом возрасте, как правило, не имеют собственного источника дохода и поэтому финансово зависят от своих родителей, которые тратят свой доход не только на удовлетворение своих личных нужд, но также и на реализацию потребностей своих детей, в числе которых потребность в домашнем питании;
  • затраты семей на питание и безалкогольные напитки вне дома. Данный показатель, вероятно, напрямую может повлиять на расходы на аналогичные товары, однако, потребляемые в домашних условиях. Возможно, чем больше домохозяйства предпочитают питаться в кафе, ресторанах, тем меньше им приходится тратить средств на питание в домашних условиях.
  • место проживания семей. Поскольку от типа жилья будут зависеть затраты на его обслуживание: выплату процентов в случае ипотечного кредита, оплату аренды в случае съёмного жилья, выплату налогов на имущество, страхование в случае собственного жилья и т.п. Данный показатель может оказывать влияние на расходы домохозяйств на питание и напитки в той степени, что оба этих видов затрат являются основными и обязательными для любой семьи, и, возможно, изменение в размере одних из них окажет влияние на объём других.
  • размер затрат семей на поездки на общественном транспорте за пределами города, в котором проживает та или иная семья. Данный показатель косвенно отражает возможные затраты семьи на какие-либо нужды, возникающие во время поездок и путешествий, в числе этих нужд может быть и потребность в питании и напитках, только потребляемых вне домашних условий, увеличение которых может привести, соответственно, к снижению аналогичных затрат в домашних условиях;

Данные по выбранным параметрам представляют собой выборку, состоящую из 800 наблюдений, полученных при обследовании потребительских расходов домашних хозяйств в США в 1995 г.

1.2 Гипотезы

На основе экономического обследования и краткой характеристики выбранных зависимых и независимых параметров, можно выдвинуть следующие гипотезы:

Гипотеза 1. Чем больше детей в той или иной семье, тем больше средств приходится затрачивать этим семьям на питание и безалкогольные напитки, потребляемые в домашних условиях.

Гипотеза 2. С ростом общего объёма потребительских расходов домашних хозяйств затраты на питание и безалкогольные напитки, потребляемые в домашних условиях и составляющие определённую долю от этого объёма, будут также увеличиваться.

Гипотеза 3. Чем больше домохозяйства тратят средств на питание в кафе, ресторанах, кино, парках и т.п., тем меньше их расходы на питание и безалкогольные напитки, потребляемые в домашних условиях.

Гипотеза 4. 

При увеличении затрат домохозяйств на пользование общественным транспортом за пределами города, в котором проживает та или иная семья, их расходы на потребляемые в домашних условиях еду и безалкогольные напитки уменьшатся.

  1. Предварительный анализ данных

Независимые количественные переменные

  1. child – количество детей в семье (в возрасте от 0 до 15 лет), была создана на основе предложенных исходных данных о количестве детей в семье женского и мужского пола от 2 до 15 лет, а также детей младше 2-х лет. Child=sizejm+sizejf+sizein, где sizejm – количество мальчиков в семье (от 2 до 15 лет), sizejf – количество девочек в семье (от 2 до 15 лет), sizein – количество детей младше 2-х лет. С экономической точки зрения не имеет значения, какого пола и возраста ребёнок в семье, родители в любом случае в одинаковой степени заботятся о своих детях и поэтому тратят определённую сумму денег на их питание.

Данные по количеству детей не однородны (коэффициент вариации 159,7%>33,3%, ящичковая диаграмма (рис. 1б) выявила выбросы – значения 3,4,5,6), имеют островершинное, скошенное вправо распределение (положительный эксцесс, коэффициент асимметрии положительный), которое существенно отличается от нормального с вероятностью 95%  (значение критерия Харки-Бера не близко к нулю и (р-value=0,00)<0,05, ) (рис. 1а).

Однако стоит лишь исключить семьи, в которых 5 и 6 детей, потому как их удельный вес в выборки мал, чтобы существенно повлиять на её объём.

 

 

 


 

 

 

 

 

 



 

 

 

 

 

 

 

 

 


 

  1. expend – общий объём затрат домохозяйств в долларах на различные потребительские нужды. Данные по совокупным затратам не однородны (коэффициент вариации 65,2%>33,3%, ящичковая диаграмма (рис. 2б) выявила выбросы – значения больше 70000), имеют островершинное, скошенное вправо распределение (положительный эксцесс, коэффициент асимметрии положительный), которое существенно отличается от нормального с вероятностью 95%  (значение критерия Харки-Бера не близко к нулю и (р-value=0,00)<0,05, ) (Рис. 2а).


 

 

 

 

 

 



 

 

 

 

 

 

 


 

С целью сохранения количества наблюдений необходимо исключить семьи с совокупными затратами более 100000 долларов, т.к. эти семьи занимают маленькую долю в выборочной совокупности.

  1. fdaw – расходы в долларах на питание и безалкогольные напитки, потребляемые вне дома. Данные по данному виду расходов не однородны (коэффициент вариации 115,4%>33,3%, ящичковая диаграмма (рис. 3в) выявила выбросы – значения больше 4000), имеют островершинное, скошенное вправо распределение (положительный эксцесс, коэффициент асимметрии положительный), которое существенно отличается от нормального с вероятностью 95%  (значение критерия Харки-Бера не близко к нулю и (р-value=0,00)<0,05, ) (Рис. 3а). Существуют семьи, расходы которых по данной категории равны нулю, этот признак говорит о том, что данные семьи предпочитают питаться в домашних условиях, более того, эти семьи занимают достаточно большую долю в общем объёме выборки, поэтому важны для исследования. Имеет смысл исключить семьи с расходами по данной категории выше 6000, т.к. их удельный вес очень мал.


 

 

 

 

 

 

 

 



 

 

 

 

 

 

 


 

Независимые ранговые переменные

  1. hhtenure – тип жилья домохозяйств.

 

 

 

 

 

 

 

 

Зависимые количественные переменные

  1. fdho – объём затрат в долларах, которые домашние хозяйства затрачивают на еду и безалкогольные напитки, потребляемые в домашних условиях. Данные по данному виду расходов не однородны (коэффициент вариации 52,2%>33,3%, ящичковая диаграмма (рис. 5в) выявила выбросы – значения больше 8000), имеют островершинное, скошенное вправо распределение (положительный эксцесс, коэффициент асимметрии положительный), которое существенно отличается от нормального с вероятностью 95%  (значение критерия Харки-Бера не близко к нулю и (р-value=0,00)<0,05, ) (Рис. 5а).

Существуют одна семья, расходы которой по данной категории равны нулю, этот признак говорит о том, что эта семья предпочитает питаться вне дома – в кафе, ресторанах и т.п., более того, эта семья занимают очень малую долю в общем объёме выборки, поэтому её можно исключить. Имеет смысл исключить семьи с расходами по данной категории выше 10000, т.к. их удельный вес также очень мал.

 

 

 


 

 

 


 

 

 

 

 


 

После исключения некоторого количества наблюдений в выборке осталось 775 наблюдений.

  1. Корреляционный анализ

На основе построенной корреляционной матрицы (Таблица 1) можно увидеть, что между типом жилья домохозяйств и их затратами на питание в домашних условиях наблюдается слабая обратная линейная взаимосвязь. Между количеством детей и анализируемой категорией расходов, а также затратами на потребляемые вне дома питание и безалкогольные напитки и аналогичной категорией расходов наблюдается умеренная прямая линейная взаимосвязь. А между совокупными расходами и расходами на потребляемые в домашних условиях еду и безалкогольные напитки существует заметная прямая линейная взаимосвязь. Все перечисленные коэффициенты значимы на 1%-ном уровне.

Кроме того, между двумя независимыми признаками – расходами на питание вне дома и совокупными затратами домохозяйств существует заметная прямая линейная взаимосвязь (парный коэффициент корреляции равен 0,648), следовательно, есть подозрения на то, что имеет место нестрогая мультиколлинеарность, тем более что данный коэффициент превышает коэффициенты корреляции между зависимой переменной и каждым из этих признаков в отдельности. Наличие мультиколлинеарности в модели может привести к получению ненадёжных оценок и затруднениям при оценивании влияния каждой из тесно взаимосвязанных признаков на зависимую переменную, поэтому необходимо подтвердить её наличие или отсутствие, чтобы при необходимости исключить данную проблему.

 

Таблица 1. Корреляционная матрица

 

FDHO

CHILD

EXPEND

FDAW

HHTENURE

FDHO 

1.000000

       

CHILD 

0.429273***

1.000000

     

EXPEND 

0.562070***

0.183745***

1.000000

   

FDAW 

0.334399***

0.107501***

0.647860***

1.000000

 

HHTENURE 

-0.242147***

-0.043288

-0.405021***

-0.267768***

1.000000


*-значим на 10%-ном уровне, **-значим  на 5%-ном уровне, ***-значим на 1%-ном  уровне

 

При построении вспомогательной парной регрессии для этих двух признаков можно увидеть, что коэффициент детерминации равен 42%, хотя это значение далеко от 100% и коэффициент VIF=3,7 значительно меньше 10, однако, всё равно можно предположить, что в реальной жизни существует связь между исследуемыми факторами.  Чем выше расходы на питание вне дома, тем выше совокупные расходы семей, в действительности это вполне вероятно, ведь цены на еду и напитки в кафе, ресторанах, кино и т.д. значительно выше цен на продукты в обычных розничных магазинах, поэтому такие расходы могут оказать значительное влияние на бюджет семей.

Чтобы устранить сомнения по поводу наличия или отсутствия мультиколлинеарности, можно включить в модель в качестве факторного признака линейную комбинацию двух независимых, которые по подозрению заметно связаны между собой. Пусть переменная ex=expend – fdaw характеризует совокупные затраты домохозяйств, не связанные с потреблением еды и безалкогольных напитков вне дома.

  1. Параметризация, спецификация и идентификация моделей

    1. Факторы моделей и анализ зависимости между ними

При построении моделей зависимым фактором будут выступать затраты домохозяйств на еду и безалкогольные напитки, потребляемые в домашних условиях, а независимыми: количество детей в семье (в возрасте до 15 лет) и тип жилья, поскольку коэффициенты корреляции между данными признаками и результирующим значимы на 1%-ном уровне, следовательно есть смысл проверить количественный характер связи между ними. В число независимых факторов также войдут совокупные затраты домохозяйств за исключением затрат на питание вне дома. Данная переменная линейно включает в себя два других независимых фактора – совокупные расходы и затраты на питании вне домашних условий и создана для устранения сомнений по поводу наличия мультиколлинеарности в модели.

На основе построенных корреляционных полей зависимости результирующего признака и факторных (Рис. 6), можно предположить, что  между ними существует линейная взаимосвязь.

 

    1. Построение моделей

Уравнение построенной множественной регрессии будет выглядеть следующим образом:

FDHO=1733,73+602,30*CHILD+0,05*EX– 41,5*HHTENURE.                       (1)

Уравнение для подушевых расходов домохозяйств будет выглядеть следующим образом:

FDHO/SIZE=1033.75–44.82*CHILD+0.04*EX/SIZE+22.58*HHTENURE (2), где FDHO/SIZE – расходы на потребляемые в домашних условиях еду и безалкогольные напитки в расчёте на одного члена в семье (SIZE – количество членов семьи, SIZE>=1), EX/SIZE – совокупные расходы исключая затраты на потребляемые вне дома еду и безалкогольные напитки в расчёте на одного члена семьи .

Информация о работе Контрольная работа по "эконометрике"