Анализ таблиц сопряженности
Курсовая работа, 27 Апреля 2015, автор: пользователь скрыл имя
Описание работы
Способы обработки числовой информации изучены достаточно хорошо и известны практически всем исследователям, в то же время проблеме обработки данных, имеющих нечисловую, а качественную природу, уделяется достаточно мало внимания. Это является первым моментом актуальности работы. Следующий фактор, отражающий актуальность, состоит в том, что основная задача исследователя, занимающегося обработкой данных, сводится к выявлению закономерностей из случайностей, а выявление закономерности, то есть связи между переменными, и последующей оценки ее силы является актуальной задачей прикладной статистики.
Содержание работы
ВВЕДЕНИЕ 3
Глава 1. Место таблиц сопряженности в структуре социологического исследования 5
1.1.Особенности статистического исследования 5
1.2. Краткая история статистических методов. 6
1.3. Статистическое наблюдение как метод статистического исследования и процесс 8
1.4. Статистические таблицы как средство наглядного и компактного представления цифровой информации 9
1.4.1. Простая статистическая таблица 10
1.4.2. Групповая статистическая таблица (сложная) 11
1.4.3. Комбинационная статистическая таблица (сложная) 11
1.4.5. Матрица 12
1.4.6. Таблица сопряженности 12
1.5. Анализ таблицы как метод научного исследования 13
Глава 2. Модели и методы анализа данных в таблицах сопряженности. 15
2.1. Таблицы сопряженности и таблицы флагов и заголовков 16
2.2. Статистики таблиц сопряженности 18
Глава 3. Анализ таблиц сопряженности 21
3.1. Анализ связи между двумя переменными 22
Заключение 30
Список используемой литературы 31
Файлы: 1 файл
Курсовая_002.docx
— 148.17 Кб (Скачать файл)
Физико-математический факультет
КУРСОВАЯ РАБОТА
по дисциплине: «Методы прикладной статистики для социологов»
на тему:
«Анализ таблиц сопряженности»
2014
Оглавление
ВВЕДЕНИЕ
Способы обработки числовой информации изучены достаточно хорошо и известны практически всем исследователям, в то же время проблеме обработки данных, имеющих нечисловую, а качественную природу, уделяется достаточно мало внимания. Это является первым моментом актуальности работы. Следующий фактор, отражающий актуальность, состоит в том, что основная задача исследователя, занимающегося обработкой данных, сводится к выявлению закономерностей из случайностей, а выявление закономерности, то есть связи между переменными, и последующей оценки ее силы является актуальной задачей прикладной статистики.
При обработке качественной информации особую роль играют категоризированные переменные, то есть те, которые могут принимать только два значения. Для таких переменных существует достаточно много способов выявления связи с помощью аппарата таблиц сопряженности как средства представления совместного распределения двух переменных, предназначенного для исследования связи между ними, но, к сожалению, среди них нет универсального. В связи с этим в зависимости от значений частот приходится использовать тот или иной критерий проверки связи, то есть существует проблема анализа всех способов выявления связи между категориальными переменными и модификации некоторых из них.
Объектом исследования выступает таблица сопряженности как наиболее универсальное средство изучения статистических связей, так как в ней могут быть представлены переменные с любым уровнем измерения, как абсолютные, так и относительные частоты (в долях или процентах). Таблицы сопряженности позволяют измерить связи между кросстабулированными переменными. Относительные частоты могут рассчитываться по отношению к маргинальной частоте по строке, к маргинальной частоте по столбцу, к объему выборки.
Предметом исследования является анализ таблиц сопряжённости. Основным средством анализа выступает логарифмически-линейная модель. Если учтены все важные признаки, то естественно предположить, что частота в некоторой ячейке пропорциональна произведению частот самих признаков, образующих эту ячейку. Тогда получится модель, линейная относительно логарифма частоты. Именно такой подход позволяет использовать аналитические данные для проверки гипотезы о наличии связи между двумя признаками, а также для измерения тесноты связи.
Полученные результаты могут иметь компьютерную и аналитическую реализацию, когда особое внимание уделяется процессу обработки информации через практическое внедрение кросстабуляции и аппарата таблиц сопряженности.
Целью работы является выяснение возможностей аппарата таблиц сопряженности для выявления связи между качественными переменными.
Поставленная цель определяет необходимость решения следующих задач.
- Провести анализ некоторых способов выявления связей между качественными переменными.
- Исследовать условия зависимости и независимости категориальных переменных в таблице сопряженности.
- Проверить согласованность классических способов выявления и оценки силы связи между категориальными переменными.
Для решения поставленных задач в работе использовались аналитические методы исследования прикладной статистики, статистики объектов нечисловой природы, описательный метод.
В результате выявлены теоретические и практические особенности использования известных способов установления связи между качественными переменными. Определены ограничения на значения частот таблиц сопряженности для эффективного применения различных критериев выявления и оценки силы связи между качественными переменными.
Работа состоит из введения, трех глав, заключения, списка использованных источников.
Во введении обоснована актуальность работы, сформулирована цель и поставлены задачи исследования, приводятся методы исследований и заявлены результаты работы.
Глава первая носит теоретико-аналитический характер. В ней приведен обзор классических способов социологического исследования, статистических наблюдений, выявления и оценки связей между категоризированными переменными в таблицах сопряженности.
Во второй главе дается общее понятие кросс табуляции и особенностей ее применений в различных областях человеческого знания, в том числе и в области социологии. При этом особое внимание уделяется применению аппарата таблиц сопряженности как достаточно наглядного и универсального инструмента выявления зависимости между качественными переменными. Рассматриваются особенности использования различных критериев проверки связи между категоризованными переменными.
Далее представлены современные методы анализа тесноты взаимосвязи между качественными переменными. Представлен поиск закономерностей для качественных данных через применение критериев проверки и оценки силы связи, в основе которых лежит метод хи-квадрат.
Практическая часть представлена примерами использования таблиц сопряженности для статистического социологического анализа.
Заключение содержит выводы по теме работы.
Список использованных источников представлен перечнем трудов по теме исследования и смежным темам.
Глава 1. Место таблиц сопряженности в структуре социологического исследования
Развитие социологии обязательно предполагает развитие эмпирических исследований, обогащающих теорию и позволяющих разрабатывать механизмы регулирования социальных процессов.
Социологические исследования обеспечивают обратную связь, дополняя статистическую информацию конкретными данными об интересах и запросах, мнениях и настроениях людей, о жизненных планах, уровне и качестве жизни, ценностных установках. Особенность такого развития обусловлена тем, что статистические методы и построенный на их основе анализ данных в социологии и их реализация на компьютерных моделях является мощным средством для решения прикладных. Анализ и обобщение результатов социологического исследования позволяют предсказать возможные варианты развития социальных процессов и явлений.
Частотные таблицы являются основным способом представления статистических данных. Они используются (рассчитываются и анализируются) практически в любом эмпирическом исследовании. Это не случайно. Средства изучения статистических закономерностей (а именно такие закономерности и пытается найти социолог на основе изучения частотных таблиц), предлагаемые современной наукой, так или иначе базируются на положениях математической статистики, объектом изучения которой служат случайные величины, предметом - параметры их распределений. Все те закономерности, которые мы можем найти с помощью математической статистики, по существу фигурируют в виде наборов параметров распределений случайных величин. Частотные же таблицы являются, строго говоря, выборочными представлениями одномерных и многомерных случайных величин (в выборочных исследованиях вместо термина «случайная величина» используется термин «признак» или его синонимы - «величина», «характеристика», «переменная»). Таким образом, опора на анализ частотных таблиц, к чему побуждает социолога здравый смысл, в действительности оправдывается тем серьезным изучением понятия статистической закономерности, которое осуществлялось в течение нескольких столетий в рамках математической статистики.
Важность анализа частотных таблиц давно осознана учеными. В настоящее время имеется большое количество методов соответствующего плана. К сожалению, далеко не все из них активно задействованы в нашей социологии (парадоксальным выглядит то обстоятельство, что среди весьма слабо используемых в широкой отечественной практике методов есть и очень интересные алгоритмы, разработанные советскими и российскими исследователями).
Особенности статистического исследования