Групповой факторный анализ

Автор работы: Пользователь скрыл имя, 25 Апреля 2013 в 10:14, лабораторная работа

Описание работы

В ряде областей исследования (в психологии, медицине, биологии, агрономии и некоторых других) достаточно часто встречаются ситуации, когда имеется фиксированная группа объектов исследования (subjects), которая последовательно подвергается действию различных уровней одного, двух или более факторов, в результате чего у каждого объекта измеряется по одному отклику для каждого уровня фактора.

Файлы: 1 файл

Лр10отчёт.doc

— 222.50 Кб (Скачать файл)

Лабораторная  работа №11/1

Групповой факторный  анализ

Ротько О.В. 07-Э-МО1

 

Назначение. В ряде областей исследования (в психологии, медицине, биологии, агрономии и некоторых  других) достаточно часто встречаются  ситуации, когда имеется фиксированная  группа объектов исследования (subjects), которая последовательно подвергается действию различных уровней одного, двух или более факторов, в результате чего у каждого объекта измеряется по одному отклику для каждого уровня фактора. Такая схема эксперимента, очевидно, существенно отличается от классической схемы факторного исследования, когда измерения отклика при различных сочетаниях значений факторов производятся у различных объектов. Важным здесь является то, что отклики измеряются у одних и тех же объектов при различных уровнях факторов и несут в себе следы их субъективной вариабельности. Тем самым оказывается возможным вычислить эту субъективную вариабельность и удалить ее из остаточной (случайной) дисперсии, тем самым повысив достоверность выводов о влиянии главных факторов.

 

Терминология. В англоязычной литературе такие схемы организации  измерений и методы анализа получили название Repeated-measures Design или же в дословном  переводе на русский язык: схемы  с повторными измерениями. Однако внедрение  такого дословного перевода в отечественную практику представляется не вполне удачным, поскольку аналогичный термин уже давно задействован для обозначения классических схем повторных измерений, когда для различных уровней исследуемого фактора используются различные объекты, но у каждого объекта при одном и том же значении фактора выполняются несколько измерений отклика. А это, естественно, влечет за собой терминологическую и концептуальную путаницу. Не имея возможности исследовать, как же англо-говорящие коллеги объясняют столь запутанное положение своим рядовым читателямнепрофессионалам, в данном разделе мы ввели “неконфликтующие” термины: Групповой дисперсионный анализ или Схемы с повторногрупповыми измерениями факторных эффектов.

 

Агрономия. Отметим, что  в области агрономии эти методы достаточно давно и широко используются и получили там название рандомизированных повторений с полным набором данных (см., например: В.Ф.Моисейченко и др. Основы научных исследований в агрономии. М., Колос, 1996). Типичным примером такого планирования является испытание m сортов пшеницы или m типов удобрений на n различных по составу почвы, климатическим условиям и т.п. делянках, каждая из которых делится на m участков для высева m сортов пшеницы, для испытания m удобрений и т.п. (здесь в качестве группы объектов выступают делянкасорт) В отличие от этого классической схемой исследования (или в агрономической терминологии — методом полной рандомизации) был бы случайный выбор для каждого сорта своих собственных делянок соверщенно независимо от выбора делянок для высевания других слортов.

 

Разновидности метода. Реализованные  в данном разделе методы следуют  монографии: David C. Howell. Statistical Methods for Psychology  fourth edition. Duxbury Press, Belmont, 1997. Выбор конкретного метода производится по меню рис. 9. 31.

Поясним повторногрупповые  методы дисперсионного анализа на примере  условного эксперимента, в котором  проверяется действие на группу пациентов  некоторого постоянно принимаемого медицинского препарата с течением времени (фактор 1), оцениваемого измерением некоторого физиологического показателя (отклик или зависимая переменная) один раз в неделю. Если к этой схеме мы не делаем никаких дополнительных добавлений, то она соответствует однофакторному групповому эксперименту.

 

Пусть теперь мы разделили пациентов на две (или более) группы: принимающих традиционный препарат и принимающих новый препарат. В этом случае мы имеем схему одного внутригруппового (within-subjects) фактора (неделя) и одного межгруппового (between-subjects) фактора (препарат). Если же одна и та же группа пациентов принимает сначала традиционный препарат, а затем новый препарат, то получается схема с двумя внутригрупповыми факторами.

Пусть теперь мы разделили  пациентов по полу (мужчины и женщины). Тогда мы имеем схему трехфакторного исследования, в которой два фактора (пол и препарат) являются межгрупповыми и один фактор (неделя) является внутригрупповым.

 

Предположим теперь, что  все пациенты принимают сначала  первый, а затем второй препарат. Тогда у нас получается схема трехфакторного исследования с двумя внутригрупповыми факторами (препарат и время) и одним межгрупповым фактором (пол).

Пусть теперь в последней  схеме исследования мы не различаем  пациентов по полу, но зато каждого  пациента при приеме каждого препарата  в течение некоторого фиксированного числа недель подвергаем сначала одному, а затем другому методу физиотерапии. В таком случае мы имеем схему эксперимента с тремя внутригрупповыми факторами.

 

Примечание: Реальная практика дисперсионного анализа обычно ограничивается трехфакторными схемами в связи как с практическими ограничениями возможности постановки эксперментов большей факторности, так и с познавательными ограничениями осмысления их результатов и аргументирования в обсуждениях с коллегами и оппонентами.

Исходные данные.

Однофакторный эксперимент. При этой схеме исходные данные должны представлять собой матрицу размером mn, в которой столбцы отвечают различным уровням первого фактора j=1,...,m, по строкам расположены объекты i=1,...,n, а каждая ячейка содержит один отклик, измеренный у данного объекта при соответствующем уровне фактора.

 

Схема с двумя факторами. При этой схеме исходные данные должны представлять собой матрицу размером Mn, в которой по строкам расположены  объекты i=1,...,n, а по столбцам расположены сначала измерения для первого уровня первого фактора (внутригруппового для схемы со смешанными факторами или первого межгруппового для схемы с двумя межгрупповыми факторами) для всех последовательных уровнях второго фактора, затем второго уровня  первого фактора для всех последовательных уровнях второго фактора и т.д. Тем самым M=ms, где: m — число уровней первого фактора, а s — число уровней второго фактора. При этих схемах в меню выбора метода анализа (рис. 9.3—1) необходимо ввести число уровней первого фактора.

 

Схема с тремя факторами. При этой схеме исходные данные должны представлять собой матрицу размером Mn, в которой по столбцам расположены  объекты i=1,...,n, а по строкам расположены  измерения сначала для первого  уровня первого фактора и первого уровня второго фактора при всех последовательных значениях уровня третьего фактора, затем измерения для второго уровня первого фактора и первого уровня второго фактора при всех последовательных значениях уровня третьего фактора и т.д., а в конце (по такой же схеме) — для последнего уровня первого фактора и последнего уровня второго фактора при всех последовательных значениях уровня третьего фактора. Тем самым M=mst, где: m — число уровней первого фактора, а s — число уровней второго фактора, t — число уровней третьего фактора. При этих схемах в меню выбора метода анализа (рис. 9.31) необходимо ввести число уровней первого и второго факторов.

 

Методические аспекты. Важное допущение для корректного  использования критерия Фишера при  групповом анализе состоит в так называемой составной (compound) симметрии матрицы ковариаций, вычисляемый по градациям внутригруппового фактора (отметим, что  случае двуфакторной смешанной схемы матрица ковариаций вычисляется успеднением по градациям межгруппового фактора). Упрощенно говоря, диагональные (дисперсионные) элементы этой матрицы должны быть приблизительно равны в своих значениях, то же самое касается и недиагональных (ковариационных) элементов, соотношение же величин этих двух групп элементов и их знаки являются не столь существенными (статистический тест для проверки этого свойства предложен:  Winer, 1971 и усовершенствован: Breen, 1980).

 

Как показали: Box в 1954г. и Greenhouse и Geisser в 1959г. в случае нарушения допущения  составной симметрии бывает полезна  коррекция числа степеней свободы для критериев Фишера, посредством умножения множителя от числа градаций внутригруппового фактора на поправочный коэффициент.e. Далее Huynh и Feldt в 1976 предложили для больших значений e>0.75 модификацию этого коэффициента e'.

Поскольку эти коэффициенты имеют значения, как правило, меньше единицы, то в связи с уменьшением числа степеней свободы для критериев Фишера значимость нулевой гипотезы несколько увеличивается, а достоверность гипотезы о влиянии фактора уменьшается.

 

Выдача группового дисперсионного анализа включает дисперсионную таблицу со столбцами: сумма квадратов, число степеней свободы, средняя сумма квадратов, а строки содержат значения для первого, второго и т.д. факторов, а также остаточные и общие параметры (см. формулы).

Далее для каждого фактора вычисляется  статистика Фишера F с уровнем значимости P. Если P>0.05, нулевая гипотеза об отсутствии влияния соответствующего фактора  может быть принята.

 

Затем для визуальной проверки составной  симметрии выдается матрица ковариаций и поправочные коэффициенты  и ‘. Если эти коэффициенты не слишком велики по своим значениям: <0.75 или >0.75 и ‘<0.98, то проводится перепроверка нулевых гипотез при скорректированных степенях свободы.

Примечание: Понятно, что если число  градаций внутригруппового фактора меньше четырех, то об оценке сферичности матрицы ковариаций в статистическом смысле говорить не приходится. Поэтому рассмотренная коррекция степеней свободы преимущественно применима к схемам однофакторного и двуфакторного экспериментов. В случае нескольких внутригрупповых факторов вычисление матрицы ковариаций и коррекция степеней свободы производится отдельно по каждому фактору.

 

Пример 1

9 пациентов проверяют  релаксационную методику для  ослабления мигрирующей головной  боли (фиксируется число головных приступов в неделю). Исследование проводилось в течение 5 недель, при чем релаксационная техника применялась последние 3 недели. Задача: выявить влияние фактора релаксации на фоне первых 2-ух контрольных недель.

21 22 8 6 6

20 19 10 4 4

17 15 5 4 5

25 30 13 12 17

30 27 13 8 6

19 27 8 7 4

26 16 5 2 5

17 18 8 1 5

26 24 14 8 9

Столбики - недели, а строки - каждый пациент.

Вывод: визуально применение релаксационной методики привело к  снижению количество головных миграционных болей.

 

ГРУППОВОЙ 1-ФАКТОРНЫЙ АНАЛИЗ.  Файл: anova_bs.std

 

Источник  Сум.квадр  Ст.своб Ср.квадр

Групповая    486,7        8

Факт.1        2449        4    612,3

Остаточн.    230,4       32      7,2

Общая         3166       44

 

F(фактор1)=85,04, Значимость=9,967E-9, степ.своб = 4,32

   Гипотеза 1: <Есть  влияние фактора на отклик>

 

  Матрица ковариаций

       21     11,75      9,25     7,833     7,333

    11,75      28,5     13,75     16,38     13,38

     9,25     13,75      11,5     8,583     8,208

    7,833     16,38     8,583     11,69     10,82

    7,333     13,38     8,208     10,82     16,94

 

Поправочные коэффициенты: e=0,6845  e"=1

 

  С учетом поправочного  коэффициента=0,6845

F(фактор1)=85,04, Значимость=1,522E-7, степ.своб = 2,738,21,9

   Гипотеза 1: <Есть  влияние фактора на отклик>

 

 

1-ФАКТОРНЫЙ ДИСПЕРСИОННЫЙ  АНАЛИЗ.  Файл: anova_bs.std

          параметрический

 

Источник   Сум.квадр  Ст.своб Ср.квадр      F   Значимость Сила влияния

  Факт.1        2449        4    612,3    34,15 9,098E-8  0,09356

  Остат.       717,1       40    17,93

  Общая         3166       44    71,96

 

F(фактор1)=34,15, Значимость=9,098E-8, степ.своб = 4,40

   Гипотеза 1: <Есть  влияние фактора на отклик>

 

          Параметры модели:

Среднее = 13,24, доверит.инт.=13,79

Эффект1 = 9,089, доверит.инт.=15,76

Эффект2 = 8,756, доверит.инт.=15,76

Эффект3 = -3,911, доверит.инт.=15,76

Эффект4 = -7,467, доверит.инт.=15,76

Эффект5 = -6,467, доверит.инт.=15,76

 

             Парные сравнения Шеффе

Переменные  Разность  Интервал    Значим  Гипотеза H1

    1-2      0,3333    6,432   0,9991

    1-3          13    6,432 3,618E-5     Да

    1-4       16,56    6,432  2,49E-6     Да

    1-5       15,56    6,432 4,852E-6     Да

    2-3       12,67    6,432 4,877E-5     Да

    2-4       16,22    6,432  3,09E-6     Да

    2-5       15,22    6,432 6,144E-6     Да

    3-4       3,556    6,432   0,5385

    3-5       2,556    6,432   0,8022

    4-5           1    6,432   0,9896

x1,x2-x3,x5,x6:     14,87    4,642 1,506E-7     Да

 

Вывод: сопоставляя внутригрупповой однофакторный и просто однофакторный анализ, мы видим, что вероятность ошибки при отказе от нулевой гипотезы в первом случае выше, чем во втором.

В случае внутригруппового анализа применение схемы группового дисперсионного анализа позволяет получить результат с большей достоверностью.

 

 

 

 

Пример 2

Исследуется двигательная активность крыс в ответ на инъекцию мидозоломана. Есть гипотеза о том, что у крыс быстро развивается привыкание к этому препарату и во многом оно связано со средой, в которой находятся крысы. Используются 2 тестовых и 1 контрольная группы, каждая из 8 животных. В предэкспериментальной фазе 2ум тестовым группам вводился препарат, а контрольной группе – нейтральный физраствор. В день эксперимента сделаны инъекции препарата всем 3 группам, причем одна тестовая группа пересажена в новую среду. Процесс метаболизма идет час и двигательную активность измеряли 6 раз через 5 минут.

 

150 44 71 59 132 74

335 270 156 160 118 230

149 52 91 115 43 154

159 31 127 212 71 224

159 0 35 75 71 34

292 125 184 246 225 170

297 187 66 96 209 74

170 37 42 66 114 81      контрольная группа

 

346 175 177 192 239 140

426 329 236 76 102 232

359 238 183 123 183 30

272 60 82 85 101 98

200 271 263 216 241 227

366 291 263 144 220 180

371 364 270 308 219 267

497 402 294 216 284 255     группа в привычной среде

 

282 186 225 134 189 169

317 31 85 120 131 205

362 104 144 114 115 127

338 132 91 77 108 169

263 94 141 142 120 195

138 38 16 95 39 55

329 62 62 6 93 67

292 139 104 184 193 122    группа в новой среде

 

Общим внутригрупповым  фактором является временной интервал. Фактор имеет 6 градаций.

Второй межгрупповой фактор – среда (внешние условия). Имеет 3 градации.

 

 

 

 

1 – активность крыс  в привычной среде

2 – активность крыс  в новой среде

3 – контрольная группа

 

ГРУППОВОЙ 1+1-ФАКТОРНЫЙ  АНАЛИЗ.  Файл: anova_b2.std

 

Источник  Сум.квадр  Ст.своб Ср.квадр

Групповая  6,705E5       23

Факт.1     3,997E5        5  7,995E4

Межфакт.   8,082E4       10     8082

Остат.1    2,812E5      105     2678

Информация о работе Групповой факторный анализ