Группировка статистических данных, статистическое изучение взаимосвязи явлений

Автор работы: Пользователь скрыл имя, 22 Апреля 2013 в 11:25, контрольная работа

Описание работы

1. Построить по этим данным интервальный вариационный ряд случайной величины Х с равными интервалами и начертить гистограмму.
2. Найти эмпирическую функцию распределения и построить ее график.
3. Вычислить среднее арифметическое выборки, выборочную дисперсию, выборочное среднее квадратичное отклонение, коэффициент вариации, размах вариации, начальные и центральные моменты до третьего порядка включительно, величину асимметрии и эксцесс, ошибки асимметрии и эксцесса.

Файлы: 1 файл

Статистическая обработка данных.doc

— 151.00 Кб (Скачать файл)

Вариант 6

 

 

По результатам 80 пусков ракет определены расстояния (в км) до точек падения. Результаты оформлены в следующую статистическую совокупность:

 

50,26

50,33

50,37

50,41

50,3

50,29

50,31

50,34

50,37

50,4

50,33

50,39

50,34

50,44

50,3

50,4

50,38

50,3

50,3

50,35

50,38

50,33

50,35

50,42

50,43

50,34

50,36

50,36

50,32

50,31

50,4

50,34

50,37

50,39

50,29

50,31

50,28

50,42

50,31

50,41

50,33

50,3

50,44

50,32

50,44

50,35

50,36

50,33

50,32

50,34

50,35

50,41

50,36

50,27

50,33

50,37

50,39

50,36

50,32

50,36

50,43

50,35

50,34

50,34

50,33

50,28

50,36

50,35

50,35

50,37

50,35

50,3

50,34

50,34

50,32

50,38

50,33

50,37

50,31

50,34


 

1. Построить по этим данным интервальный вариационный ряд случайной величины Х  с равными интервалами и начертить гистограмму.

2. Найти эмпирическую  функцию распределения и построить  ее график.

3. Вычислить среднее арифметическое  выборки, выборочную дисперсию, выборочное среднее квадратичное отклонение, коэффициент вариации, размах вариации, начальные и центральные моменты до третьего порядка включительно, величину асимметрии и эксцесс, ошибки асимметрии и эксцесса.

4. Используя критерий  χ2 – Пирсона по данному вариационному ряду при уровне значимости α= 0.05, проверить гипотезу о том, что случайная величина Х распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.

 

Решение:

1. Построить по этим данным интервальный вариационный ряд случайной величины Х  с равными интервалами и начертить гистограмму.

 

Найдем сначала число  групп в группировке по формуле  Стерджесса:

 групп.

Размах вариации составляет R=50,44-50,26= 0,18 км.

Определим величину интервала:

км.

После этого  построим интервалы групп:

 

№ групп

Интервал расстояний

Частота

Накопленная частота

1

От 50,26 до 50,29

6

6

2

От 50,29 до 50,32

16

22

3

От 50,32 до 50,35

26

48

4

От 50,35 до 50,38

16

64

5

От 50,38 до 50,41

9

73

6

От 50,41 до 50,44

7

80

7

От 50,44

0

 

 

 

 

 

 

 

2. Найти  эмпирическую функцию распределения  и построить ее график.

 

Построим выборочную функцию распределения по данным табл.

Объем выборки  по условию равен 7, но из-за округления возьмем 6, т.е. n = 6. Наименьшая варианта равна 50,26, следовательно, F7(х) = 0 при х ≤ 50,26.

Значение X < 50,29, наблюдалось 6 раз; следовательно, имеем

 

 

 

 

 

 

График эмпирической функции распределения изображен на рис.

 

 

 

 

 

3. Вычислить  среднее арифметическое выборки,  выборочную дисперсию, выборочное  среднее квадратичное отклонение, коэффициент вариации, размах вариации, начальные и центральные моменты  до третьего порядка включительно, величину асимметрии и эксцесс, ошибки асимметрии и эксцесса.

 

Начальным выборочным моментом k-го порядка называется величина, определяемая по формуле:

,

где хi – наблюдаемое значение с частотой ni, n – число наблюдений. В частности, начальный выборочный момент первого порядка обозначается  и называется выборочной средней:

.

Медианой называется значение признака, приходящееся на середину ранжированного ряда наблюдений.

Модой называется вариант, которому соответствует наибольшая частота.

Вариационный  размах R равен разности между наибольшим и наименьшим вариантом ряда.

Центральным выборочным моментом k-го порядка называется величина, определяемая по формуле:

.

В частности, центральной  выборочный момент второго порядка  обозначается S2 и называется выборочной дисперсией:

.

 

Средним квадратическим отклонением S называется арифметическое значение корня квадратного из дисперсии:

.

Коэффициентом вариации называется отношение среднего квадратического  отклонения к средней, выраженное в  процентах:

.

Справедливы следующие формулы, выражающие центральные выборочные моменты различных порядков через начальные:

 и т.д.

Выборочным коэффициентом  асимметрии называется число , определяемое формулой

.

Выборочный коэффициент  асимметрии служит для характеристики асимметрии полигона (см. далее) вариационного ряда. Если полигон асимметричен, то одна из ветвей его, начиная с вершины, имеет более пологий «спуск», чем другая.

 

В случае отрицательного коэффициента асимметрии более пологий «спуск»  полигона наблюдается слева, в противном случае – справа. В первом случае асимметрию называют левосторонней, а во втором – правосторонней.

Выборочным эксцессом  или коэффициентом крутизны называется число E˜k, определяемое формулой

.

Выборочный  эксцесс служит для сравнения  на «крутость» выборочного распределения  с нормальным распределением. Ранее  подчеркивалось, что эксцесс для  случайной величины, распределенной нормально, равен нулю. Поэтому за стандартное значение выборочного эксцесса принимают E˜k = 0. Если выборочному распределению соответствует отрицательный эксцесс, то соответствующий полигон имеет более пологую вершину по сравнению с нормальной кривой. В случае положительного эксцесса полигон более крутой по сравнению с нормальной кривой.

 

Для вычисления выборочных характеристик (выборочной средней, дисперсии, асимметрии и эксцесса) целесообразно пользоваться вспомогательной  таблицей, которая составляется так:

1) используя  данные таблицы, найдем середину  каждого интервала и заполним столбец 1 табл.;

 

2) во второй  столбец записывают частоты ni, складывают все частоты и их сумму (объем выборки n) помещают в нижнюю клетку столбца;

3) в третий столбец записывают условные варианты , причем в качестве ложного нуля С выбирают варианту, которая имеет наибольшую частоту или занимает среднее положение в ряду данных, и полагают h равным разности между любыми двумя соседними вариантами (длина интервала bi – ai); по данным примера С = 50,34, h = 4,5; практически же третий столбец заполняется так: в клетке третьего столбца, которая принадлежит строке, содержащей наибольшую частоту, пишем 0; над нулем последовательно –1, –2, –3, а под нулем 1, 2, 3, 4, 5. Дальнейший порядок заполнения таблицы простой и не требует пояснений. Последний столбец таблицы – контрольный.

 

xi

ni

ui

ni*ui

ni*ui2

ni*ui3

ni*ui4

ni*(ui+1)4

50,28

6

-2

-12

24

-48

96

6

50,31

16

-1

-16

16

-16

16

0

50,34

26

0

0

0

0

0

26

50,37

16

1

16

16

16

16

256

50,4

9

2

18

36

72

144

729

50,43

7

3

21

63

189

567

1792

сумма

80

3

27

155

213

839

2809


 

 

Выборочный  условный момент k-го порядка определяется по формуле

По данным примера

 

 

Вычислим искомые  выборочные среднюю и дисперсию:

 

 

Выборочное  среднее квадратическое отклонение

 

Найдем центральные  эмпирические моменты третьего и  четвертого порядка:

 

 

 Найдем значение  коэффициента асимметрии и эксцесса:

 

 

Медиана M˜e – значение признака, приходящееся на середину ранжированного ряда наблюдений.

Для интервального  ряда медиану следует вычислять  по формуле

,

где M˜e означает номер медианного интервала, (M˜e–1) – интервала,

предшествующего медианному.

 

Мода M˜o для совокупности наблюдений равна тому значению признака, которому соответствует наибольшая частота.

Для одномодального интервального ряда моду можно вычислить по формуле ,  где M˜o означает номер модального интервала (интервал с наибольшей частотой), (M˜o–1) и (M˜o+1) – номера предшествующего модальному и следующего за ним интервалов.

В примере

 

 

.Так как по  величине  , M˜o и M˜e мало отличаются друг от друга, есть основания предполагать теоретическое распределение нормальным.

Коэффициент вариации

 

Коэффициент вариации является относительной мерой рассеяния  признака.

Коэффициент вариации используется и как показатель однородности выборочных наблюдений. Считается, что  если коэффициент вариации не превышает 10%, то выборку можно считать однородной, т.е. полученной из одной генеральной совокупности.

 

4. Используя  критерий χ2 – Пирсона по данному вариационному ряду при уровне значимости α= 0.05, проверить гипотезу о том, что случайная величина Х распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.

 

5. Для исследования  зависимости объема производства  (Y) от основных фондов (Х) получены  статистические данные по 65 предприятиям за год.

 

 

Y

X, тыс. Руб.

           
 

32-52

52-72

72-92

92-112

112-132

132-152

152-172

48-68

5

           

68-88

2

3

4

       

88-108

 

2

7

6

     

108-128

   

3

8

4

   

128-148

   

1

1

5

3

 

148-168

         

5

 

168-188

           

4

188-208

           

2

Информация о работе Группировка статистических данных, статистическое изучение взаимосвязи явлений