Статистическая обработка результатов испытаний одномерных и двумерных случайных величин
Курсовая работа, 16 Апреля 2014, автор: пользователь скрыл имя
Описание работы
В данной курсовой работе проводим статистическую обработку результатов испытаний для двух разных задач. В первой задаче представлены контрольные обмеры 100 валиков. Для статистической обработки строим полигон и гистограмму частот, это позволяет нам определить вид распределения. Проверяем гипотезу о нормальном распределении генеральной совокупности по критерию Пирсона.
Содержание работы
Введение 3
Статистическая обработка 4
Одномерные случайные величины 4
Двумерные случайные величины 14
Заключение 21
Список использованной литературы 22
Файлы: 1 файл
твмс курсовая(Даша).docx
— 119.57 Кб (Скачать файл)Государственное бюджетное образовательное учреждение
высшего профессионального образования Московской области
«Международный университет природы, общества и человека «Дубна»
Факультет Естественных и Инженерных наук
Кафедра прикладной математики и информатики
Курсовая работа по «Теории вероятности и математической статистики»
Статистическая обработка результатов испытаний одномерных и двумерных случайных величин
Студентки II курса группы 2241
Селиверстовой Дарьи Валерьевны
Руководитель:
Доц. к. т.н.: Богомолова Е. В.
_____________________
Дубна, 2012 г.
Оглавление
Введение
В данной курсовой работе проводим статистическую обработку результатов испытаний для двух разных задач. В первой задаче представлены контрольные обмеры 100 валиков. Для статистической обработки строим полигон и гистограмму частот, это позволяет нам определить вид распределения. Проверяем гипотезу о нормальном распределении генеральной совокупности по критерию Пирсона. Вычисляем числовые характеристики выборки: выборочную среднюю, моду, медиану, выборочную дисперсию, коэффициент вариации, коэффициенты асимметрии и эксцесса. Оцениваем математическое ожидание и среднее квадратическое отклонение нормально распределенного признака генеральной совокупности с помощью доверительных интервалов с заданной надежностью.
Во второй задаче представлена корреляционная таблица распределения 100 предприятий по капиталовложениям Х (млн. руб.) и выписка продукции Y (млн. руб.). По данным этой таблицы находим выборочные уравнения прямых линий регрессии Y на X и X на Y, строим их графики. Вычисляем коэффициент корреляции, который позволяет нам судить о прямой или обратной зависимости прямых линий регрессии и их силе. Также находим выборочное корреляционное отношение, которое оценивает тесноту связи между Y и X, X и Y. Вычисляем интервальные оценки для генеральных коэффициентов регрессии.
Для статистической обработки результатов используем различные методы: метод моментов, наибольшего правдоподобия, метод произведений вычисления выборочных средней дисперсии, метод сумм вычисления выборочных средней дисперсии, используем разделы теории корреляции и статистической проверки статистических гипотез.
Статистическая обработка
Одномерные случайные величины
Задача №1. Контрольные обмеры 100 валиков дали следующие результаты:
Табл.№1
7,39 |
7,43 |
7,54 |
7,64 |
7,4 |
7,55 |
7,4 |
7,26 |
7,42 |
7,5 |
7,32 |
7,31 |
7,28 |
7,52 |
7,46 |
7,63 |
7,38 |
7,44 |
7,52 |
7,53 |
7,37 |
7,33 |
7,24 |
7,13 |
7,53 |
7,53 |
7,39 |
7,57 |
7,51 |
7,34 |
7,39 |
7,47 |
7,51 |
7,48 |
7,62 |
7,58 |
7,57 |
7,33 |
7,51 |
7,4 |
7,3 |
7,48 |
7,4 |
7,57 |
7,51 |
7,4 |
7,52 |
7,56 |
7,4 |
7,34 |
7,23 |
7,37 |
7,48 |
7,48 |
7,62 |
7,35 |
7,36 |
7,4 |
7,45 |
7,29 |
7,48 |
7,58 |
7,44 |
7,56 |
7,28 |
7,59 |
7,47 |
7,62 |
7,54 |
7,2 |
7,38 |
7,43 |
7,35 |
7,56 |
7,51 |
7,47 |
7,4 |
7,29 |
7,2 |
7,46 |
7,42 |
7,44 |
7,41 |
7,29 |
7,48 |
7,39 |
7,5 |
7,38 |
7,45 |
7,5 |
7,45 |
7,42 |
7,29 |
7,53 |
7,34 |
7,55 |
7,33 |
7,32 |
7,69 |
7,46 |
Составим интервальный ряд для контрольных обмеров 100 валиков. Для этого находим максимальные и минимальные варианты и, используя заданный шаг h=0,07 – расстояние между двумя соседними вариантами, прибавляем h к х=7,13 до тех пор пока не перекроем максимальное значение х=7,69; От интервального вариационного ряда переходим к дискретному вариационному ряду, приняв за новые варианты у – середины интервалов; Перейдем к условным вариантам: u=(y-C)/h, где u – условная варианта середины интервала, С – ложный нуль (С=7,38)
Табл.№2
интервалы: |
У |
n |
U |
n*u |
n*( |
n* |
n* |
n* | ||
7,13-7,20 |
7,17 |
1 |
0,01 |
-3 |
-3 |
-3,95 |
15,6025 |
9 |
-27 |
81 |
7,20-7,27 |
7,24 |
5 |
0,05 |
-2 |
-10 |
-2,95 |
43,5125 |
20 |
-40 |
80 |
7,27-7,34 |
7,31 |
13 |
0,13 |
-1 |
-13 |
-1,95 |
49,4325 |
13 |
-13 |
13 |
7,34-7,41 |
7,38 |
23 |
0,23 |
0 |
0 |
-0,95 |
20,7575 |
0 |
0 |
0 |
7,41-7,48 |
7,45 |
18 |
0,18 |
1 |
18 |
0,05 |
0,045 |
18 |
18 |
18 |
7,48-7,55 |
7,52 |
23 |
0,23 |
2 |
46 |
1,05 |
25,3575 |
92 |
184 |
368 |
7,55-7,62 |
7,59 |
11 |
0,11 |
3 |
33 |
2,05 |
46,2275 |
99 |
297 |
891 |
7,62-7,69 |
7,66 |
6 |
0,06 |
4 |
24 |
3,05 |
55,815 |
96 |
384 |
1536 |
сумма |
- |
100 |
- |
- |
95 |
-3,6 |
256,75 |
347 |
803 |
2987 |
Для наглядности строят различные графики статистического распределения, в частности, полигон и гистограмму.
Полигоном частот называют ломаную, отрезки которой соединяют точки (х1; n1), (х2; n2), … (xk;nk).
Для построения полигона частот на оси абсцисс откладывают варианты хi, а на оси ординат – соответствующие им частоты ni. Точки (xi;ni). Соединяют отрезками прямых и получают полигоны частот.
Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x1;W1) … (xk;Wk).Для построения полигона относительных частот на оси абсцисс откладывают варианты хi, а на оси ординат – соответствующие им относительные частоты Wi. Точки …(xi;Wi).соединяют отрезками прямых и получают полигон относительных частот.
Для построения полигона используем частоты и варианты у – середины интервалов дискретного вариационного ряда.
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению ni/h (плотность частоты).
Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии ni/h.
Площадь i-го частичного прямоугольника равна hni/h=ni – сумме частот вариант i-го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.
Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению Wi/h (плотность относительной частоты).
Для построения гистограммы относительны частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии Wi/h. Площадь i-го частичного прямоугольника равна hWi/h=Wi – относительной частоте вариант, попавших в i-й интервал. Площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.
Для построения гистограммы используем частоты и интервалы интервального ряда
Выборочная средняя:
Пусть для изучения генеральной совокупности относительно количественного признака Х извлечена выборка объема n.
Выборочной средней хв называют среднее арифметическое значение признака выборочной совокупности.
Если все значения х1, x2,…,xn признака выборки объема n различны , то
=(х1, x2,…,xn)/h.
Если значения признака х1, x2,…,xk имеют соответственно частоты n1,n2…,nk, причем n1+n2+…+nk=n, то
=(n1х1+n2х2+…+nkхk)/n, или =, [1]
т.е. выборочная средняя есть средняя взвешенная значений признака с весами, равным соответствующим частотам.
По данным интервального ряда 7,4465
Выборочная дисперсия:
Для того чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения , вводят свободную характеристику – выборочную дисперсию.
Выборочной дисперсией Dв называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения .
Если все значения х1, x2,…,xn признака выборки объема n различны, то
Dв=(⅀(хi–)2)/n.
Если же значения признака х1, x2,…,xk имеют соответственно частоты n1,n2,…,nk, причем n1+n2+…+nk=n, то
Dв=(,
[2]
т.е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответствующим частотам.
Кроме дисперсии для характеристики рассеяния значений признака выборочной совокупности вокруг своего среднего значения пользуются сводной характеристикой – средним квадратическим отклонением.
Выборочным средним квадратическим отклонением (стандартом) называют квадратический корень из выборочной дисперсии:
*в =
[3]
Вычисление дисперсии можно упростить, используя теорему:
Теорема: Дисперсия равна среднему квадратов значений признака минус квадрат общей средней:
D=
[4]
Доказательство: Справедливость теоремы вытекает из преобразований:
Dв=(=
Выборочная дисперсия является
смешенной оценкой генеральной дисперсии,
т.е. математическое ожидание выборочной
дисперсии не равно оцениваемой генеральной
дисперсии, а равно М(Dв)= Dг.
[5]
Чтобы найти исправленную дисперсию, которую обозначают S2 нужно умножить Dв на дробь .
Для контрольных обмеров валика:
Выборочная дисперсия – Dв=0,012581,
Выборочное среднее квадратическое отклонение – *в =0,11216394,
Исправленная дисперсия – S=0,113297.
Модой М0 называют варианту, которая имеет наибольшую частоту.
Медианой me называют варианту, которая делит вариационный ряд на 2 части, равные по числу вариант. Если число вариант нечетно, т.е. n=2k+1, то me=xk+1; при четном n=2k медиана me=(xk+ xk+1)/2.
Коэффициентом вариации V называют выраженное в процентах отношение выборочного среднего квадратического отклонения к выборочной средней:
V= [6]
Коэффициент вариации служит для сравнения величин рассеяния по отношению к выборочной средней двух вариационных рядов. Тот из рядов имеет большее рассеяние по отношению к выборочной средней, у которого коэффициент вариации больше. Коэффициент вариации – безразмерная величина, поэтому он пригоден для сравнения рассеяний вариационных рядов, варианты которых имеют различную размерность.
По результатам контрольного обмера валиков:
Медиана – me=7,44
Мода – Мо=7,44
Коэффициент вариации – V=21,51806%
Для оценки отклонения эмпирического распределения от нормального используют различные характеристики, к числу которых относятся асимметрия и эксцесс.
Асимметрия эмпирического распределения определяется равенством
Аs=m3/σв3, где m3 – центральный эмпирический момент третьего порядка [7]
Эксцесс эмпирического распределения определяется равенством
Ек=m4/σ4в – 3, где m4 – центральный эмпирический момент четвертого порядка [8]
m3=[M3–3M2M1+2(M1)3]*h3
[9]
m4=[M4 – 4M3M1+6M2(M1)2 – 3(M1)4]*h4
[10]
m2=[M2 – (M1)2]*h2
[11]
Mk=(∑nixik)/n
[12]
Для данного интервального ряда условные и эмпирические моменты:
M1 |
0,95 |
M2 |
3,47 |
M3 |
8,03 |
M4 |
29,87 |
m3 |
-5E-05 |
m4 |
0,000377 |
Тогда можно вычислить: As= 0,03518 и = 0,61796
Проверка гипотезы о нормальном распределении генеральной совокупности по критерию Пирсона
Пусть эмпирическое распределение задано в виде последовательности интервалов и соответствующих им частот. Для того чтобы при заданном уровне значимости α проверить гипотезу о нормальном распределении генеральной совокупности, надо:
- Перейти к дискретному вариационному ряду, взяв середины интервалов за новые варианты.
- Вычислить непосредственно выборочную среднюю и выборочное среднее квадратическое отклонение *.
- Вычислить теоретические частоты