Математическая статистика
Лекция, 11 Октября 2013, автор: пользователь скрыл имя
Описание работы
Математическая статистика – раздел математики, посвященный математическим методам обработки, систематизации и использования статичных данных для практических и научных целей.
Задачей этого раздела является разработка практических методов, регистрации, описания, анализ экспериментальных данных, получаемых в опытах с массовыми явлениями.
Особенностью статистики является изучение массовых, случайных явлений в условной неопределенности.
Файлы: 1 файл
Statistika.doc
— 436.00 Кб (Скачать файл)1. Математическая статистика. Ее виды, особенности, задачи.
Математическая статистика – раздел математики, посвященный математическим методам обработки, систематизации и использования статичных данных для практических и научных целей.
Задачей этого раздела является разработка практических методов, регистрации, описания, анализ экспериментальных данных, получаемых в опытах с массовыми явлениями.
Особенностью статистики является изучение массовых, случайных явлений в условной неопределенности. Достоверность выводов зависит от числа объектов исследования. На основе анализов и прогнозов вырабатывается оптимальное решение.
Статистика подразделяется на:
- теоретическую (вырабатывает методы)
прикладную (общая, отраслевая (экономическая статистика, метеорологическая, медицинская))
Медицинская статистика:
- ст. рождаемости
- ст. заболеваемости
- ст. смертности
- ст. медицинских учреждений
Биологическая статистика (=биометрия) – включает статистические методы, используемые в различных биологических исследованиях (в цитологии, микробиологии).
Статистика:
- описательная (комплекс методов сбора, группировки данных и представления их в виде таблиц, графиков…)
- аналитическая (делает заключения, выводы с целью практического применения)
2. Основные понятия описательной статистики. Их характеристика
- Генеральная совокупность – подлежащая изучению совокупность однородных элементов, которая характеризуется некото
рым признаком. Например, нас интересует распространенность данного заболевания в определе нном регионе, тогда генеральная совокупность , это все население региона. Если необходимо выразить мужчин и женщин отдельно по этому заболеванию, то получаем 2 генеральные совокупности.
Количество объектов, входящих в генеральную совокупность называется объемом генеральной совокупности (N)
Генеральная совокупность можно изучать по некоторой ее части.
- Выборочная совокупность - часть генеральной совокупности
, выбираемая для статистической обработки (выборка) ( объем выборки -n). Свойства объектов выборки должны соответствовать свойствам генеральной совокупности.
Результаты исследования некоторого признака генеральной совокупности, будут более надежны, если выборку образовывать случайным образом. Элементы выборки берутся наугад. Каждый объект может попасть в выборку с одинаковой вероятностью. Главным вопросом является: как определить объем выборки, необходимой для получения необходимого результата.
- Варианта – значение признака для каждого элемента выборки (х)
Признаки могут быть
качественными и
Количественные делятся на непрерывные (масса тела) и дискретные (количество волос)
Признак, имеющий значение
от одного объекта к другому называется
варьирующимся. Если количественный признак
лежит в интервале –
- Частота – количество объектов с конкретным числовым значением признака
xi 35 36 37 38 39 40 41
ni (pi): 2 4 5 6 7 7 2
- Частность или относительная частота – до
ля варианта с данным значением признака (ni/n)
3. Ряды распределения и способы их представления.
Ряд распределения – это последовательность качественых-количественных значений признака и частоты его встречаемости.
Ряд, составленного на
основе качественного признака –
атрибутивных
Рассмотрим подробнее распределение количественного признака. Значение признака, записанное для всех элементов выборки в том порядке, в каком они были получены образуют простой (упорядоченный) статистический ряд.
1 2 3 4 5 6
170 165 171 165 163 174
Из данных видно: некоторые значения вариант повторяются. Для сокращения записи данные располагаются в упорядоченном виде с указанием частот. Такой ряд называется упорядоченным (=ранжированным).
ni 1 2 1 1 1 1
xi 163 165 160 171 174
Вариационные ряды могут быть непрерывными и дискретными
Способы представления рядов:
- Табличный (см. выше)
- Аналитический (с помощью формул)
- Графический (строится на основании табличных данных)
Способы графического представления:
А) диаграмма в отрезках – совокупность вертикальных прямых /отрезков. Способ удобен для представления дискретных признаков при небольшом объеме совокупности.
Б) гистограмма – совокупность прилегающих друг к другу прямоугольников. Способ используется для изображения. для интервального ряда. На оси Х откладываются интервалы значения варианта. На каждом из них (на основании) строят прямоугольник. Его высота зависит от частоты встречаемости данной величины.
В) полигон частот – ломаная линия, соединяющая точки, являющиеся серединами интервалов.
Г) Вариационные кривые в зависимости от значения распределения.
ni
Прямоугольное распределение объема совокупности
ni
Колоколообразное (= унимодальное)
ni
Бимодальное
ni
Экспоненциальное
4. Основные меры положения и рассеяния.
Меры положения частного распределения, их характеристика.
На практике ряды распределения описываются различными числовыми характеристиками (мерами).
- Мода (Мо) – это варианта, наиболее часто встречающаяся в совокупности (= модальное значение).
2
Медиана (Ме) – это величина, делящая
ранжированный ряд на 2 равные
части. Так же она делит
N/2 – Для четных, (N+1)/2 – Для нечетного количества объектов
3 Средняя арифметическая простая – это частное деление суммы всех
значений признака на их общее число объектов
X=(X1+X2+X3…+Xn)/N
Сумма всех <+> и <–> отклонений от х равно «0».
Среднюю арифметическую
простую вычисляют для
4 Средняя взвешенная
Если в совокупности отдельные варианты встречаются неоднократно, то вычисляется средняя взвешенная – это величина, полученная суммированием произведений числовых значений вариант на их частоты с последующим делением суммы на количество всех вариант.
=(х1n1+x2n2+x(n)n(n))/N x1n1+y2n2
5 Средняя квадратическая используется, если признаки выражаются мерами площади. Пример: размер колонии микробов, листовых пластинок.
6 Средняя гармоническая, кубическая, геометрическая
Меры рассеяния частного распределения.
Разброс числовых значений вариант (генеральной, выборочной совокупности) относительно средних значений характеризуется мерами рассеяния.
- Лимит – минимальная и максимальная варианта совокупности. (Xmin, Xmax)
- Вариационный размах – разность между максимальным и минимальным значением R=Xmax-Xmin
- Индивидуальное отклонение – разность между числовым значением варианты и средним арифметическим всей совокупности Di=Xi-
- Дисперсия – мера рассеяния, полученная суммированием квадратов индивидуальных отклонений и последующим делением суммы на объем совокупности.
- для генеральной
- для выборочной совокупности
Если число объектов менее 30, то рассчитывается исправленная дисперсия (Сигма с крышей)
Где N-1 – число степеней свободы. Это число на 1 меньше, чем весь объем свободности
- Стандартное (среднее квадратичное) отклонение. Эта мера рассеяния, равная корню квадрата дисперсии, S=корень квадратный из . Чем сильнее варьирует признак, тем больше величина среднего квадратного отклонения.
6. Коэффициент вариации - мера рассеяния равна, отношению стандартного отклонения к средней арифметической V=(S/X)100%
При нормальном распределении коэффициент вариации не > 50%, а часто гораздо ниже (приблизительно 20%)
5. Выборочный метод. Выборки, их виды и требования к ним.
Для того, чтобы получить исчерпывающую информацию о состоянии генеральной совокупности нужно учесть весь ее состав без исключения. Но не всегда есть возможность или необходимость прибегать к сплошному исследованию. В целях экономии времени и средств, анализу подвергается часть совокупности выборки, по ней судят о состоянии всей совокупности в целом.
Если число объектов менее 30, то выборка называется малой. В зависимости от способов формирования, выборки бывают повторные – с возвратом, неповторные – без возврата
Требования к выборкам
А) Рендомизация - каждая варианта генеральной совокупности имеет одинаковую вероятность для попадания в выборку.
Репрезентативность –
состав и структура выборки должны
соответствовать составу и
Генеральная совокупность |
Выборочная | |
Объем |
N |
n |
Среднее значение |
M |
|
Дисперсия |
S в квадрате | |
Стандартное отклонение |
S |
Ошибки репрезентативности, их особенности.
Возникающие отклонения выборочных показателей от параметров генеральной совокупности называются – ошибками репрезентативности. Параметрами называются характеристики, относящиеся к генеральной совокупности. Характеристики, относящиеся к выборке называются оценками параметров. Ошибки репрезентативности бывают случайными и систематическими, устранимыми и неустранимыим. Устранимая ошибка предотвращается правильной организацией исследования и четким ведение протокола.
Неустранимые ошибки заложены в природе статистических методов. Фактически они являются ошибками репрезентативности. Это своеобразные показатели вариаций выборочных характеристик по отношению к таким же характеристикам генеральной совокупности. Величина ошибки зависит от объема выборки, степени вариации признаков, способа отбора вариант. При увеличении числа вариантов выборки ошибки– 0.
Ошибка (Мх)
Мх=(S)/ корень квадратный из n
Mx=(S)/ корень квадратный из 2n
Mx=(V)/ корень квадратный из 2n
V-коэффициент вариации
Показатель точности оценки параметров.
Чтобы получить определенное представление о точности, с которой определяется тот или иной средний результат, принято использовать показатели точности.
C=( x/ )100%; Если известно значение коэффициента вариации, то используется C=V/корень квадратный из n
Точность достаточная, если С = 3-5%
6. Нормальное распределение, его виды, формулы, графики, особенности.
Для того, чтобы оценить закон распределения переменной случайной величины, нужно найти функциональную зависимость между числовыми значениями, которые она может принимать и вероятностью этих значений. В пределах заданного интервала непрерываемая случайная величина может принимать любые числовые значения. Речь идет о значениях, которые она может принимать с определенной вероятностью.
Виды нормального распределения
А) Эмпирическое – получается опытным путем на основе статистического исследования. В этом случае объем совокупности всегда конечен
Б) Теоретическое – абстрактная математическая модель. Ее используют для сравения и оценки опытных распределений по разным статистическим критериям.
В) Стандартное – оно используется в качестве стандарта при оценке любых данных.
Г) Общее – нормальное
распределение – оно