Статистическое распределение выборки
Пусть изучается некоторая случайная величина . С этой целью над случайной величиной производится ряд независимых опытов (наблюдений). В каждом из этих опытов величина принимает то или иное значение.
Пусть она приняла раз значение , раз – значение , … , раз - значение . При этом - объем выборки. Значения , , … , называются вариантами случайной величины , а изменение этих значений варьированием.
Расположение выборочных наблюдаемых значений случайной величины (признака) в порядке неубывания называется ранжированием статистических данных.
Полученная таким образом последовательность , , … , значений случайной величины (где … £ и , … , ) называется вариационным рядом.
Числа , показывающие сколько раз встречаются варианты в ряде наблюдений, называются частотами, а отношение их к объему выборки – частостями или относительными частостями (обозначают или ), то есть
, где .
Перечень вариантов и соответствующих им частот или частостей называется статистическим распределением ряда или статистическим рядом.
Различают дискретные и непрерывные статистические ряды.
Дискретным статистическим рядом называется ранжированная совокупность вариант с соответствующими им частотами. Записывается дискретный ряд в виде таблицы. Первая строка содержит варианты, а вторая их частоты или частости.
Пример 2. В результате тестирования (см. пример 1) группа абитуриентов набрала баллы: 5, 3, 0, 1, 4, 2, 5, 4, 1, 5. Записать полученную выборку в виде статистического ряда.
Решение.
Случайная величина - число набранных баллов является дискретной случайной величиной.
Вначале составим ранжированный вариационный ряд , , … , , то есть расположим числа (баллы) в порядке неубывания их величин:
0, 1, 1, 2, 3, 4, 4, 5, 5, 5.
Подсчитав частоту и частость вариантов , , , , , получим статистическое распределение выборки (так называемый дискретный статистический ряд):
или
. | |||||||
В случае, когда число значений признака (случайной величины ) велико или признак является непрерывным (то есть когда случайная величина может принять любое значение в некотором интервале), составляют интервальный статистический ряд. В первую строку таблицы статистического распределения вписывают частичные промежутки , , … , , которые берут обычно одинаковыми по длине. Для определения величины интервала можно использовать формулу Стерджесса:
,
где - размах признака, то есть разность между наибольшим и наименьшим значениями признака, - число интервалов. За начало первого интервала рекомендуется брать величину . Во второй строчке статистического ряда вписывают количество наблюдений , попавших в каждый интервал.
Пример 3. Измерили рост (с точностью до 1 см) 30 наудачу отобранных студентов. Результаты измерений таковы:
178, 160, 154, 183, 155, 153, 167, 186, 163, 155, 157, 175, 170, 160, 159,
173, 182, 167, 171, 169, 179, 165, 156, 179, 158, 171, 175, 173, 164, 172.
Построить интервальный статистический ряд.
Решение.
Для удобства проранжируем полученные данные:
153, 154, 155, 155, 156, 157, 158, 159, 160, 163, 164, 165, 166, 167, 167,
169, 170, 171, 171, 172, 173, 173, 175, 175, 178, 179, 179, 182, 183, 186.
Очевидно, что рост студентов – непрерывная случайная величина. Для полученной выборки: , . По формуле Стерджесса, при , находим длину частичного интервала:
.
Примем . Тогда .
Число интервалов: .
Исходные данные разбиваем на 6 интервалов: , , , , , .
Подсчитав число студентов ( ), попавших в каждый из полученных промежутков получим интервальный статистический ряд:
150-156 | 156-162 | 162-168 | 168-174 | 174-180 | 180-186 | |
Частота | ||||||
Частость | 0,13 | 0,17 | 0,20 | 0,23 | 0,17 | 0,10 |
Дата добавления: 2016-04-22; просмотров: 3784;