Статистическое распределение выборки

Пусть изучается некоторая случайная величина . С этой целью над случайной величиной производится ряд независимых опытов (наблюдений). В каждом из этих опытов величина принимает то или иное значение.

Пусть она приняла раз значение , раз – значение , … , раз - значение . При этом - объем выборки. Значения , , … , называются вариантами случайной величины , а изменение этих значений варьированием.

Расположение выборочных наблюдаемых значений случайной величины (признака) в порядке неубывания называется ранжированием статистических данных.

Полученная таким образом последовательность , , … , значений случайной величины (где … £ и , … , ) называется вариационным рядом.

Числа , показывающие сколько раз встречаются варианты в ряде наблюдений, называются частотами, а отношение их к объему выборки – частостями или относительными частостями (обозначают или ), то есть

, где .

Перечень вариантов и соответствующих им частот или частостей называется статистическим распределением ряда или статистическим рядом.

Различают дискретные и непрерывные статистические ряды.

Дискретным статистическим рядом называется ранжированная совокупность вариант с соответствующими им частотами. Записывается дискретный ряд в виде таблицы. Первая строка содержит варианты, а вторая их частоты или частости.

Пример 2. В результате тестирования (см. пример 1) группа абитуриентов набрала баллы: 5, 3, 0, 1, 4, 2, 5, 4, 1, 5. Записать полученную выборку в виде статистического ряда.

Решение.

Случайная величина - число набранных баллов является дискретной случайной величиной.

Вначале составим ранжированный вариационный ряд , , … , , то есть расположим числа (баллы) в порядке неубывания их величин:

0, 1, 1, 2, 3, 4, 4, 5, 5, 5.

Подсчитав частоту и частость вариантов , , , , , получим статистическое распределение выборки (так называемый дискретный статистический ряд):

или

							.

В случае, когда число значений признака (случайной величины ) велико или признак является непрерывным (то есть когда случайная величина может принять любое значение в некотором интервале), составляют интервальный статистический ряд. В первую строку таблицы статистического распределения вписывают частичные промежутки , , … , , которые берут обычно одинаковыми по длине. Для определения величины интервала можно использовать формулу Стерджесса:

где - размах признака, то есть разность между наибольшим и наименьшим значениями признака, - число интервалов. За начало первого интервала рекомендуется брать величину . Во второй строчке статистического ряда вписывают количество наблюдений , попавших в каждый интервал.

Пример 3. Измерили рост (с точностью до 1 см) 30 наудачу отобранных студентов. Результаты измерений таковы:

178, 160, 154, 183, 155, 153, 167, 186, 163, 155, 157, 175, 170, 160, 159,

173, 182, 167, 171, 169, 179, 165, 156, 179, 158, 171, 175, 173, 164, 172.

Построить интервальный статистический ряд.

Решение.

Для удобства проранжируем полученные данные:

153, 154, 155, 155, 156, 157, 158, 159, 160, 163, 164, 165, 166, 167, 167,

169, 170, 171, 171, 172, 173, 173, 175, 175, 178, 179, 179, 182, 183, 186.

Очевидно, что рост студентов – непрерывная случайная величина. Для полученной выборки: , . По формуле Стерджесса, при , находим длину частичного интервала: