Выборка, закон распределения выборки

При изучении качественного и количественного признака, характеризующего множество некоторых однородных элементов, не всегда имеется возможность исследовать каждый из них. Поэтому в целях получения информации об этом множестве исследуют только некоторую небольшую часть ее элементов, отобранных совершенно случайно. Практика подтверждает, что выводы, сделанные в результате анализа этой части элементов, бывают достаточно объективными и для всего изучаемого множества.

Множество всех элементов, подлежащих изучению, называют генеральной совокупностью. В отличие от нее выборка – конечная совокупность элементов, отбираемых из генеральной совокупности, для статистического вывода о свойствах генеральной совокупности на основании свойств отобранных элементов.

Любое статистическое исследование всегда связано с производством выборки. Выборка должна быть представительной, т.е. такой, чтобы любой элемент генеральной совокупности мог попасть в нее с вероятностью, не зависящей от характеристик подлежащих измерению.

Число элементов генеральной совокупности (выборки) называют ее объемом.

Пример 1.Из партии, содержащей 10000 деталей, отобрали случайным образом для проверки 80 деталей.

Объем генеральной совокупности в данном примере равен 10000, а объем выборки – 80.

Очевидно, что чем больше объем выборки, тем более полное представление можно получить о генеральной совокупности.

Исследование выборки сводится к отысканию ее статистик (функций выборки), к которым относят: вариационный ряд, статистическое распределение выборки, эмпирическую функцию распределения, гистограмму, среднее арифметическое результатов наблюдений и т. п.Статистики, используемые для приближенной оценки параметров генеральной совокупности, называют также статистическими оценками.

Статистическое распределение выборки отражает соответствие между наблюдаемыми значениями и их частотами или относительными частотами.

Пусть из генеральной совокупности извлечена выборка объема n, причем наблюдалось раз, раз, …, , где .

Наблюдаемые значения называют вариантами, последовательность же вариантов, расположенных в возрастающем порядке, - вариационным рядом.

Число , показывающее, сколько раз встречается вариант в выборке, называют частотой варианта.

Отношение частоты варианта к объему выборки n называют относительной частотой: .

С учетом этих определений под статистическим распределением выборки понимают перечень вариант и соответствующих им частот или относительных частот .

Пример 2Задано статистическое распределениечастот (Таблица 5.1):

Таблица 5.1

 

Объем выборки n=10. Находим относительные частоты:

и составляем статистическое распределение относительных частот (таблица 5.2):

Таблица 5.2

0.1 0.3 0.6

 

В целях наглядности соответствия между наблюдаемыми вариантами и частотами или относительными частотами распределение выборки изображают графически.

Для этого точки последовательно соединяют отрезками прямой. Получающаяся при этом ломаная линия называется полигоном частот; если же последовательно соединить отрезками прямой точки , то – полигоном относительных частот.

Эмпирическую функцию распределения также как статистическое распределение выборки и полигон применяют для изображения дискретного вариационного ряда. Эмпирической функцией распределения называют отношение числа вариант, значения которых меньше некоторого фиксированного значения варианта, к объему выборки, т.е.

,

где - число вариант, значения которых меньше некоторого фиксированного значения варианта.

Пусть произведено n независимых опытов и по данным выборки сформирован вариационный ряд . Для построения графика эмпирической функции распределения определяют ее значения в точках следующим образом. .

Рис.5.1 – График эмпирической функции распределения

График эмпирической функции распределения (рис.5.1) является случайным. Для уменьшения случайности функции график сглаживают. По этому графику приближенно определяют вид истинной функции распределения случайной величины.

Гистограмма частот или относительных частот. Если выборочные данные относятся к непрерывной случайной величине, то интервал, в котором заключены все наблюдаемые значения, разбивают на частичные интервалы длиной h и находят для каждого частичного интервала сумму частот вариант , попавших в i – й интервал.

Затем строят ступенчатую фигуру, состоящую из прямоугольников, основаниями которых являются частичные интервалы длиной и высотой, равной отношению или .

Отношение называют плотностью частоты, а отношение называют плотностью относительной частоты, поэтому и, построенная таким образом, ступенчатая фигура носит название гистограммы частот или гистограммы относительных частот.

Для построения гистограммы частот или относительных частот (рис.5.2) по статистическому распределению выборки необходимо составить таблицу 5.3, в которой отобразить номера и положение частичных интервалов, суммы частот вариант, плотности частот и относительных частот в этих частичных интервалах.

Таблица 5.3

Номер частичного интервала Частичный интервал Сумма частот вариант Плотность частот Плотность относительных частот
1 – 5 2.5 0.025
5 – 9 0.05
9 – 13 12.5 0.125
13 – 17 0.03
17 – 21 0.02

 

Рисунок 5.2 – Гистограмма частот (а) и относительных частот (б)

Обе гистограммы (рис.5.2) по форме одинаковы и отличаются лишь масштабом по оси ординат. Площадь гистограммы относительных частот, как и площадь плотности распределения случайной величины, равна единице, что позволяет определять вероятность попадания случайной величины в заданный интервал путем вычисления площади части гистограммы, ограниченной этим интервалом.

 








Дата добавления: 2016-04-19; просмотров: 7537;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.007 сек.