ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВЫБОРКИ. СТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ

 

Выборкой объёма n из генеральной совокупности называется последовательность x1, x2, …, xn наблюдаемых значений случайной величины X, соответствующих n независимым повторениям эксперимента. Вариационным рядом выборки x1, x2, …, xn называется способ её записи, при котором элементы упорядочиваются по величичине, т.е. x(1), x(2), …, x(n), где x(1) x(2) x(n). Разность между максимальным и минимальным элементами выборки x(n)-x(1)=w называется размахом выборки. Если в выборке объёма n элемент xi встречается ni раз, то число ni называется частотой элемента xi, причём . Статистическим рядом выборки называется последовательность пар (xi, ni). Статистический ряд записывается в виде таблицы, первая строка которой содержит элементы xi, а вторая – частоты ni.

При большом объёме выборки её элементы объединяют в группы, представляя в виде группированного статистического ряда. Для этого интервал, содержащий все элементы выборки, разбивается на k частично непересекающиеся интервалов. Обычно частичные интервалы имеют одинаковую длину . После того, как частичные интервалы выбраны, определяются частоты ni* – количество элементов выборки, попавших в i-тый интервал. Элемент, совпадающий с верхней границей интервала, относят к следующему интервалу. Получающийся статистический ряд в верхней строке содержит середины интервалов группировки xi*, а в нижней – частоты ni*.

Обычно наряду с частотами ni* подсчитывают накопленные частоты , относительные частоты и накопленные относительные частоты . Полученные результаты сводят в таблицу, называемую таблицей частот группированной выборки.

Следует помнить, что группировка выборки вносит погрешность в дальнейшие вычисления, которая растёт с уменьшением числа интервалов.

Полигоном частот группированной выборки называется ломаная с вершинами в точках (xi*, ni*). Полигоном накопленных частот группированной выборки называется ломаная с вершинами в точках ( ). Полигоном относительных накопленных частот, или кумулятивной кривой, называется ломаная с вершинами в точках ( ).

Гистограммой частот группированной выборки называется ступенчатая фигура, составленная из прямоугольников, построенных на интервалах группировки так, что площадь каждого прямоугольника равна частоте ni* попадания в этот интервал. Отсюда следует, что площадь гистограммы частот равна объёму выборки n. Если длины всех интервалов группировки одинаковы, то высоты прямоугольников считаются по формуле . Аналогично строится гистограмма относительных частот группированной выборки. Высоты прямоугольников в этом случае равны , а площадь равна единице.

Перечисленные выше графические представления выборки аналогично определяются и в случае негруппированной выборки.

Эмпирическая функция распределения F*(x) определяется по значениям накопленных относительных частот соотношением . Очевидно, что F*(x) = 0 при x x(1) и F*(x) = 1 при x > x(n). На промежутке (x(1), x(n)] F*(x) есть неубывающая кусочно-постоянная функция со скачками в точках x(i).

Аналогично строится F*(x) по группированной выборке. В этом случае F*(x) имеет скачки в точках, соответствующих серединам интервалов группировки.

Выборочным средним называется среднее арифметическое элементов выборки:

 

 

Если выборка задана статистическим рядом, то:

 

 

Для группированной выборки:

 

.

 

Рассеивание распределения относительно среднего определяется дисперсией, смещённая оценка которой может быть вычислена по формуле:

 

;

 

удобная формула для выборки, представленной статистическим рядом:

 

;

 

для группированной выборки:

 

.

 

Несмещунная оценка дисперсии S2 связана с формулой:

 

.

 

Иногда для упрощения вычислений выборочного среднего и дисперсии, данные группированной выборки преобразуют следующим образом:

 

 

где - значение середины интервала xi*, встречающиеся с наибольшей частотой. Теперь величина Ui принимает целочисленные значения, для нее считают среднее выборочное и оценку дисперсии. Среднее выборочное и дисперсия Sx2исходных данных связаны со средним и дисперсией Su2преобразованных данных следующими формулами:

 

;

.

 

Обратите внимание, что вычислительные формулы для выборочных (эмпирических) начальных и центральных моментов отличаются от известных из теории вероятностей соотношений только тем, что вероятность pi в последних заменяется на относительную частоту .

Пример 1. Предположим, что имеется партия деталей в 10000 штук. Из этих деталей 9000 годных, а 1000 представляют собой брак. В действительности число годных и негодных деталей неизвестно. Для того чтобы можно было судить хотя бы приблизительно об относительной доле брака, отбирают и контролируют сто деталей. В этом примере генеральной совокупностью является исходная партия деталей в 10 000 штук. Выборкой является множество деталей, изъятых из генеральной совокупности для контроля. Отметим, что описанная процедура назы­вается выборочным контролем качества продукции.

Пример 2. Из партии товара случайным образом выбраны 25 изделий. Их вес (в граммах) оказался следующим: 54; 51; 54; 47; 49; 47; 49; 54; 51; 48; 49; 54; 54; 47; 49; 48; 51; 51; 54; 53; 49; 49; 48; 49; 51. Составить вариационный ряд и статистический ряд, определить размах.

Решение. Вариационный ряд имеет вид: 47; 47; 47; 48; 48; 48; 49; 49; 49; 49; 49; 49; 49; 51; 51; 51; 51; 51; 53; 54; 54; 54; 54; 54; 54.

Размах: w = 54 – 47 = 7.

Статистический ряд представлен в табл. 1.

 

Таблица 1

xi
ni

 

Пример 3. Дано следующее время работы некоторого прибора до первого сбоя:

22, 18, 20, 22, 13, 14, 17, 18, 20, 19.

Представить выборку в виде вариационного и статистического ряда. Построить полигон частот, полигон накопленных частот, полигон относительных частот и эмпирическую функцию распределения. Вычислить: , S2.

Решение. Вариационным рядом для данной выборки является ряд:

 

13, 14, 17, 18, 18, 19, 20, 20, 22, 22;

 

статистический ряд представлен в табл. 2.

 

Таблица 2

xi
ni

 

Объём выборки равен 10, размах w = 22 – 19 = 9. Ниже представлены полигон частот (рис. 1), полигон относительных частот (рис. 2), полигон накопленных частот (рис. 3), полигон относительных накопленных частот (рис. 4), эмпирическая функция распределения (рис. 5).

 

Рис. 1. Полигон частот

 

Рис. 2. Полигон относительных частот

 

 

Рис. 3. Полигон накопленных частот

 

Рис. 4. Полигон относительных накопленных частот

 

Рис. 5. Эмпирическая функция распределения

 

Вычисляем теперь и S2:

 

 

 

Пример 4. Время, за которое пассажир прибывает в аэропорт до вылета, случайно, так как зависит от многих факторов. В табл. 3 приведены (в сгруппированном виде) результаты двухсот наблюдений, проведённых в некотором аэропорту. Здесь же приведены результаты вычислений соответствующих частот, относительных частот и накопленных частот.

Таблица 3

Границы интервалов Сере-дины xi* Час-тота ni* Накоп-ленная частота Относи-тельная частота Относит. накоп-ленная частота
[0 – 20) 0,085 0,085
[20 – 40) 0,15 0,235
[40 – 60) 0,135 0,37
[60 – 80) 0,215 0,585
[80 – 100) 0,17 0,755
[100 – 120) 0,145 0,9
[120 – 140) 0,045 0,945
[140 – 160) 0,04 0,985
[160 – 180) 0,015

 

Пример 5. Представить выборку 55 наблюдений в виде таблицы частот, используя 7 интервалов группировки.

Выборка: 17 19 23 18 21 15 16 13 20 18 15

20 14 20 16 14 20 19 15 19 16 19

15 22 21 12 10 21 18 14 14 17 16

13 19 18 20 24 16 20 19 17 18 18

21 17 19 17 13 17 11 18 19 19 17

Построить полигон и гистограмму частот, полигон относительных накопленных частот и эмпирическую функцию распределения.

Решение. Считаем размах: w = 24 – 10 = 14. Длинна интервала группировки . Результаты группировки сведены в таблицу частот группированной выборки (табл. 4). По результатам группировки строим полигон частот (рис. 6), гистограмму (рис.7), полигон относительных накопленных частот строится аналогично, эмпирическую функцию распределения (рис. 8).

 

Таблица 4

Рис. 6. Полигон частот

 

Рис. 7. Гистограмма частот

 

Рис. 8. Эмпирическая функция распределения

 

Пример 6. Вычислить среднее и дисперсию группированной выборки, представленный в табл. 5.

 

Таблица 5

Решение. Длинна интервала группировки b = 4, значение середины интервала, встречающееся с наибольшей частотой, . Таким образом, преобразование последовательности середин интервалов выполняется по формуле:

 

 

Вычисления удобно свести в таблицу (табл. 6),

 

Таблица 6

i xi* ui* ni* ni*ui ni*ui2 ni*(ui+1)2
-3 -3
-2 -6
-1 -15
- - -6

 

последний столбец которой служит для контроля вычислений при помощи тождества:

 

 

Подставляя в тождество данные последней строки получим: 58 + 2(–6) + 53 = 99, следовательно, вычисления выполнены верно. Находим:

 

 

Переходим обратно от u к x:

 

 

.

 

Пример 7. Измерения ёмкости затвор–сток у 20 полевых транзисторов дали следующие результаты:

 

1,9; 3,1; 1,3; 1,0; 3,2; 1,1; 2,9; 2,7; 2,7; 4,0; 1,7; 3,3; 0,9; 0,8; 3,1; 1,2; 2,6; 1,9; 2,3; 3,3.

 

Найти выборочное среднее , выборочную дисперсию и несмещенную дисперсию .

Решение. При большом объеме выборки рекомендуется сначала сгруппировать результаты наблюдений. Это вносит определенную погрешность в дальнейшие вычисления, но существенно их упрощает.

Размах выборки Wx . Разобьем на 8 интервалов, тогда длина каждого интервала будет равна bx Для вычисления искомых параметров распределения воспользуемся формулами:

 

 

 

(2)

 

где r – число интервалов, – количество элементов выборки, находящихся в i-м интервале, – середина этого интервала. Промежуточные результаты вьчислений для удобства сведем в таблицу и вычислим сначала и (см. последнюю строку табл. 7).

 

Таблица 7

Затем по формулам (1) – (3) получаем

 

 

 

Решите примеры 8,9,10 используя данные своего варианта. Исходные данные приведены в Приложении 1, табл. 1, 2, 3.

8. Ошибки измерения при 10 измерениях дальности до цели с помощью радиодальномера приведены в табл. 1. Записать выборку в виде вариационного и статистического ряда, определить ее размах, построить полигон частот и эмпирическую функцию распределения, найти выборочное среднее, несмещенную оценку дисперсии.

9.Частота сигнала собранного радиоэлектронного блока контролируется прибором, не имеющим систематической ошибки. Показатели прибора приведены в табл. 2. Сгруппировать выборку, построить полигон частот, гистограмму, эмпирическую функцию распределения, найти , и .

10. Регистрирующее устройство контроля каждый час фиксирует напряжение в сети. В табл. 3 приведены данные полученные после первичной обработки выборки. Построить гистограмму и найти , и .








Дата добавления: 2016-03-15; просмотров: 4111;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.044 сек.