ГИСТОГРАММА

 

При большом объеме выборки (понятие «большой объем» зависит от целей и методов обработки, в данном случае будем считать n большим, если n>40) в целях удобства обработки и хранения сведений прибегают к группированию ЭД в интервалы. Количество интервалов следует выбрать так, чтобы в необходимой мере отразилось разнообразие значений параметра в совокупности и в то же время закономерность распределения не искажалась случайными колебаниями частот по отдельным разрядам. Существуют нестрогие рекомендации по выбору количества M и размера h таких интервалов, в частности параметр M рекомендуется выбирать с помощью следующих соотношений:

где int(x) - целая часть числа x . Желательно, чтобы n без остатка делилось на M.

Графически статистический ряд отображают в виде гистограммы, полигона и ступенчатой линии. Часто гистограмму представляют как фигуру, состоящую из прямоугольников, основаниями которых служат интервалы длиною h, а высоты равны υi/(nh). Такую гистограмму можно интерпретировать как графическое представление эмпирической функции плотности распределения fn(x), в ней суммарная площадь всех прямоугольников составит единицу. Гистограмма помогает подобрать вид теоретической функции распределения для аппроксимации ЭД.

Полигоном называют ломаную линию, отрезки которой соединяют точки с координатами по оси абсцисс, равными серединам интервалов, а по оси ординат – соответствующим частостям.

Порядок построения гисто­граммы следующий.

1. Построить вариационный ряд, т.е. расположить выборочные значения в порядке возрастания: .

2. Вся область возможных значений разбивается на M непересе­кающихся и примыкающих друг к другу интервалов.

Ai, Bi- соответственно левая и правая границы i-го интервала (Ai+1= Bi);

hi= Bi- Ai- длина i-го интервала;

i- количество чисел в выборке, попадающих в i-тый интервал.

При использовании равноинтервального метода построения гистограммы параметры Ai, Bi, hiвычисляются следующим образом:

Если при подсчете значений какое-то число в выборке точно совпадает с границей между интервалами, то необходимо в счетчик обоих интервалов прибавить по 0,5.

В случае применения равновероятностного метода границы Ai, Biвыбираются таким образом, чтобы в каждый интервал попадало одинаковое количество выборочных значений:

i= = n / M.

В этом случае

3. Вычисляется средняя плотность вероятности для каждого интервала по формуле

4. На графике провести две оси: x и f*(x) .

5. На оси x отмечаются границы всех интервалов.

6. На каждом интервале строится прямоугольник с основанием hiи высотой Полученная при этом ступенчатая линия называется гистограммой, график которой приблизительно выглядит так, как показано на рис. 2.2.

Замечания.

1. Суммарная площадь всех прямоугольников равна единице.

2. В равновероятностной гистограмме площади всех прямоугольников оди­на­ковы. По виду гистограммы можно судить о законе распределения случай­ной величины.

Достоинства использования гистограммы: простота применения, наглядность.

 

Пример 2.2. Вариационный ряд случайной величины x имеет вид:
-6,237 -6,229 -5,779 -5,139 -4,950 -4,919 -4,636 -4,560 -4,530 -4,526 -4,523 -4,511 -4,409 -4,336 -4,259 -4,055 -4,044 -4,006 -3,972 -3,944 -3,829 -3,794 -3,716 -3,542 -3,541 -3,431 -3,406 -3,384 -3,307 -3,181 -3,148 -3,124 -3,116 -2,892 -2,785 -2,734 -2,711 -2,637 -2,633 -2,428 -2,381 -2,339 -2,276 -2,222 -2,167 -2,111 -2,034 -1,958 -1,854 -1,803 -1,774 -1,755 -1,745 -1,713 -1,709 -1,566 -1,548 -1,480 -1,448 -1,353 -1,266 -1,229 -1,179 -1,130 -1,102 -1,060 -1,046 -1,035 -0,969 -0,960 -0,903 -0,885 -0,866 -0,865 -0,774 -0,721 -0,688 -0,673 -0,662 -0,626 -0,543 -0,445 -0,241 -0,174 -0,131 0,115 0,205 0,355 0,577 0,591 0,795 0,986 1,068 1,099 1,195 1,540 2,008 2,160 2,534 2,848

Построить гистограмму равноинтервальным и равновероятностным методами.

Решение. Объем выборки равен 100. Количество интервалов определяем так:

Для равноинтервального метода построения параметры Ai, Bi, i, hi, f* приведены в табл. 2.1.

Таблица 2.1.

i Ai Bi i hi
-6,237 -5,3345 0,9085 0,033
-5,3345 -4,426 0,9085 0,099
-4,426 -3,5175 0,9085 0,143
-3,5175 -2,609 0,9085 0,154
-2,609 -1,7005 0,9085 0,176
1,7005 -0,792 0.9085 0,209
-0,792 0,1165 0,9085 0,132
0,1165 1,025 0,9085 0,066
1,025 1,9335 0,9085 0.044
1,9335 2,848 0,9085 0,044

 

Ниже приведены интервальная таблица и график гистограммы для равновероятностного метода.

Таблица 2.2

i Ai Bi i hi
-6,2370 -4,5245 1,7125 0.0584
-4,5245 -3,8865 0,6380 0,1567
-3,8865 -3,1645 0,7220 0,1385
-3,1645 -2,4045 0,7600 0,1316
-2,4045 -1,7885 0,6160 0,1623
-1,7885 -1,3095 0,4790 0,2086
-1,3085 -0,9319 0,3766 0,2655
-0,9319 -0,5843 0,3476 0,2877
-0,5843 0,6932 1,2775 0,0783
0,6932 2,8480 2,1548 0,0464

 

 

Рис. 2.4

 

Рассмотренные представления ЭД являются исходными для последующей обработки и вычисления различных параметров.

 








Дата добавления: 2015-05-05; просмотров: 2668;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.007 сек.