Гистограмма распределения

Одной из главных проблем при проведении многократных измерений одной и той же величины является представление результатов измерений. Один из удобных методов представления результатов - построение гистограмм распределений. Гистограмма распределения строится следующим образом. После того, как получена таблица измеренных значений, в качестве первого шага нужно переписать её в порядке возрастания значений измеренной величины, чтобы было удобно проанализировать полученные результаты наблюдений. Например, результаты 100 измерений, приведенные в табл. 4.1, после расположения в порядке возрастания представлены в табл. 4.4.

Таблица 4.4. Упорядоченные значения 100 первых результатов измерений из табл. 4.1.

После того, как составлена таблица упорядоченных в порядке возрастания значений результатов измерений , на следующем шаге строится эмпирическое распределение результатов измерений. Для этого результаты измерений должны быть сгруппированы.

Пусть имеется таблица значений n_min, ..., n_max. Положим С₁ равным наименьшему значению n_min и С_k - наибольшему n_max.

Разобьем отрезок [С₁ ,С_k] на k равных интервалов группировки (при ста измерениях можно взять k = 10 - 12). Длина каждого интервала группировки DL будет равна

. (4.28)

Для нашего примера возьмем k=10, тогда . Так как число интервалов разбиения произвольно, в качестве ширины интервала для удобства возьмем .

Обозначим начало каждого интервала , конец интервала (i=1,...,k). Подсчитаем число наблюдений (i=1,...,k) из набора значений (n₁ ,..., n_N), лежащих в каждом интервале [С_i, С_i+1):

. (4.29)

Определим относительные частоты наблюдений p_i

, . (4.30)

Для построения гистограммы составляют таблицу частоты наблюдений сгруппированных величин (табл. 4.5).

Для рассмотренного нами случая C₁=58, C_k₊₁=96.

Табл. 4.5. Относительные частоты наблюдений p_i сгруппированных величин n_i.
Интервал	Число наблюдений, f_i	Относительная частота наблюдений, p_i
[C₁, С₂) [С₂, С₃) … [С_k, С_k+1]	f₁ f₂ … f_k	p₁ p₂ … p_k

Итак, в первый интервал попало 3 значения измеренной величины: 58, 60, 60, во второй – 3 значения: 64, 65, 66, в третий – 11 значений. Таким образом относительная частота наблюдений в первом интервале равна 0,03, во втором – 0,03, в третьем – 0,11, и т.д.

Графическое изображение зависимости относительной частоты наблюдений p_i от соответствующего интервала группировки называется гистограммой выборки (рис. 4.6). Таким образом, эмпирическая функция плотности распределения определяется следующим выражением:

. (4.31)

Табл. 4.6. Относительные частоты наблюдений p_i величин n_i для измерений, приведенных в таблице 1.
Интервал	Интервал	Число наблюдений, f_i	Относительная частота наблюдений, p_i
[С₁, С₂)	[58,62 )		0,03
[С₂, С₃)	[62,66 )		0,03
[С₃, С₄)	[66,70 )		0,11
[С₄, С₅)	[70,74 )		0,16
[С₅, С₆)	[74,78 )		0,20
[С₆, С₇)	[78,82 )		0,15
[С₇, С₈)	[82,86 )		0,13
[С₈, С₉)	[86,90 )		0,10
[С₉, С₁₀)	[90,94 )		0,06
[С₁₀, С₁₁]	[94,98 )		0,03

Так как длина интервала при построении гистограмм выбирается одинаковой, то высота каждого столбца гистограммы оказывается пропорциональной частоте наблюдений (рис. 4.6). Ясно, что выбор величины интервала ∆L существенно влияет на общий вид гистограммы. Если длина интервала ∆L мала, то влияние случайных колебаний числа наблюдений в каждом интервале начинает преобладать, т. к. каждый интервал содержит при этом лишь небольшое число наблюдений, причем возможная дисперсия числа наблюдений в каждом интервале приблизительно равна этому числу. Но чем больше величина ∆L, тем более скрадываются характерные черты распределения. Поэтому оптимальное число интервалов k должно удовлетворять приближенным требованиям:

, (N - объем выборки).

После того, как гистограмма построена, необходимо рассчитать экспериментальные значения и .

Чтобы установить, является ли распределение случайной величины n нормальным, на график эмпирической функции плотности распределения накладывают вычисленную кривую нормального распределения с параметрами и .

На рис. 4.6 гистограмма распределения активности радиоактивного источника, сравнивается с распределением Гаусса с параметрами и , приведенными в таблице 4.6.

Выше мы изложили формальную схему построения таблицы данных для определения частоты наблюдения f_i величины n. Однако может случиться так, что при измерении величин n_i одно из значений окажется сильно отличающимся (на несколько ) от среднего значения. В этом случае при определении интервала разбиения согласно соотношению (4.28) необходимо в качестве верхней C_k₊₁ или нижней C_k границы интервала выбрать результат измерения, отличающийся на одно измерение.

Таким образом, при построении гистограммы распределений, при выборе числа интервалов группировки и границ интервалов группировки, необходимо руководствоваться «здравым смыслом».

В том случае, когда строится гистограмма распределения Пуассона для малых значений , необходимо просто сосчитать число измерений с n=0, n=1,…и так далее до n=n_max, и далее рассчитать относительные частоты, пользуясь соотношением (34.0).

<14 15 161718 19 20 >

Дата добавления: 2015-05-16; просмотров: 2220;