Критерий Пирсона (χ2 критерий), распределение Пирсона.
Общеизвестная задача статистического анализа заключается в сравнении выборочного распределения с некоторым заранее заданным стандартным распределением и определение, к какому типу принадлежит наше экспериментальное распределение. Одно из таких решений было предложено Пирсоном. Он предложил рассмотреть некоторое теоретическое распределение тесно связанное с нормальным распределением. Если выборка объема n взята из известной совокупности, имеющей нормальное распределение, то ее среднее значение равно μ, а стандартное отклонение равно σ. Каждое наблюдение в выборке можно преобразовать по формуле –
Z=(xi – μ)/ σ.
После стандартизации все величины Zi будут иметь нормальное распределение с математическим ожиданием равным 0 и стандартным отклонением равным 1. Если все значения Zi возвести в квадрат и сложить, то мы получим новую статистику –
∑Zi2 = ∑[(xi – μ)/ σ]2.
Эта новая статистика - ∑Zi2 строится по выборочным данным и соответственно изменяется от выборки к выборке. Если взять всевозможные выборки объема n из нормальной совокупности рассчитать статистику ∑Zi2 и нанести соответствующие значения на график, то эти значения будут подчиняться некоторому распределению. Характер кривых этого распределения тесно связан с объемом выборки - n или точнее с числом степеней свободы и определяется только им.
Это распределение имеет очень большое значение на практике, так как оно используется для проверки гипотезы о нормальном распределении данных, измеренных в разных шкалах измерения.
Указанный статистический критерий χ2 вычисляется из сравнения распределения ∑Zi2 с нормальным распределением по формуле -
χ2 = ∑[(O –U)2/U]
где O – наблюдаемые частоты исследуемого распределения по интервалам, U – ожидаемые частоты теоретического нормального распределения по тем же интервалам.
Значения χ2 рассчитаны для различных степеней свободы и опубликованы. Практически статистический критерий вычисляется следующим образом. Область наблюдаемых значений разбивается на некоторое количество интервалов, таким образом, что бы им соответствовали равные площади под кривой распределения. Затем если наши данные стандартизированы, то подсчитывается число проб, попадающих в намеченные интервалы, находится по формуле разность между ними и теоретическими частотами, значения суммируются. Теоретические частоты берутся из таблицы нормального распределения, в тех же границах интервалов, на которые мы разбивали наше выборочное распределение. Если сумма превышает критическое значение, то нулевая гипотеза отклоняется и делается вывод, что наше распределение не согласуется с нормальным распределением. В процедуре сравнения число степеней свободы определяется как количество интервалов, на которые разбивалось изучаемое распределение минус 3. В данном случае мы теряем две степени свободы, потому что не знаем истинных параметров исследуемой совокупности μ и σ и третью степень свободы теряем потому что сумма частот по интервалам изучаемого распределения не равна 1.
Одной из самых распространенных задач в геологии является изучение равномерности распределения точек наблюдения на некоторой территории. Достоверность геологических карт находится в прямой зависимости от плотности и равномерности расположения точек наблюдения. Сеть точек наблюдения может быть регулярной, если точки наблюдения располагаются по какой-либо сети, и не регулярной. Для большинства случаев пункты отбора проб располагаются так, что трудно сказать к какому типу сети они относятся. Для решения этой задачи хорошо подходит критерий χ2 . Всю карту можно разделить на определенное количество подобластей, так чтобы каждая подобласть содержала некоторое количество точек наблюдения. Если точки наблюдения на карте расположены равномерно, то следует ожидать, что каждая подобласть будет содержать равное количество этих точек. Использование критерия Пирсона будет наиболее эффективно, если число подобластей сделать большим (это приведет к увеличению числа степеней свободы), при условии, что все подобласти содержат не менее 5 точек наблюдения. В данном случае количество точек наблюдения ожидаемое для каждого квадрата равно –
E = (общее число точек наблюдения)/число квадратов.
Тогда критерий будет рассчитывать по той же формуле –
χ2 = ∑[(O –U)2/U]
только O – наблюдаемое число точек в квадрате, Е – ожидаемое число точек (среднее). Сравниваемое число критерия находится для числа степеней свободы n -2 (n –количество квадратов).
Дата добавления: 2019-04-03; просмотров: 715;