Проверка выборок на наличие резко выделяющихся, инородных значений

Проверку проведем с помощью стандартного алгоритма проверки статистических гипотез, описанного в п.2.2, и критериев, приведенных в табл. 2.1:

а) для старой технологии

Из табл. 3.2 видно, что наибольшее абсолютное отклонение от выборочного среднего арифметического для старой технологии мм имеет второе значение диаметра х2=5.30 мм: мм. Именно это значение следует проверить в первую очередь на принадлежность генеральной совокупности диаметров катанки, получаемых по старой технологии Хс:

1) Н0: х2=5.30ÎХс – гипотеза о принадлежности значения х2 генеральной совокупности Хс эквивалентна гипотезе о том, что значение х2 не является резко выделяющимся;

2) Н1: х2=5.30ÏХ – гипотеза о том, что значение х2 является инородным;

3) поскольку для старой технологии известно генеральное среднеквадратическое отклонение диаметра катанки (s=0.18 мм), то в качестве статистического критерия следует использовать t-критерий (см. табл. 2.1);

4) t-статистика: ;

5) из табл. П.7 для уровня значимости a=0.05 и числа опытных данных N=10 находим границу критической области ta,N=t0.05,10=2.44.

Для установления местоположения критической области относительно границы (слева или справа) используем метод пробной точки. Подберем такое пробное значение диаметра катанки хпр , про которое со 100 %-ной уверенностью можно сказать, что оно не является инородным, т. е. что со 100%-ной вероятностью справедлива нулевая гипотеза. В качестве такового значения можно использовать, например, среднее арифметическое хпр= . Если подставить вместо хi в формулу для расчета t-статистики, то получим, что t=0. Поскольку значение t=0 располагается на числовой оси значений t слева от границы критической области ta,N, то и область принятия нулевой гипотезы также располагается слева от границы, а критическая область – справа.

6) поскольку t=2.667>ta,N=2.44, то t-статистика попала в критическую область. Это дает основания отвергнуть нулевую гипотезу и принять альтернативную, говорящую о том, что проверяемое значение х2=5.30 является резко выделяющимся. Значение х2 следует отбросить и при дальнейших рассуждениях не учитывать;

б) для новой технологии

Из табл. 3.2 следует, что проверить на принадлежность генеральной совокупности Хн в первую очередь следует пятое значение х5=5.01 мм. Оно имеет наибольшее абсолютное отклонение от выборочного среднего мм:

1) Н0: х5=5.01ÎХн;

2) Н1: х5=5.01ÏХн;

3) поскольку для новой технологии генеральное среднеквадратическое отклонение не известно, то для проверки следует использовать критерий Н.В. Смирнова (см. табл. 2.1);

4) u-статистика: ;

5) из табл. П.7 для уровня значимости a=0.05 и числа опытных данных N=10 находим ua,N=u0.05,10=2.18. Местоположение критической области определяется аналогично тому, как это сделано в п. а). Критическая область также располагается справа от границы;

6) поскольку u=2.42>ua,N=2.18, то u-статистика попала в критическую область. Это говорит о том, что значение 5.01 является резко выделяющимся, его не следует учитывать при дальнейших расчетах.

 

Выявленные резко выделяющиеся значения (которые могут быть ошибками измерений, ошибками записи, следствием нарушения технологии прокатки и т.п.) следует отбросить из массивов опытных данных и рассчитать новые точечные оценки числовых параметров распределения, как это сделано в п. 3.1. Расчет опущен, его результаты приведены в табл. 3.4.

 

Таблица 3.4

Точечные оценки распределения диаметра катанки

после исключения резко выделяющихся значений

Технология Среднее арифметическое, мм Выборочная дисперсия, мм2 Среднеквадратическое отклонение, мм
Старая 5,83 0,0428 0,21
Новая 5,53 0,0108 0,10

 

Для урезанных (цензурированных) выборок вновь следует выявить подозрительные значения и проверить их на принадлежность генеральной совокупности, как это проделано выше. Результаты такого расчета приведены в табл. 3.5.

Таблица 3.5

Результаты расчетов при проверке выборок на наличие

резко выделяющихся значений (второй расчет)

Старая технология (первый массив) Новая технология (второй массив)
Проверяемое значение t-стати- cтика ta,N Проверяемое значение u-стати- стика ua,N
Номер Величина   Номер Величина  
5.46 2.08 2.39 5.74 2.06 2.11

 

Из табл. 3.5 видно, что условия t£ta,N и u£ua,N выполняются. Это говорит о попадании статистики в область принятия нулевой гипотезы, что в свою очередь подтверждает принадлежность рассматриваемых значений соответствующим генеральным совокупностям диаметров.

 

Вывод: Исходные массивы данных содержали по одному резко выделяющемуся значению (2-е значение для старой технологии и 5-е значение для новой технологии), которые отброшены и в дальнейших расчетах учитываться не будут.








Дата добавления: 2015-10-13; просмотров: 1413;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.008 сек.