Индуктивная статистика
Задача индуктивной статистики – оценить значимость тех различий, которые могут быть между двумя распределениями. Чтобы определить достоверность различий, следует выдвинуть гипотезу, которая потом проверяется статистическими методами (в статистике это перенос прошлой тенденции на будущий период).
Нулевая гипотеза (Н0) – это предположение, по которому различие между двумя распределениями недостовено.
Альтернативная гипотеза утверждает о выборках противоположное, т.е. достоверность различий между распределениями.
Если данных достаточно, если эти данные количественные, если они подчиняются нормальному распределению, то для проверки гипотез используют параметрические критерии.
Если же данных мало, если они порядковые или качественные, то для проверки гипотез используют непараметрические критерии.
Из параметрических критериев наиболее эффективен t-критерий Стьюдента (t- тест Стьюдента). Этот критерий позволяет сравнить среднее и стандартное отклонение для 2-х распределений.
Если эти показатели принадлежат независимым выборкам то используют формулу: t= , где
М1 – среднее 1-й выборки
М2 – среднее 2-й выборки
N1 – число данных в 1-м распределении
N2 - число данных во 2-м распределении
S1 – стандартное отклонение по 1-ой выборке.
S2 - стандартное отклонение по 2-ой выборке.
Для зависимых выборок используют формулу:
t=
Независимые выборки – это выборки, взятые из двух разных групп испытуемых (т.е. из контрольной и экспериментальной).
Зависимые выборки (сопряженные) – отражают результаты одной и той же группы испытуемых до и после воздействия на них (при «входе» в формирующий эксперимент и на «выходе» из формирующего эксперимента).
Существует уровень достоверности, равный:
р 0,05
р 0,01
Чтобы выяснить уровень достоверности, следует смотреть таблицу значений t-критерия: если полученное нами значение t меньше того, которое соответствует уровню достоверности по таблице, то разница между двумя выборками недостоверна, и они могут принадлежать к одной популяции, но чаще t-критерий применяют при проверке гипотезы о достоверности разницы средней между результатами экспериментальной и контрольной групп после воздействия.
Если сравниваются не два, а несколько распределений, то пользуются таким параметрическим методом, как дисперсионный анализ. Из непараметрических методов наиболее популярный – следующий: критерий хи-квадрат ( ), проверяющий являются ли две переменные независимыми друг от друга.
К другим непараметрическим методам относится критерий рангов и t-критерий Вилкоксона.
Какой бы критерий не использовался, его значение следует сравнить по таблице для уровня значимости 0,05 с учетом числа степеней свободы (число данных). Если вычисленный результат будет выше указанной цифры, то Н0 гипотеза может быть отвернута и можно утверждать, что разница между распределениями достоверна.
Дата добавления: 2017-11-04; просмотров: 713;