Некоторые методы статистического анализа данных при вторичной обработке
Внедрение в научные исследования вычислительной техники позволяет быстро и точно определять любые количественные характеристики любых массивов данных. Разработаны различные программы для ЭВМ, по которым можно проводить соответствующий статистический анализ практически любых выборок. Из массы статистических приемов в психологии наибольшее распространение получили следующие.
Комплексное вычисление статистик
По стандартным программам производится вычисление различных совокупностей статистик. Как основных, представленных нами выше, так и дополнительных, не включенных в наш обзор. Иногда получением этих характеристик исследователь и ограничивается. Чаще же совокупность этих статистик представляет собой лишь блок, входящий в более широкое множество показателей изучаемой выборки, получаемое по более сложным программам. В том числе по программам, реализующим приводимые ниже методы статистического анализа.
Корреляционный анализ
Сводится к вычислению коэффициентов корреляции в самых разнообразных соотношениях между переменными. Соотношения задаются исследователем, а переменные равнозначны, т. е. что являются причиной, а что следствием, установить через корреляцию невозможно. Кроме тесноты и направленности связей' метод позволяет установить форму связи (линейность, нелинейность) [27, 124]. Надо заметить, что нелинейные связи не поддаются анализу общепринятыми в психологии математическими и статистическими методами. Данные, относящиеся к нелинейным зонам (например, в точках разрыва связей, в местах скачкообразных изменений), характеризуют через содержательные описания, воздерживаясь от формально-количественного их представления; [84, с. 17–23]. Иногда для описания нелинейных явлений в психологии удается применить непараметрические математико-статистические методы и модели. Например, используется математическая теория катастроф [294, с. 523–525].
Дисперсионный анализ
В отличие от корреляционного анализа этот метод позволяет выявлять не только взаимосвязь, но и зависимости между переменными, т. е. влияние различных факторов на исследуемый признак. Это влияние оценивается через дисперсионные отношения. Изменение изучаемого признака (вариативность) может быть вызвано действием отдельных известных исследователю факторов, их взаимодействием и воздействиями неизвестных факторов. Дисперсионный анализ позволяет обнаружить и оценить вклад каждого из этих влияний на общую вариативность исследуемого признака. Метод позволяет быстро сузить поле влияющих на изучаемое явление условий, выделив наиболее существенные из них. Таким образом, дисперсионный анализ – это «исследование влияния переменных факторов на изучаемую переменную по дисперсиям» [364, с. 340]. В зависимости от числа влияющих переменных различают одно-, двух-, многофакторный анализ, а в зависимости от характера этих переменных – анализ с постоянными, случайными или смешанными эффектами [87, 364, 407]. Дисперсионный анализ широко применяется при планировании эксперимента.
Факторный анализ
Метод позволяет снизить размерность пространства данных, т. е. обоснованно уменьшить количество измеряемых признаков (переменных) за счет их объединения в некоторые совокупности, выступающие как целостные единицы, характеризующие изучаемый объект. Эти составные единицы и называют в данном случае факторами, от которых надо отличать факторы дисперсионного анализа, представляющие собой отдельные признаки (переменные). Считается, что именно совокупность признаков в определенных комбинациях может характеризовать психическое явление или закономерность его развития, тогда как по отдельности или в других комбинациях эти признаки не дают информации. Как правило, факторы не видны на глаз, скрыты от непосредственного наблюдения. Особенно продуктивен факторный анализ в предварительных исследованиях, когда необходимо выделить в первом приближении скрытые закономерности в исследуемой области. Основой анализа является матрица корреляций, т. е. таблицы коэффициентов корреляции каждого признака со всеми остальными (принцип «все со всеми»). В зависимости от числа факторов в корреляционной матрице различают однофакторный (по Спирмену), бифакторный (по Холзингеру) и многофакторный (по Тёрстону) анализы. По характеру .связи между факторами метод делится на анализ с ортогональными (независимыми) и с облическими (зависимыми) факторами. Существуют и иные разновидности метода [35, 134, 199, 269, 394]. Весьма сложный математический и логический аппараты факторного анализа часто затрудняют выбор адекватного задачам исследования варианта метода. Тем не менее популярность его в научном мире растет с каждым годом.
Регрессионный анализ
Метод позволяет изучать зависимость среднего значения одной величины от вариаций другой (других) величины. Специфика метода заключается в том, что рассматриваемые величины (или хотя бы одна из них) носят случайный характер. Тогда описание зависимости распадается на две задачи: 1) выявление общего вида зависимости и 2) уточнение этого вида путем вычисления оценок параметров зависимости. Для решения первой задачи стандартных методов не существует и здесь производится визуальный анализ корреляционной матрицы в сочетании с качественным анализом природы исследуемых величин (переменных). Это требует от исследователя высокой квалификации и эрудиции. Вторая задача, по сути, есть нахождение аппроксимирующей кривой. Чаще всего эта аппроксимация осуществляется с помощью математического метода наименьших квадратов [45, 116, 124]. Идея метода принадлежит Ф. Гальтону, заметившему, что у очень высоких родителей дети были несколько меньше ростом, а у очень маленьких родителей – дети более рослые. Эту закономерность он и назвал регрессией.
Дата добавления: 2015-03-19; просмотров: 934;