Регрессионный анализ. Регрессионный анализ позволяет предсказать, чему в среднем будет равно значение одного признака при заданном значении другого признака.

Регрессионный анализ позволяет предсказать, чему в среднем будет равно значение одного признака при заданном значении другого признака.

Достаточно часто связь между двумя психологическими признаками имеет линейный характер:

у = a + bx, где

· y и x - анализируемые признаки;

· а - свободный член уравнения; при b = 0 получаем y = а, т.е. а - это точка, в которой линия регрессии пересекается с осью
OY (эту точку называют также «j-пересечением», или
«Intercept»);

· b - коэффициент регрессии, отражающий угол наклона
линии регрессии. Чем больше b отличается от 0, тем сильнее
связь между анализируемыми признаками.

Даже если связь между психологическими признаками носит нелинейный характер (например, экспоненциальный), практически всегда можно выделить участки, хорошо аппроксимируемые линейной регрессией.

Приведенное выше уравнение можно использовать для описания связи между двумя признаками лишь при выполнении следующих обязательных условий:

· зависимость между признаками носит линейный характер;

· оба признака распределены нормально.

Пример задачи: Исследователь должен определить коэффициенты линейного регрессионного уравнения, описывающего связь между показателями систолического давления и нервно-психической устойчивостью (НПУ) испытуемых.

Решение: Расчет коэффициентов регрессионных уравнений можно выполнить в нескольких модулях программы Statistica 6.0. Мы воспользуемся модулем Multiple Regression Analysis
(Анализ множественной регрессии).

 

В появившемся окне нажмите на кнопку Variables и укажите, какая из анализируемых переменных является зависимой (Dependent variable), а какая - независимой (Independent variable) (в нашем примере систолическое давление зависит от НПУ).

Нажмите на кнопку «ОК».

В итоге появится окно, которое уже на данном этапе анализа содержит некоторые важные его результаты:

а) Dependent: имя зависимой переменной;

б) No. of cases: число наблюдений;

в) Intercept: значение свободного члена регрессионного уравнения;

г) Std. error: стандартная ошибка свободного члена регрессионного уравнения;

д) Multiple R: коэффициент множественной корреляции;

е) R: коэффициент детерминации. Это очень важный показатель в регрессионном анализе. Он изменяется от 0 до 1 и отражает «качество» рассчитанной регрессии, показывая долю (%) общего разброса выборочных точек, которая «объясняется» построенной регрессией (например, при R2 = 0,85, следует вывод о том, что 85% дисперсии зависимой переменной y объясняется вариацией независимой переменной х);

ж) Adjusted R2: скорректированный на число степеней свободы коэффициент детерминации (Adjusted R-square = 1 - (1 - R-square)x[n/(n - p)], где n - число наблюдений, р - число независимых переменных плюс 1);

з) Standard error of estimate: параметр, отражающий степень разброса выборочных значений относительно линии регрессии;

и) F, dfиp: F-критерий, число степеней свободы, принятое при его расчете, и вероятность ошибки для нулевой гипотезы F-теста. F-тест в регрессионном анализе применяется для оценки статистической значимости модели. При p<0,05 можно заключить, что рассчитанная регрессия удовлетворительно описывает связь между исследуемыми признаками;

к) t(df) и p: критерий Стьюдента t используется для проверки нулевой гипотезы о равенстве 0 свободного члена регрессионного уравнения. Р - вероятность ошибки для этой нулевой гипотезы;

л) beta: стандартизованный коэффициент регрессии - это коэффициент регрессии, который мы получили бы в случае предварительной стандартизации обеих переменных (т.е. при таком преобразовании, когда их средние значения стали бы равны 0, а стандартные отклонения - 1). Расчет beta позволяет оценить, в какой степени значения зависимой переменной определяются значениями независимой переменной. Beta может оказаться особенно полезным показателем при включении в анализ нескольких независимых переменных, выражающихся в разных единицах измерения - в таком случае коэффициент отражал бы удельный вклад каждой из этих переменных в вариацию зависимой переменной. При наличии одной независимой переменной коэффициент beta идентичен Multiple R.

Нажмите кнопку «Summary: Regression results»(Результаты регрессионного анализа). Появится таблица с результатами анализа, в которой:

а) Beta: стандартизованный коэффициент регрессии;

б) Std. err. of beta: стандартная ошибка стандартизованного коэффициента регрессии;

в) В: один из самых важных столбцов в этой таблице, поскольку именно он содержит искомые значения свободного члена регрессионного уравнения (в строке Intercept) и коэффициента регрессии (нижняя строка таблицы);

г) Std. err. of B: стандартные ошибки коэффициентов уравнения;

д) t(df): значения t-критерия Стьюдента, который используется для проверки гипотезы о равенстве обоих коэффициентов уравнения 0;

е) p-level: вероятность ошибки для нулевой гипотезы о равенстве коэффициентов уравнения нулю.

 

Из итоговой таблица видно, что оба коэффициента регрессии статистически значимо отличаются от 0 (p < 0,05) и что в целом построенная регрессионная модель отлично описывает связь между систолическим давлением и нервно-психической устойчивостью. Само же рассчитанное уравнение мы можем записать следующим образом:

Н= 2,682 x А + 33,289, где Н - давление, А – нервно-психическая устойчивость человека.

Важной частью регрессионного анализа является анализ остатков (остатки представляют собой разности между наблюдаемыми значениями зависимой переменной и теми ее значениями, которые предсказываются регрессионной моделью). Он запускается путем нажатия кнопки «Perform residual analysis» (Выполнить анализ остатков) на закладке «Residuals /Assumptions /Predictions» (Остатки / Условия / Предсказания).

Первое, что нужно проверить в отношении остатков - это нормальностьих распределения. Для этого на закладке «Quick»подмодуля анализа остатков нажмите кнопку «Normal plot of residuals», чтобы построить график нормальных вероятностей. Если точки на этом графике достаточно тесно укладываются вдоль теоретически ожидаемой прямой, то можно заключить, что остатки распределяются нормально. Иначе линейная регрессионная модель для анализируемых переменных будет неприменима.

 

Второе условие в отношении остатков состоит в том, что их дисперсия должна оставаться неизменной во всем диапазоне значений анализируемых переменных. Для проверки этого условия на закладке «Scatterplots» (Диаграммы рассеяния) нажмите кнопку «Predicted vs. Residuals», чтобы построить график зависимости значений остатков от предсказываемых моделью значений зависимой переменной. Если проверяемое условие выполняется, то точки на этом графике будут располагаться хаотично, не проявляя никакой закономерности. Если же в расположении точек имеется тенденция (разброс увеличивается слева направо, точки тесно укладываются вдоль прямой, и т.п.), линейный регрессионный анализ также неприменим.

 

 

В рассмотренном примере оба условия в отношении остатков выполняются, что еще раз подтверждает адекватность рассчитанной регрессионной модели для описания связи между артериальным давлением и нервно-психической устойчивостью.


ЛИТЕРАТУРА

 

1) Дружинин В.Н. Экспериментальная психология. - СПб.: Питер, 2011.

2) Ермолаев О.Ю. Математическая статистика для психологов: Учебник. - М.: МПСИ, Флинта, 2011.

3) Корнилова Т.В. Экспериментальная психология: Теория и методы. - М.: Юрайт-Издат, 2012.

4) Куликов Л.В. Психологическое исследование: методические рекомендации по проведению. – СПб.: Речь, 2001. - с.90-92.

5) Практикум по общей, экспериментальной и прикладной психологии /Под ред. А.А.Крылова, С.А.Маничева. - СПб.: Питер, 2007.

6) Сидоренко Е.В. Методы математической обработки в психологии. – СПб.: ООО «Речь», 2000. – 350 с.

7) Худяков А. И. Экспериментальная психология в схемах и комментариях. – СПб.: Питер, 2008.

 

 


Приложение 1

 

Таблица 1

Значения критерия tst для отбраковки выпадающих вариант

при разных уровнях значимости (p).

 

  p   p
n 0,05 0,01 0,001 n 0,05 0,01 0,001
- - - - - - - -
3,04 5,04 9,43 2,145 2,932 3,979
2,78 4,36 7,41 2,105 2,852 3,819
2,62 3,96 6,37 2,079 2,802 3,719
2,51 3,71 5,73 2,061 2,768 3,652
2,43 3,54 5,31 2,048 2,742 3,602
2,37 3,41 5,01 2,038 2,722 3,565
2,33 3,31 4,79 2,030 2,707 3,532
2,29 3,23 4,62 2,018 2,683 3,492
2,26 3,17 4,48 2,009 2,667 3,462
2,24 3,12 4,37 2,003 2,655 3,439
2,22 3,08 4,28 1,998 2,646 3,423
2,20 3,04 4,20 1,994 2,639 3,409
2,18 3,01 4,13 1,960 2,576 3,291
2,17 2,98 4,07        

 


Таблица 2

Значение функции f(oi)

(ординаты нормальной кривой)

 

oi Сотые доли oi
0,0                      
0,1                      
0,2                      
0,3                      
0,4                      
0,5                      
0,6                      
0,7                      
0,8                      
0,9                      
1,0                      
1,1                      
1,2                      
1,3                      
1,4                      
1,5                      
1,6                      
1,7                      
1,8                      
1,9                      
2,0                      
2,1                      
2,2                      
2,3                      
2,4                      
2,5                      
2,6                      
2,7                      
2,8                      
2,9                      
3,0                      
3,1                      
3,2                      
3,3                      
3,4                      
3,5                      
3,6                      
3,7                      
3,8                      
3,9                      
4,0

Примечание. Значения вероятности p даны числами после запятой.


Таблица 3

Критические значения критерия c2 для уровней статистической значимости р£0,05 и р£0,01 при разном числе степеней свободы V.

Различия между двумя распределениями могут считаться достоверными, если c2эмп достигает или превышает c20,05, и тем более достоверными, если c2эмп достигает или превышает c20,01 (по Большеву Л.Н., Смирнову Н.В., 1983).

р   p   р  
V   0,05   0,01   V   0,05   0,01   V   0,05   0,01  
  3,841   6,635     49,802   57,342     89,391   99,227  
  5,991   9,210     50,998   58,619     90,631   100.425  
  7,815   11,345     52,192   59,892     91,670   101,621  
  9,488   13,277     53,384   61,162     92,808   102,816  
  11,070   15,086     54,572   62,428     93,945   104,010  
  12,592   16,812     55,758   63,691     95,081   105,202  
  14.067   18.475     56.942   64,950     96,217   106,393  
  15,507   20,090     58,124   66,206     97,351   107,582  
  16,919   21,666     59,304   67,459     98.484   108,771  
  18,307   23,209     60,481   68.709     99.617   109,958  
  19,675   24,725     61,656   69,957     100,749   111,144  
  21,026   26,217     62,830   71,201     101.879   112,329  
  22,362   27,688     64,001   72,443     103,010   113,512  
  23.685   29,141     65,171   73,683     104,139   114,695  
  24,996   30,578     66,339   74,919     105,267   115.876  
  26,296   32,000     67,505   76,154     106,395   117,057  
  27,587   33,409     68,669   77,386     107,522   118,236  
  28,869   34,805     69,832   78,616     108,648   119,414  
  30,144   36,191     70,993   79.84'3     109,773   120,591  
  31,410   37,566     72.153   81,069     110,898   121,767  
  32,671   38,932     73,311   82,292     112,022   122,942  
  33,924   40,289     74,468   83,513     113,145   124,116  
  35,172   41,638     75,624   84,733     114,268   125,289  
  36,415   42,980     76,778   85.950     115,390   126,462  
  37,652   44,314     77,931   87,166     116,511   127,633  
  38,885   45,642     79,082   88.379     117,632   128.803  
  40.113   46,963     80,232   89,591     118,752   129,973  
  41,337   48,278     81,381   90,802     119,871   131,141  
  42,557   49.588     82,529   92.010     120,990   132,309  
  43,773   50,892     83,675   93,217     122,108   133,476  
  44,985   52,191     84,821   94,422     123,225   134,642  
  46,194   53,486     85,965   95,626     124,342   135,807  
  47.400   54,776     87,108   96,828      
  48.602   56,061     88,250   98,028    

 

 


Таблица 4

 

Значения критерия t Стьюдента при различных уровнях значимости (р)

 

Число степеней свободы d Уровень значимости
0,05 0,01 0,001
12,71 63,66 -
4,30 9,93 31,60
3,18 5,84 12,94
2,78 4,60 8,61
2,57 4,03 6,86
2,45 3,71 5,96
2,37 3,50 5,41
2,31 3,36 5,04
2,26 3,25 4,78
2,23 3,17 4,59
2,20 3,11 4,44
2,18 3,06 4,32
2,16 3,01 4,22
2,15 2,98 4,14
2,13 2,95 4,07
2,12 2,92 4,02
2,11 2,90 3,97
2,10 2,88 3,92
2,09 2,86 3,88
2,09 2,85 3,85
2,08 2,83 3,82
2,07 2,82 3,79
2,07 2,81 3,77
2,06 2,80 3,75
2,06 2,79 3,73
2,06 2,78 3,71
2,05 2,77 3,69
2,05 2,76 3,67
2,05 2,76 3,66
2,04 2,75 3,65
1,96 2,58 3,29

 


Приложение 2

 

Таблица 1

 

Критические значения выборочного коэффициента корреляции рангов Rs Спирмена

 

z р z р z р
0,05 0,01 0,05 0,01 0,05 0,01
0,94   0,48 0,62 0,37 0,48
0,85   0,47 0,60 0,36 0,47
0,78 0,94 0,46 0,58 0,36 0,46
0,72 0,88 0,45 0,57 0,36 0,45
0,68 0,83 0,44 0,56 0,34 0,45
0,62 0,79 0,43 0,54 0,34 0,44
0,61 0,76 0,42 0,53 0,33 0,43
0,58 0,73 0,41 0,52 0,33 0,43
0,56 0,70 0,40 0,51 0,33 0,42
0,54 0,68 0,39 0,50 0,32 0,41
0,52 0,66 0,38 0,49 0,32 0,41
0,50 0,64 0,38 0,48 0,31 0,40
П р и м е ч а н и е – Здесь p – уровень значимости, z – объем выборки. Если вычисленное значение Rs<Rs0,05, то корреляция не является статистически значимой. Если эмпирическое значение Rs≥Rs0,01, то корреляция является достоверной.  
                     

 


Таблица 2

 

Критические значения коэффициента корреляции rxy Пирсона

 

n\P 0,05 0,01 n\P 0,05 0,01
0,950 0,990 0,388 0,496
0,878 0,959 0,381 0,487
0,811 0,917 0,371 0,478
0,754 0,874 0,367 0,470
0,707 0,834 0,361 0,463
0,666 0,798 0,332 0,435
0,632 0,765 0,310 0,407
0,602 0,735 0,292 0,384
0,576 0,708 0,277 0,364
0,553 0,684 0,253 0,333
0,532 0,661 0,234 0,308
0,514 0,641 0,219 0,288
0,497 0,623 0,206 0,272
0,482 0,606 0,196 0,258
0,468 0,590 0,175 0,230
0,456 0,575 0,160 0,210
0,444 0,561 0,138 0,182
0,433 0,549 0,142 0,163
0,423 0,537 0,113 0,148
0,413 0,526 0,098 0,128
0,404 0,515 0,088 0,115
0,396 0,505 0,062 0,081

Примечания: корреляция статистически значима, если rxy≥ rxy0,01. Если

rxy<rxy0,05, то корреляция не является значимой.


Приложение 3








Дата добавления: 2016-03-10; просмотров: 1656;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.031 сек.