Регресійний аналіз.

 

Важливою характеристикою кореляційного аналізу є лінія регресії – емпірична в моделі аналітичного групування і теоретична в моделі регресійного аналізу.

Емпірична лінія регресії представлена груповими середніми результативної ознаки , кожна з яких належить до відповідного інтервалу значень групувального фактора (див. табл.6.2).

Теоретична лінія регресії описується певною функцією , яку називають рівнянням регресії, а Yтеоретичним рівнем результативності ознаки. На відміну від емпіричної, теоретична лінія регресії неперервна.

Залежно від характеру зв’язку статистика використовує різні за функціональним видом регресійні рівняння:

лінійні рівняння , коли із змінною х ознака у змінюється більш-менш рівномірно;

нелінійні рівняння, коли зміна взаємопов’язаних ознак відбувається нерівномірно (з прискоренням, уповільненням або напрям зв’язку змінюється), зокрема:

степенева

гіперболічна

параболічна

В практиці частіше застосовуються лінійні рівняння або приведені до лінійного виду. У лінійному рівнянні параметр bкоефіцієнт регресії, який вказує, на скільки одиниць в середньому зміниться у зі зміною х на одиницю. Він має одиницю виміру результативної ознаки і розглядається як ефект впливу хна у.

Параметр a – вільний член рівняння регресії, тобто це значення У при х=0. Якщо х не набуває нульових значень, цей параметр має лише розрахункове значення.

Параметри рівняння регресії визначаються методом найменших квадратів, основна умова якого – мінімізація суми квадратів відхилень емпіричних значень y від теоретичних Y:

.

Математично доведено, що значення параметрів а та b, при яких мінімізується сума квадратів відхилень, визначається із системи нормальних рівнянь:

n∙a+b

 

a∙ b∙

Звідси:

,

Порядок обчислення параметрів лінійної регресії розглянемо на прикладі зв’язку між урожайністю зернових і кількістю внесених добрив (в центнерах діючої поживної речовини – д.р.). Взаємопов’язані ознаки та необхідні для розрахунку параметрів величини наведені в табл.6.2

Таблиця 6.2 – Матеріали до розрахунку параметрів лінійної регресії

 

Номер госпо- дарства Кількість внесених добрив,х ц.д.р Урожайність зернових,у ц/га х∙у х Y у - Y (у –Y)
1,4 35,0 1,96 27,03 -2,03 4,12
2,0 66,0 4,00 33,29 -0,29 0,08
1,8 54,0 3,24 31,2 -1,2 1,44
1,3 36,4 1,69 26,0
1,2 31,2 1,44 24,95 1,05 1,10
1,1 25,3 1,21 23,91 -0,91 0,83
1,7 54,4 2,89 30,16 1,84 3,39
1,5 40,5 2,25 28,08 -1,08 1,17
1,6 46,4 2,56 29,12 -0,12 0,01
1,9 62,7 3,61 32,26 0,74 0,56
Разом 15,5 451,9 24,85 х 16,70

 

=15,5:10=1,55

=286:10=28,6

Користуючись цими величинами, визначаємо:

b= ц/га

 

a= 28,6-10,424∙1,55=12,443

Отже, рівняння регресії має вигляд:

у= 12,443+10,424х

Тобто, кожний центнер внесених добрив (в перерахунку на діючу поживну речовину) дає приріст урожайності в середньому 10,424 ц/га. Якщо добрива не вносити (х=0), то урожайність зернових не перевищить 12,443 ц/га.

Рівняння регресії відбиває закон зв'язку між х і у не для окремих елементів сукупності, а для сукупності в цілому. Закон, який абстрагує вплив інших факторів, виходить з принципу «за інших однакових умов».

Вплив інших окрім х факторів зумовлює відхилення емпіричних значень увід теоретичних у той чи інший бік. Відхилення (у – Y) називають залишками і позначають символом e. Залишки, як правило, менші за відхилення від середньої, тобто:

(у – Y) ≤ (у - ).

У нашому прикладі

,

де .

.

Відповідна загальна дисперсія врожайності:

у - .

Залишкова дисперсія:

.

Коефіцієнт регресії у невеликих за обсягом сукупностях схильний до випадкових коливань. Тому здійснюється перевірка його істотності за допомогою t – критерію (Стьюдента):

,

де b – коефіцієнт регресії;

– стандартна похибка.

Стандартна похибка коефіцієнта регресії залежить від варіації факторної ознаки , залишкової дисперсії і числа ступенів свободи k = n – m, де m – кількість параметрів рівняння регресії:

.

Для лінійної функції m = 2. За даними табл.6.2 маємо:

.

Звідси:

(ц/га),

а

,

що перевищує критичне значення t – критерію . Гіпотеза про випадковий характер коефіцієнта регресії відхиляється, а отже, з імовірністю 0,95 вплив кількості добрив на врожайність зернових визначається істотним.

Для коефіцієнта регресії визначаються також довірчі межі: . В нашому прикладі довірчі межі коефіцієнта регресії з імовірністю 0,95 (t = 2,45) становлять 10,424±2,45∙1,59.

Важливою характеристикою регресійної моделі є відносний ефект впливу фактора х на результат у – коефіцієнт еластичності:

,

який показує, на скільки процентів у середньому змінюється результативна ознака у зі зміною фактора х на 1%. За даними нашого розрахунку:

,

тобто збільшення кількості внесених добрив на 1% приріст урожайності зернових у середньому складає 0,565%.

На підставі рівняння регресії визначаються теоретичні значення Y, тобто значення результативної ознаки за умови впливу лише фактора х при незмінному рівні інших факторів. Так, для

х = 1,5 ц теоретичний рівень урожайності становить 28,08 ц/га (Y = 12,443+10,424∙1,5), що дещо відхиляється від емпіричного значення (27 ц/га).








Дата добавления: 2015-03-20; просмотров: 1257;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.011 сек.