Линейная парная регрессия

Методы и модели регрессионного анализа занимают центральное место в математическом инструментарии эконометрики. Наиболее часто используется парная регрессия, когда рассматривается пара переменных: одна объясняющая (синонимы - входная, экзогенная, регрессор) переменная Х и одна – объясняемая (синонимы - выходная, результирующая) переменная Y – обязательно случайная величина.

Регрессией называют функцию, отражающую зависимость математического ожидания (МО) СВ Y от значений Х (такую зависимость называют также корреляционной). По определению регрессия есть условное МО СВ Y:

М_х(Y) = j(х).

(2.1)

На практике точно не известно условное МО СВ Y, т.е. функция j(х). Поэтому можно говорить лишь о приближенном построении - оценке такой функции. Исходными данными для этого служат n пар значений Х и Y: x_i и y_i при i=1, 2, ... , n.

В случае парной линейной регрессии в качестве оценки - выборочного уравнения регрессии - принимается прямая линия:

= b_o +b₁x.

(2.2)

Неизвестные параметры b_o и b₁, как правило, определяются методом наименьших квадратов: значения параметров должны доставлять минимум сумме квадратов отклонений наблюденных значений y_i от теоретических значений , определяемых регрессией (2.2):

S(b_o, b₁) = å (- y_i)²= å (b_o +b₁x_i - y_i)²® min.

(2.3)

Теоретически для оценки параметров b_o и b₁ можно использовать и метод наименьших модулей отклонений å ç- y_iç. Однако метод наименьших квадратов (МНК), во-первых, проще, во-вторых, его применение обосновывается законом больших чисел, в-третьих, позволяет проводить глубокий анализ качества эконометрической модели.

Для отыскания значений параметров b_o и b₁эконометрической модели (2.2) с помощью МНК приравниваем нулю частные производные S по b_oи b₁и получаем систему двух уравнений:

¶S/¶ b_o= 2å (b_o +b₁x_i - y_i) = 0 ¶S/¶ b₁= 2å (b_o +b₁x_i - y_i) x_i = 0.

(2.4)

Отсюда после преобразований получаем систему двух линейных уравнений с двумя неизвестными b_oи b₁:

b_on + b₁åx_i= å y_i, b_oåx_i+ b₁å

= å x_i y_i.

(2.5)

Разделим 1-е уравнение на n и получим полезное соотношение: линия регрессии проходит через точку средних значений (, ):

= b_o +b₁.

(2.6)

Разрешая (2.6) относительно b_o, подставляя это значение во 2-е уравнение системы (2.5), получим искомые формулы для расчета значений параметров уравнения регрессии:

b_o =

- b₁ b₁ =

(2.7)

где s_x²- выборочная дисперсия переменной Х:

= å

/n - (

)².

(2.8)

- выборочная ковариация:

= å x_i y_i/n -

(2.9)

Параметр b₁называется коэффициентом регрессии (выборочным). Он показывает, на сколько единиц в среднем возрастет (уменьшится) при увеличении х на одну единицу.

Параметр b₀ в зависимости от задачи может иметь смысл, а может и не иметь. Например, если - расход электроэнергии, а х – объем производства, то параметр b₀ - условно-постоянный расход электроэнергии при нулевом производстве. Если b₀<0, то экономического смысла он, как правило, не имеет.

Пример 2.1 [4, с.10]. Построить уравнение парной линейной регрессии для данных табл. 2.1, где Y - расходы на покупку продовольственных товаров, % от общих расходов и Х - среднедневная зарплата, руб./чел.×сут.

Таблица 2.1

<1 2 345 6 7 >

Дата добавления: 2019-10-16; просмотров: 541;