Построение линейной регрессионной модели с одной независимой переменной.

Одной из основных задач обработки данных является установление функциональной зависимости между переменными (параметрами) исследуемого процесса. Зачастую такие зависимости не очевидны, или слишком сложны. В таком случае ставится задача аппроксимации функциональной связи по эмпирическим данным. Эта задача решается с помощью регрессионного метода, который был назван известнейшим специалистом в области обработки данных Тьюки методом века.

Аппроксимациейназывается подбор математического выражения, описывающего связь между экспериментальными данными. Само математическое выражение называют уравнением регрессии (регрессией), а соответствующую кривую -линией регрессии [1].Простейшей регрессионной зависимостью является линейная. Если между переменными существует линейная функциональная связь, то результаты измерений будут концентрироваться около прямой, отражающей эту зависимость. Отклонения от прямой вызваны погрешностью измерений.

В случае двух переменных одна из них - X рассматривается как независимая и называется фактором или предиктором, вторая переменная Y является зависимой и называется откликом. Таким образом ,уравнение Y относительно X - уравнение регрессии ( говорят что Y регрессирует на X).

В случае линейной модели уравнение регрессии имеет вид:

, (1)

 

где b0 и b1 параметры модели;

e - остаточный член, обусловленный влиянием погрешностей измерений, случайных вариаций Y и погрешностью модели.

Погрешность модели возникает в случае замены какой - либо более сложной модели линейной зависимостью.

Оценки параметров модели (b0 и b1) находятся по результатам наблюдений.

Модель (1) является линейной первого порядка. Порядок модели определяется наивысшей степенью предиктора. Так модель

(2)

 

является линейной (относительно параметров b) третьего порядка..

В результате построения модели находятся оценки параметров b0 и b1 Уравнение регрессии, соответствующее уравнению (1), имеет вид

, (3)

где - расчетное или прогнозируемое значение Y для данного X.

МНК - оценки параметров получаются минимизацией суммы квадратов отклонений от «истинной» линии.

где n - число независимых наблюдений величин Хi и Yi

Получены следующие МНК оценки параметров b0 и b1[2]

 

, (5)

где - средние значения наблюдаемых величин X и Y. Подставляя оценки (5) в уравнение (3), можно вычислить «прогнозируемые» значения и найти остатки . Для правильно построенной модели сумма остатков равна 0.

 








Дата добавления: 2016-02-20; просмотров: 877;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.004 сек.