Линеаризация с помощью ряда Тейлора

В этом случае функция y(x) раскладывается в ряд Тейлора в окрестности точки a (рис.1,б):

с отбрасыванием всех членов высшего порядка малости (в этом и состоит линеаризация):

, (2)

где .

Второе слагаемое в (2) – дифференциал функции y(x) в точке a.

Пример.Исходная математическая модель является квадратным трехчленом:

. (3)

Необходимо линеаризовать эту модель в окрестности точки x=2.

Решение. По (3) находим: =4. Производная

в точке x=2 равна: =3, тогда линеаризованная модель

. (4)

Сравним результаты расчетов по формулам (3) и (4):

Таблица 1

x			Относительная погрешность,%

2.01	4,03	4,03
2,04	4,123	4,12	0,07
2,1	4,32	4,3	0,46
2,5		5,5	8,3

Как видим, при малых отклонениях погрешности получаются незначительными.

К тому же, модель (4) проще, чем (3), но недостатком такого подхода является необходимость пересчета коэффициентов (фактически построение другой модели) при существенном изменении значения x (например, при x=3).

Линейная регрессия

Общие положения

Как мы видели, математическая статистика занимается обработкой данных, полученных в результате какого-либо эксперимента. В частности – это зависимость величины Y от величины X в виде набора точек на плоскости (x_i, y_i), i = 1, …, n (рис.3). Но эта зависимость не будет однозначной (т.е. функциональной), а будет вероятностной (или стохастической), поскольку в общем случае и Y и X – случайные величины.

Функциональные связи являются абстракциями, в реальной жизни онивстречаются редко, но находят широкое применение в точных науках и впервую очередь, в математике. Например: зависимость площади круга отрадиуса: S=π∙r²

Обычно при стохастической зависимости между X и Y одна величина рассматривается как независимая (X), а вторая (Y) – как зависимая от первой, и зависимая величина ведет себя как случайная величина и ее можно описать некоторым вероятностным законом распределения.

Терминология зависимых и независимых переменных отражает лишь математическую зависимость переменных, а не причинно-следственные отношения.

Учитывая специфику вероятностной связи, эти величины (точнее – признаки) чаще называют факторными (которые обуславливают изменения других), или просто факторами, и результативными(которые изменяются под действием факторных признаков).

Рис.3

Возникновение понятия стохастической зависимости обусловливается тем, что величины подвержены влиянию неконтролируемых или неучтённых факторов, а также тем, что измерение значений переменных неизбежно сопровождается некоторыми случайными ошибками.То есть изучаемая система переходит не в определенное состояние, а в одно из возможных для нее состояний. Стохастическая связь состоит в том, что одна случайная переменная реагирует на изменение другой изменением своего закона распределения.

Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.

Поэтому при проведении того же эксперимента мы могли бы получить и несколько другой набор пар (x_i, y_i) (точки красного цвета нарис.4) в силу именно случайности фигурирующих в эксперименте величин.

Рис.4

Это можно интерпретировать, что рис.3, например, является своего рода «фотографией», а на самом деле точки (x_i, y_i), в силу случайных факторов, могут занимать и другое место на графике.

Модель стохастической связи может быть представлена в общем виде уравнением: ŷ_i = ƒ(x_i) + e_i, где:

f(x_i)-часть результативного признака, сформировавшаяся под воздействием учтенных известных факторных признаков (одного или множества), находящихся в стохастической связи с признаком;
ŷ_i-расчетное значение результативного признака;
e_i-часть результативного признака, возникшая вследствие действия неконтролируемых или неучтенных факторов, а также измерения признаков, неизбежно сопровождающегося некоторыми случайными ошибками.

Сравним: модель функциональной связи:

Разные разделы математической статистики посвящены обработке случайных величин в соответствии с разными задачами, например, с точки зрения расчета параметров выборки, или - отличия выборочных параметров от параметров генеральной совокупности, и т.д. Регрессионный анализ (РА) является тоже разделом математической статистики и в нем обрабатываются случайные величины со своих позиций, а именно:

регрессионный анализ устанавливает формы зависимости между этими величинами X и Y. Такая зависимость определяется некоторой математической моделью (уравнением регрессии), содержащей несколько неизвестных параметров (красные линии на рис.5).

Рис.5

Наиболее общая задача РА: для экспериментальных данных, имеющих между собой стохастическую зависимость, подобрать наиболее адекватную математическую модель в виде уравнения регрессии, графически являющейся некоторой линией.

Отметим, что при изучении стохастических зависимостей кроме РА используют и корреляционный анализ.

Фразу «наиболее адекватную математическую модель» нужно понимать в соответствии со следующими положениями.

Для каждого конкретного значения x_i, кроме зафиксированного значения y_i величины Y, имеется также несколько других значений величины Y (в силу ее случайности): y_i₁, y_i₂, y_i₃,… y_in, поэтому можно говорить о среднем значении:

(5)

В итоге для каждого x_i имеется свое значение :

Таблица 2

x₁	x₂	x₃	…	x_n
			…

Если величина x не является случайной (через строчную букву обозначаются именно неслучайные величины), то зависимость по табл.2 является однозначной и искомой. В наиболее строгом варианте речь идет о некой генеральной совокупности, где между значениями Y и x имеется зависимость, а конкретно - зависимость между МО величины Y и величиной x, отражением которой является табл.2. Но дело в том, что эта зависимость имеет теоретическое значение, поскольку мы не знаем всей совокупности значений y_i₁, y_i₂, y_i₃,… y_in, однако наиболее близкое к ней уравнение регрессии и будет наиболее адекватным.

Регрессия –это зависимость среднего значения (точнее – математического ожидания) случайной величины Y от величины x.

В РА рассматривается и вариант, когда величина X является случайной (через заглавные буквы обозначаются случайные величины), тогда речь будет идти о зависимости среднего значения случайной величины Y от среднего значения величины X (мое –проверить).

РА состоит из нескольких этапов:

§ выбор уравнения регрессии (математической модели);

§ оценка неизвестных параметров этой модели;

§ определяются статистические ошибки оценки или границы доверительных интервалов;

§ проверяется адекватность принятой математической модели экспериментальным данным.

123 4

Дата добавления: 2016-01-30; просмотров: 5352;