Простая линейная регрессия
Пример 1 Функция ТЕНДЕНЦИЯ.
а) Предположим, что фирма желает приобрести земельный участок в июле. Фирма собирает информацию о ценах за последние 12 месяцев, начиная с марта, на типичный земельный участок. Номера месяцев с 1 по 12 (известные значения х) записаны в ячейки А2...А13. Известные значения y содержат множество известных значений (133 890 руб., 135 000 руб., 135 790 руб., 137 300 руб., 138 130 руб., 139 100 руб., 139900 руб., 141 120 руб., 141 890 руб., 143 230 руб., 144 000 руб., 145 290 руб.), которые находятся в ячейках В2:В13 соответственно (данные условные). Новые значения х, т.е. числа 13, 14, 15, 16, 17 введём в ячейки А14...А18. Для того чтобы определить ожидаемые значения цен на март, апрель, май, июнь, июль, выделим любой интервал ячеек, например, С2:С6 (по одной ячейке для каждого месяца) и в строке формул введем функцию:
=ТЕНДЕНЦИЯ (В2:В13;А2:А13;А14:А18;С2:С6)(10)
После нажатия клавиш Ctrl+Shift+Enter данная функция будет введена как формула вертикального массива, а в ячейках С2:С6 появится результат: {146172:147190:148208:149226:150244}.
Таким образом, в июле фирма может ожидать цену около 150 244 руб.
б) Тот же результат будет получен, если вводить в формулу не все массивы переменных х и у, а использовать часть массивов, которые предусматриваются автоматически по умолчанию. Тогда формула (10) примет вид:
=ТЕНДЕНЦИЯ (В2:В13;;{13:14:15:16:17}).(11)
В формуле (11) используется массив по умолчанию (1:2:3:4:5:6:7:8:9: 10:11:12) для аргумента известные _значения_х, соответствующий 12 месяцам, для которых имеются данные по продажам. Он должен был бы быть помещен в формуле(11) между двумя знаками ;;.
Массив (13:14:15:16:17) соответствует следующим 5 месяцам, для которых и получен массив результатов (146172:147190:148208:149226: 150244).
Элементы массивов разделяет знак " : " , который указывает на то, что они расположены по столбцам.
в) Аргумент новые значения х можно задать другим массивом ячеек, например, В14:В18, в которые предварительно записаны те же номера месяцев 13, 14, 15, 16, 17. Тогда вводимая в строку формул функция примет вид =ТЕНДЕНЦИЯ (В2:В13;;В14:В18).
Пример 2 а) Функция ЛИНЕЙН. Дана таблица изменения температуры в течение шести часов, введенная в ячейки D2:E7 (табл. 3). Требуется определить температуру во время восьмого часа.
Таблица 3
... | D | E | |
х -№ часа | у -t○, град. | ||
Выделим ячейки D8:E12 для вывода результата (в соответствии с табл. 1), введём в строку ввода формулу =ЛИНЕЙН(E2:E7;D2:D7;1;1), нажмём клавиши Ctrl+Shift+Enter, в выделенных ячейках появится результат (табл. 4):
Таблица 4
3,1428571 | -3,3333333 |
0,5408484 | 2,106302 |
0,8940887 | 2,2625312 |
33,767442 | |
172,85714 | 20,47619 |
Таким образом, коэффициент m = 3,143 со стандартной ошибкой 0,541, а свободный член b = -3,333 со стандартной ошибкой 2,106, т.е. функция, описывающая данные табл. 2, имеет вид
у = 3,143∙х - 3,333 (12)
Стандартные ошибки показывают максимально возможное отклонение параметра от рассчитанной величины . Для у оно составляет 2,263, т.е. реальное значение у может лежать в пределах у±2,263.
Точность приближения к табличным данным (коэффициент детерминированности r2) cоставляет 0,894 или 89,4%, что является высоким
показателем. При х = 8 получим: у = 3,143∙8 – 3,333 = 21,81 град.
б)Тот же результат можно получить, использовав функцию =ТЕНДЕНЦИЯ (E2:E7;;G2:G5) для, например, следующих четырёх часов, предварительно введя в ячейки G2:G5 числа с 7 до 10. Выделив ячейки Н2:Н5, введя в строку формул эту функцию и нажав Ctrl+Shift+Enter, получим в выделенных ячейках массив {18,667; 21,80952; 24,95238; 28,09524}, т.е. для восьмого часа значение у = 21,809 ≈21,81град.
в)Функция ПРЕДСКАЗ – позволяет предсказывать значение у для нового значения х по известным значениям хиу, используя линейное приближение зависимости у = f(x). Синтаксис функции:
=ПРЕДСКАЗ(нов,_знач._х; изв._знач._ у;изв._ знач._х)
Для данных примера 2 ввод формулы =ПРЕДСКАЗ(8;E2:E7;D2:D7) выводит в заранее выделенной ячейке результат 21,809. Новое значение х может быть задано не числом, а ячейкой, в которую записано это число.
Отличие функции ПРЕДСКАЗ от функции ТЕНДЕНЦИЯ заключается в том, что ПРЕДСКАЗ прогнозирует значение функции линейного приближения только для одного нового значения х.
Дата добавления: 2016-02-02; просмотров: 550;