Математическая обработка статистических данных, результатов эксперимента
Зависимости между параметрами некоторого объекта, процесса, явления могут быть выражены с помощью математических формул. Но в некоторых случаях коэффициенты в этих формулах могут быть получены в результате статистической обработки экспериментальных данных. Статистика— это наука о сборе, измерении и анализе больших массивов количественных данных. Статистические данные носят приближенный, усредненный характер, получаются путем многократных измерений. Математический аппарат статистики разрабатывает раздел науки под названием «Математическая статистика». Статистические данные используются, в частности, для получения упрощенного математического описания сложной или неизвестной зависимости между данными некоторой системы (регрессионные модели). Статистические функции электронных таблиц позволяют обрабатывать статистические данные, например, вычислять среднее арифметическое числовых данных (СРЗНАЧ), среднее геометрическое положительных числовых данных, минимальное и максимальное значения из набора данных, выполнять подсчеты (СЧЁТ, СЧЁТЕСЛИ, СЧЁТЗ, СЧИТАТЫГУСТОТЫ и т. д.).
Статистический анализданных широко используется:
• в народном хозяйстве при: анализе результатов деятельности предприятий и организаций; оценке состояния финансового, сырьевого и других рынков; анализе прибыльности инвестиционной деятельности; составлении краткосрочных планов и долгосрочных прогнозов;
• в социологии и психологии для обработки и анализа результатов опросов, тестирования, анкетирования;
• в научной деятельности для обработки результатов экспериментов, оценки их достоверности, проверки гипотез и пр.
Использование динамических (электронных) таблиц для обработки и представления результатов естественно-научного и математического эксперимента, экономических и экологических наблюдений, социальных опросов
Для определения статистической зависимости необходимо выполнить два шага:
1. На основании физического смысла статистических данных принять вид аналитических зависимостей. Это может быть, например, полином второй степени у = ах2 + Ъх + с, линейная зависимость у = ах + Ъ и т. п. Во всех формулах х — аргумент, у — значение функции, а, Ъ, с — параметры функций.
2. С помощью метода наименьших квадратов (МНК) по имеющимся статистическим данным найти значения величин о, Ъ, с, определяющих конкретный вид принятой зависимости.
Полученная аналитическая зависимость называется регрессионной моделью.
MS Excel позволяет построить регрессионную модель по статистическим данным и получить значение коэффициента детерминированности (достоверности) R2 (КД). КД определяет, насколько удачной является полученная регрессионная модель. КД принимает значения от 0 до 1. Если он равен 1, то функция точно проходит через табличные значения, если 0, то выбранный вид регрессионной модели совсем неудачен. Чем R2 ближе к 1, тем удачнее модель.
Алгоритм построения регрессионной модели:
1. Выделить обе колонки исходных данных (наборы X и Y).
2. Вызвать Мастер диаграмм.
3. Построить Точечнуюдиаграмму.
4. Для полученной диаграммы выбрать команду Добавить линию тренда(из текстового меню Диаграммаили контекстного меню для любой точки диаграммы).
Тренд — это график регрессионной модели (от англ. trend — тенденция).
5. Выбрать, например, линейную линию тренда. Перейти к вкладке Параметры.
6. В открывшемся диалоговом окне параметров выбрать опции: показывать уравнение на диаграммеи поместить на диаграмму величину достоверности аппроксимации (R/2).
7. На экране появится линия тренда, уравнение с числовыми параметрами и коэффициент R2.
8. Проанализировать линию тренда (как часто ее точки совпадают с точками точечной диаграммы) и значение R2 и повторить построение регрессионной модели для других видов аналитических зависимостей.
9. Выбрать из полученных регрессионных моделей ту, которая имеет наибольшее значение R2.
Дата добавления: 2016-02-16; просмотров: 5792;