Static and dynamic models in the form of the equation of regression

Plan

• elements of the theory of dispersion analysis, statistical Estimate of distribution parameters of random variables and check of statistical hypotheses,

• Dispersion analysisis applied to a research of influence of one or several qualitativevariable (factors) on one dependent quantitative variable (response).

• Time seriesanalysis is applicable to single or connected time series and allows to selectdifferent forms of periodicity and interference of temporal processes, and also to realize prediction of future behavior of a time series.

Лекция 5. Статические и динамические модели в виде уравнения регрессии (гл. 3)

План

• элементы теории дисперсионного анализа, статистическая оценка параметров распределения случайных величин и проверка статистических гипотез,

• Дисперсионный анализ применяется к исследованию влияния одного или нескольких качественных переменных (факторов) на одной зависимой переменной количественной (ответ).

• Анализ временных рядов применима к одному или подсоединенного временных рядов и позволяет выбирать различные формы периодичности и интерференции временных процессов, а также реализовать предсказание будущего поведения временного ряда.

• Regression procedures allow to calculate the model described by some equation and reflecting the functional dependence between the experimental quantitative variables and also check a hypothesis of adequacy of model to the experimental data. By the received results it is possible to evaluate the nature and a level of dependence of variables and to predict new values of dependent variable.

• Correlation analysisis a group of statistical techniques directed to detection andmathematical representation of structural dependences between selections.

• Cluster analysisrealizes partition of objects on the given number of the classes deletedfrom each other, and also builds a tree of classifications of objects by means of hierarchical combining them in groups (clusters).

• процедуры регрессии позволяют рассчитать модель, описанную некоторым уравнением и отражает функциональную зависимость между экспериментальными количественных переменных, а также проверить гипотезу адекватности модели экспериментальным данным. По полученным результатам можно оценить характер и степень зависимости переменных и предсказать новые значения зависимой переменной.

• анализ корреляции является группа статистических методов, направленных на выявление и математическое представление структурных зависимостей между выборами.

• Кластерный анализ реализует разбиение объектов на заданное число классов, удаленных друг от друга, а также строит дерево классификаций объектов с помощью иерархических, сочетающих их в группы (кластеры).

• The main objective of factor analysis is finding in multivariate space of primary variables (which values register in an experiment), the reduced system of secondary variable (factors).

• Methods of quality control are intended for monitoring of the released production for the purpose of detection of violations and bottlenecks in the organization of production and in the technological processes carrying to decline in quality of production. Dispersion analysis is applied to a research of influence of one or several qualitative variable (factors) on one dependent quantitative variable (response).

• Основная задача факторного анализа является нахождение в многомерном пространстве первичных переменных (значения которых регистр в эксперименте), приведенная система вторичных переменных (факторов).

• Методы контроля качества предназначены для контроля выпускаемой продукции с целью выявления нарушений и узких мест в организации производства и технологических процессов, несущих к снижению качества продукции. Дисперсионный анализ применяется к исследованию влияния одного или нескольких качественных переменных (факторов) на одной зависимой переменной количественной (ответ).

Main objective of dispersion analysis(ANOVA) is the research of the significance ofdistinction between averages by means of comparing (analysis) of dispersions. Division of the general dispersion into several sources, allows to compare the dispersion caused by distinction between groups to the dispersion caused by intra group variability. In case of truth of a null hypothesis (about equality of averages in several groups of the observations selected from population), Estimate of the dispersion connected to intra group variability shall be the close to Estimate of intergroup dispersion.

Основная цель анализа дисперсии (ANOVA) является исследование значимости различия между средними с помощью сравнения (анализ) дисперсий. Разделение общей дисперсии на несколько источников, позволяет сравнить дисперсию, вызванную различием между группами к дисперсии, вызванной изменчивостью внутри группы. В случае истинности нулевой гипотезы (о равенстве средних в нескольких группах наблюдений, выбранных из населения), Оценка дисперсии, связанной с изменчивостью внутри группы должны быть близки к Эстимейт дисперсии межгрупповых.

Dispersion analysis concerns to group of parametric methods and therefore it should be applied only when it is proved that distribution is normal.

Dispersion analysis is used if the dependent variable is measured in a scale of the relations, intervals or an order, and the influencing variables have the non-numerical nature (a scale of names).

One-factor dispersion analysis is used for check of a hypothesis of likeness of mean values of two or more selections belonging the same general set. This method extends also to tests for two averages (to which the t-criterion belongs, for example).

Дисперсионный анализ используется, если зависимая переменная измеряется в шкале отношений, интервалов или порядка, и влияющие переменные имеют нечисловой природы (шкала наименований).

Дисперсионный анализ Один-фактор используется для проверки гипотезы о сходстве средних значений двух или более выборов, принадлежащих той же общей набор. Этот метод распространяется также на тесты для двух средних (к которым Т-критерий относится, например).

Theoretical bases.The research of influence of these or those factors on variability of meanvalues also is the task of dispersion analysis.

Dispersion analysis consists in separation and Estimate of the separate factors causing variability of the studied random variable. Expansion of summary selective dispersion on the components caused by independent factors is for this purpose made.

To define whether significantly influence of this factor it is necessary to estimate the significance of the appropriate selective dispersion according to dispersion of the reproducibility caused by arbitrary factors.

Let's assume that the result of an experiment depends on some single factor A which accepts n of different values (n-quantity of series of experiences). For each series of experiments m of repeated observations which results can be written in the following look is made:

Теоретические основы. Исследование влияния тех или иных факторов на изменчивость средних значений также является задача анализа дисперсии.

Дисперсионный анализ заключается в разделении и оценка отдельных факторов, вызывающих изменчивость изучаемой случайной величины. Расширение суммарной выборочной дисперсии на компонентах, вызванных независимыми факторами для этой цели сделал.

Для того, чтобы определить, будут ли оказать существенное влияние этого фактора является необходимым оценить значение соответствующей селективной дисперсии в соответствии с дисперсией воспроизводимости, вызванной произвольными факторами.

Давайте предположим, что результат эксперимента зависит от какого-либо одного фактора А, который принимает п различных значений (п-количества серий опытов). Для каждой серии экспериментов м повторных наблюдений, результаты которых могут быть записаны в следующем взгляде сделан:

Y11 Y12 Y13...	Y1m
Y21 Y22 Y23...	Y2m
Y31 Y32 Y33...	Y3m
...............
Yn1 Yn2 Yn3...	Ynm

On the basis of the obtained statistical data it is required to check a hypothesis of equality of population means for each concrete series. If the checked hypothesis is right, then value arithmetic averages for all series practically don't differ from each other, otherwise the estimated hypothesis has to be rejected.

Let's designate through Y_i average i-y value of a series of experiences, and through the general average value for all observations:

На основе полученных статистических данных требуется проверить гипотезу о равенстве населения означает для каждой конкретной серии. Если проверяемая гипотеза верна, то ценят среднеарифметические для всех серий практически не отличаются друг от друга, в противном случае предполагаемая гипотеза должна быть отвергнута.

Обозначим через Yi среднем я-й величины серии опытов, а через общее среднее значение для всех наблюдений:

j ⁼

^Че^Y ji

(5.1)

i =1

ее

^Y ji

m Ч n

j =1i =1

м n m

(5.2)

ее

2 п

Q =

(Y - Y)

_пее

(Y - Y )

m Ч

(Y - Y )

iji

i=1 j=1

оi=1 j=1

i=1

The essence of the dispersive analysis consists in decomposition of the sum of squares of deviations of separate Yij from the general average for two sums:

Q - defines the general deviation of value of each experience (Yij) from an average; QA - characterizes the dispersion caused by a factor A (expression secondly braces);

Qoст - characterizes the dispersion caused by casual hindrances (expression in the first braces).

Having divided the sums of squares of deviations into the corresponding degrees of freedom we will receive the following dispersions:

Суть дисперсионного анализа состоит в разложении суммы квадратов отклонений отдельного Yij от общего среднего для двух сумм:

Q - определяет общее отклонение значения каждого опыта (Yij) от среднего; QA - характеризует дисперсию, вызванную фактора А (выражение, во-вторых фигурные скобки);

Qoст - характеризует дисперсию, вызванную случайными помехами (выражение в первых фигурных скобках).

Разделив суммы квадратов отклонений в соответствующих степеней свободы мы получим следующие дисперсии:

σ² = Q/f
σ_А²= Q_A/f₁	(5.3)
σ_ОСТ² = Q_ост/f²

Number of degrees of freedom of f = m·n-1 f1 = n - 1 f2 = n·(m-1)

Carrying out the dispersive analysis consists in comparison of estimates σ_А² и σ_ОСТ². If the hypothesis that population means for each series are equal is right, then σ_А² shouldn't significantly превышатьσОСТ2 that is checked by Fischer's criterion:

Количество степеней свободы F = м · N-1 f1 = п - 1 2 = п · (м-1)

Проведение дисперсионного анализа заключается в сравнении оценок σА2 и σОСТ2. Если гипотеза, что означает, что население для каждой серии равны правильно, то σА2 не должен значительно превышатьσОСТ2, что проверяется по критерию Фишера:

	/σОСТ		(5.4)
F = σ_А

If F < Fkp, then distinction between σ_А² and σ_ОСТ² can consider insignificant, i.e. influence of the factor is comparable with casual hindrances.

If F> Fkp, then distinction between σ_А² and σ_ОСТ² is essential, i.e. the factor A renders influence on output value.

Если F <ФКП, то различие между σА2 и σОСТ2 можно рассматривать незначительным, т.е. влияние фактора сравнима со случайными помехами.

Если F> ФКП, то различие между σА2 и σОСТ2 имеет важное значение, т.е. множитель А оказывает влияние на выходное значение.

Fkp value is determined by quantiles of distribution of Fischer, at significance value α

("alpha") and to degrees of freedom of f1 and f2:

Fkp = f (α, f1, f2)

Значение ФКП определяется квантилей распределения Фишера, по значимости значение альфа

("Альфа") и степеней свободы f1 и f2:

FKP = F (α, f1, f2)

Дата добавления: 2017-05-18; просмотров: 661;