Распределения, связанные с нормальным

 

 

  1. Распределение -квадрат (хи - квадрат)

Опр.: Пусть случайные величины распределённые как N(0, 1).

Говорят, что случайной величине , определённая как:

имеет распределение

 

хи – квадрат с n степенями свободными.

Ясно, что (для ) с вероятностью 1 принимает положительные значения. Функция плотности в точке x(x>0) равна :

 

Свойство:

 

График:

 

y

n=1

0,6

n=2

0,4

 
 


n=3

0,2

n=8

X

1 2 5 10 15

Применение: Критерии согласия

Критерии согласия используются для проверки того, удовлетворяет ли рассматриваемая случайная величина данному закону распределения.

Критерий согласия Пирсона ( -критерий) служит для проверки гипотезы но о том, что

где - истинное распределение случайной величины y.

- гипотетическое распределение.

Статистическая гипотеза – это утверждение относительно значений одного или более параметров распределений некоторой величины или о самой форме распределения. Обычно выбирают две исходные гипотезы: основную - , и альтернативную ей .

Статистическая проверка гипотезы – это процедура выяснения, следует ли принять основную гипотезу или отвергнуть её. Если в результате проверки гипотеза ошибочна отвергается (в то время как она верна), то имеет место ошибке 1-го ряда (характеризующая более тяжелыми последствиями); если гипотеза принимается при истинности - ошибке 2-го ряда. Вероятности ошибок I и II ряда ( и ) зависят от критерия, на основании которого будет выбираться одна из гипотез. Очевидно, что вероятности этих 2-х ошибок взаимосвязаны, то есть чем больше значение , тем меньше , и наоборот.

Обычное решение этой дилеммы состоит в том, что выбирают некоторое фиксированное значение (как правило, 0.05, 0.1, 0.001) и надеются что будет также мало. Значение - наз -уровнем значимости.

Для выбранного значения определяется так называемая критическая область , удовлетворяющая значению

Где Z-контрольная величина (критерий), представляющая собой некоторую функцию от выборки (результатов эксперимента).

Проверки гипотезы состоит в следующем. Производится выборка (эксперимент), на основании чего вычисляется Z-частное значение критерия Z. Если , то от гипотезы отказывается. Если Z не принадлежит B, то говорят, что полученные наблюдения не противоречат принятой гипотезе. Разумеется, прежде чем выдвинется

Гипотезу относительно значений параметров распределения, необходимо определить вид самого закона распределения. Наиболее распространённый на практике и достаточно эффективный метод подбора закона распределения, основан на графическом представлении экспериментальных данных. Оси отображаются в виде гистограммы относительных частот:

  1. Вычисляется величина класса гистограммы: d=
  2. Определяется число попаданий значений y в i -й интервал
  3. Вычисляется относительная частота попаданий наблюдаемой переменной в каждый класс: , где -число попаданий в i -й интервал. N-объём выборки.
  4. На каждом i-м интервале строится прямоугольник со сторонами .Сумма .

При использовании -критерии поступают следующим образом: Вычисляется контрольная величина : , где -число значений ,попавших в й класс.

теоретическая вероятность для попадание значения в й класс.

Затем по таблице -распределений исходит критическое значение для уровня значимости и степеней свободы.

Основной вывод :

Если ,то гипотеза отвергается.

равномерно распределёнными

-распределение Релея.

Нормальное распределение M=0 D=

 

или

 

Лекция 3

Проверка статистических гипотез.

Основной задачей имитационного моделирования систем является подбор законов

распределения на основе статистических данных, полученных в результате эксперимента. В

основе процедуры отыскания закона распределения некоторой величины по экспериментальным данным лежит проверка статистических гипотез.

Опр. Статистическая гипотеза – утверждение относительно значений одного или боле параметров распределение некоторой величины или о самой форме распределения.

Обычно выбирают две исходные гипотезы:

основную - H и

альтернативную ей – H

Опр. Статистическая проверка гипотезы – процедура выяснения, следует ли принять основную гипотезу H или отвергнуть ее.

Если в результате проверки гипотеза H ошибочно отвергается, то имеет место ошибка 1-го рода ( характеризующаяся более тяжелыми последствиями ); ели гипотеза H принимается при истинности H - совершается ошибка 2-го рода.

Вероятности ошибок 1 и 2 рода ( и ) зависят от критерия, на основании которого будет выбираться одна из гипотез. Очевидно, что вероятности этих двух ошибок взаимосвязаны, то есть чем больше значение , тем меньше , и наоборот.

Обычное решение этой дилеммы состоит в том, что выбирают некоторое фиксированное значение ( как правило, небольшое – 0.05, 0.1, 0.001 – т.к. это вероятность отвергнуть H , в то время как она, на самом деле, верна ) и надеются, что будет так же мало. Фиксированное значение называется уровнем значимости.

Для выбранного значения определяется так называемая критическая область В, удовлетворяющая условию:

 

P( Z B| H верна ) ,

 

Где Z - контрольная величина ( критерий ), представляющее собой некоторую функцию от выборки ( результатов эксперимента ). Проверка гипотезы сводится к следующему. Производится выборка ( эксперимент ), на основании чего вычисляется Z - частное значение критерия Z . Если Z B, то от гипотезы H отказываются. Если Z B то говорят, что полученные наблюдения ( экспериментальные данные ) не противоречат принятой гипотезе.

Разумеется, прежде чем выдвигать гипотезу относительно значений параметров распределения, необходимо определить вид самого закона распределения. Наиболее распространенный на практике и достаточно эффективный метод подбора закона распределения основан на графическом представлении экспериментальных данных в виде гистограммы.

Методика построения гистограммы.

  1. Вычисляется величина интервала гистограммы:

 

d = , где (y - y ) – диапазон изменений наблюдаемой переменной,

n-число интервалов

 

2. Определяется число показаний значений y в i -й интервал.

  1. Вычисляется относительная частота попаданий наблюдаемой переменной в каждый интервал:

G = ,где R - число попаданий в i-й интервал

N - число наблюдений (объем выборки).

4. На каждом i-м интервале строится прямоугольник со сторонами d*G . Сумма площадей прямоугольников *G = 1.Для наиболее часто используемых статистических гипотез разработаны критерии, позволяющие проводить их проверку с наибольшей достоверностью:

t - критерий ( Стьюдента ).

Этот критерий используется для проверки гипотезы о равенстве средних значений 2–х нормально распределенных случайных величин X и Y в предложении, что дисперсии их равны, хотя и неизвестны. Сравниваемые выборки могут иметь равный объем.

В качестве критерия используют величину Т:

 

 

 
 

Величина Т подчиняется распределению Стьюдента. Критическое значение для t –критерия определяется по таблице для выбранного значения и числа степеней свободы . Если вычисленное по указанной формуле значение Т удовлетворяет неравенству - критерию, то гипотезу отвергают.

По отношению к предложению о «нормальности распределения» величин x и y t-критерий не очень чувствителен. Его можно применять, если распределение одномодальны и не слишком асимметричны.

 

F-критерий (Фишера)

 

Этот критерий служит для проверки гипотезы о равенстве дисперсий и при условии, что x и y распределены нормально.

(Гипотезы такого рода имеют большое практическое значение, т.к. дисперсия есть мера таких характеристик, как погрешности измерительных приборов, точность технологических процессов и т.д.) В качестве контрольной величины используется отношение дисперсий (или - большая дисперсия должна быть в числителе). Величина F подчиняется F-распределению (Фишера) с ( ) степенями свободы, где . Проверка гипотезы состоит в следующем.

Для величины и величины по таблице F – распределения выбирают значения . Если f, вычисленное по выборке, больше этого критического значения ( ), то гипотеза о равенстве дисперсий должна быть отклонена с вероятностью ошибки .

 

Критерий согласия.

Критерии согласия используются для проверки того, удовлетворяет ли рассматриваемая случайная величина данному закону распределения. Критерий согласия (хи – квадрат - Пирсона) служит для проверки гипотезы о том, что где - истинное распределение случайной величины y, - гипотетическое распределение.

Проверка производится следующем образом.

1. Область значений случайной величины y разбивается (произвольно) на к непересекающихся множеств («классов»).

2. В результате n опытов формируется выборка .

3. Вычисляется контрольная величина .

, где

- число значений y, попавших в i-й класс.

- теоретическая вероятность для попадания значения y, в i-й класс (гистограммы).

4. По таблице - распределений находят критическое значение для уровня значимости и степеней свободы.

Если , то гипотеза о - функции распределения отвергается.

 

Критерий Колмогора-Смирнова.

Имеющееся выборка упорядочивается по возрастанию и строится эмпирическая функция распределения:

.

Контрольной величиной является следующая:

Гипотеза отвергается, если вероятность попадания соответствующего критерия в критическую область оказывается меньше выбранного уровня значимости .

Критическое значение критерия, как и в предыдущих случаях, находят по таблицам.

 

Модуль2

Dim q(1 To 15) As Single

Dim a As String

Dim b(1 To 15, 1 To 15) As String

Dim n1(1 To 15, 1 To 15) As Single

Sub Test_Tau ()

Dim i1 As Integer

Dim j1 As Integer

' j1 10 'размерность

' i1 15 'количество точек размерности j1

Call LP_tau_15_Dim

for j1= 1 To 10

For i1 = 1 To 15

Call TauCoord(i1,j1)

'For ns= 1 To j1

'For j2 = 1 To ns

‘Worksheets(1) .Cells(i1 +15+ (ns-1), j2).Formula = q(ns)

'Next j2

'Next ns

'Call Prin_List(j1)

Next i1

Next j1

End Sub

Sub LP_tau_15__Dim()

a= "00001000010000100001000010000100001000010000100001"+ _

"0000100001000010000100001" + _

"00001000030000500015000170005100085002550025700771"+ _

"0128503855043690310721845" + _

"00001000010000700011000130006100067000790046500721"+_ "0082304091041250414128723" +_

“00001000030000700005000070004300049001470043901013”+_

“0072700987058890691516647”+_

"00001000010000500003000150005100125001410017700759”+_ "0026701839069291624116565”+_

"00001000030000100001000090005900025000890032100835"+ _

"0083304033039131164318777"+ _

"00001000010000300007000310004700109001730018100949”+_

“0047102515062110214703169”+_

"00001000030000300009000090005700043000430022500113”+_

"0160100579017310119707241”+_

"00001000030000700013000030003500089000090023500929”+ _

''0134103863013470441705087"+_

"00001000010000500011000270005300069000250010300615"+_

“0091300977061971465102507”+_

For k = 1 To 10

Fоr j = 1 To 15

b(k, j) = Mid(a, 75 * (k - 1) + 5 (j - 1) + 1, 5)

n1(k,j)= Val(b(k, j))

Next j

Next k

End Sub

Sub TauCoord (i, n)

'i- номep точки, n-размерность

aa = i

m = 1 + int(Log(aa) / 0.693147)

For j = 1 To n

s = 0

for k = 1 To m

n2 = 0

For 1 = k To m

Bb= n1(j. 1)

‘m=MsgBox(bb,3,”bb=”)

n2=n2+int(2*fnd(aa/2*1))*int(2*fnd(bb/2^(1+1-k)))

Next f

‘m=MsgBox(m2,3,”m2=”)

s=s+fnd(0.5*n2)/(2^(k-1))

Next k

q(j)=s

Next j

‘jk1=MsgBox(i,3,”номер точки=”)

‘jk1=MsgBox(n,3,”размерность=”)

for l1 = 1 To n

for j2 = 1 To l1

‘Worksheets(1) .Cells(i, j2).Formula = q(j2)

Next j2

‘Next ns

‘jk1=MsgBox(l1,3,”порядковый номер координаты l1=”)

‘jk1=MsgBox(q(l1),3,”координата q=”)

Next l1

End Sub

Function fnd(x)

zn=x-Int(x)

fnd=zn

‘n=MsgBox(zn,3,”zn=”)

End Function

Sub Prin_List (j1)

For kt= 1 To 10

For ns = 1 To j1

For j2 = 1 To ns

Worksheets(1) .Cells(kt +10* (ns-1), j2).Formula = q(ns)

Next j2

Next ns

Next kt

End Sub

 

Sub optimization()

Dim q As Integer

Dim n As Integer

Dim m As Integer

20 MsgBox (“КОМПЛЕСНЫЙ МЕТОД”)

40 Rem ФУНКЦИЯ Z-F (X1,X2,…,XN)ВЫЧЕСЛЯЕТСЯ В СТРОКЕ 5000

60 Rem Вычисление значений G1,G2,…,GN И ПРОВЕРКА

65 Rem ОГРАНИЧЕНИЙ ПРОИЗВОДИТСЯ В СТРОКЕ 6000

80 q InputBox (“ВВЕДИТЕ КОЛИЧЕСТВО ПЕРЕМЕННЫХ”):n=Cint(q): Worksheets.Cells(3,4), Formula=n

100 q InputBox (“ВВЕДИТЕ КОЛИЧЕСТВО ПЕРЕМЕННЫХ”):n=Cint(q): Worksheets.Cells(2,4), Formula=m

120 ReDim X(n), Y(n), L(n), U(n), XC(n), XO(n), XR(n), XH(n)

160 K=2*n:PP=0

180 ReDim C(1 To K, 1 To n), F(K), G(m), IC(m), EC(2*n)

200 For J=1 To n: q=InputBox(“ВВЕДИТЕ НАЧАЛЬНЫЕ ЗНАЧЕНИЯ”): X(J)=CSng(q):C(1,J)=X(J):XC(J)=X(J):Next

240 Rem ПРОЧИТАТЬ ЗНАЧЕНИЯ НИЖНИХ И ВЕРХНИХ ГРАНИЦ

260 For J=1 To n: L(J)= Worksheets(1).Cells(n,3): U(J)= Worksheets(1).Cells(n,4): Next

280 Rem ВКЛЮЧИТЬ ГЕНЕРАТОР СЛУЧАЙНЫХ ЧИСЕЛ

290 q InputBox(“ВВЕДИТЕ Х”) :X1=CSng(q)

500 I=1

520 GoSub 5000

540 F(1)=Z

600 I=I+1

620 For J=1 To n: C(LJ)=L(J)+1(U(J)-L(J)):X(J)=C(LJ):Next

640 IM=1: GoSub 6000

660 IfIC1= 1 To GoTo 720

670 Rem ОБНОВИТЬ ЗНАЧЕНИЯ “ЦЕНТРА ТЯЖЕСТИ”

680 For J=1 To n: XC(J)=((I-1)*XC(J)+C(I,J))/I:Next

700 GoTo 760

720 For J=1 To n: C(I,J)=(C(I,J)+XC(J))/2:X(J)=C(I,J):Next J

740 GoTo 640

760 GoSub 5000: F(I)=Z

780 If I< K Then GoTo 600

790 Rem УПОРЯДОЧИТЬ ЗНАЧЕНИЯ ФУНКЦИИ И ТОЧКИ

795 Rem В КОТОРЫХ ОНА ВЫЧЕСЛЕНА

800 For J=1 To K-1

820 For I=1 No K

840 If F(J)<=F(J) Then GoTo 900

860 F1=F(I):F(J)=F(I):F(I)=F1

880 For L1=1 To n: Y(L1)=C(J,L1):C(I,L1)=C(I,L1): C(I,L1)=Y(L1):Next L1

900 Next I: Next J

910 Rem ЗАПОМНИТЬ НАИМЕНЬШЕЕ ЗНАЧЕНИЕ ФУНКЦИИ

920 FM=F(1)

1000 MsgBox(“Первая точка”)

1020 MsgBox(F(1)“МИНИМАЛЬНОЕ ЗНАЧЕНИЕ”)

1040 MsgBox(“МИНИМАЛЬНАЯ ТОЧКА”)

1060 For L1=1 To n: Worksheets(1.Cells(6.L1).Formula: C(1,L1):Next L1

1100 Rem ЗАДАТЬ КОЭФФИЦИЕНТ ОТРАЖЕНИЯ

1120 A=1.3

1190 Rem ОПРЕДЕЛИТЬ “ЦЕНТР ТЯЖЕСТИ” НАИЛУЧШИХ (К-1) ТОЧЕК

1195 Rem И ЗАПОМНИТЬ НАИХУДШУЮ ТОЧКУ

1200 For LI - 1 To n: XH(L1) = C(K,L1): XO(Ll) = (K* XC(L1) - XH(L1)) / (K - I): Next LI

1390 Rem Получить отраженную точку

1400 For L1=1 To n: XR(L1) = (1 +A) * XO(L1) - A * XH(L1): X(L1) = XR(L1): Next L1

1490 Rem ПРОВЕРИТЬ, ДОПУСТИМА ЛИ НОВАЯ ТОЧКА

1500 IM=0

1520 GoSub 6000

1540 If EC1 = 0 And IC1 = 0 Then GoTo 2000

1550 Rem ЕСЛИ ТОЧКА ЯВЛЯЕТСЯ ДОПУСТИМОЙ, ТО ПЕРЕЙТИ К СТРОКЕ 2000

1555 Rem ПОМЕСТИТЬ ТОЧКУ ВНУТРЬ ГРАНИЦ

1600 If EC1=0 Then GoTo 1800

1610 Rem ЕСЛИ ЯВНЫЕ ОГРАНИЧЕНИЯ НАРУШЕНЫ, ТО

1615 Rem ПОМЕСТИТЬ ТОЧКУ ВНУТРЬ ГРАНИЦ

1620 For J = 1 To n

1640 If EC(J) = 1 Then XR(J) = L(J) + 0.00001: X(J) = XR(J)

1660 If EC(J+n) = 1 Then XR(J) = U(J) - 0.00001: X(J) = XR(J)

1680 Next J

1800 If IC1 = 0 Then GoTo 2000

1810 Rem ЕСЛИ НЕЯВНЫЕ ОГРАНИЧЕНИЯ НАРУШЕНЫ, ТО

1815 Rem ТО ПЕРЕМЕСТИТЬСЯ НА ПОЛОВИНУ РАССТОЯНИЯ К “ЦЕНТРУ ТЯЖЕСТИ”

1820 For L1 = 1 To n: XR(L1)=(XR(L1)+X0(Ll))/2: X(L1) = XP(L1): NextL1

1840 GoTo 1490

2010 Rem ЕСЛИ НОВОЕ ЗНАЧЕНИЕ - НАИХУДШЕЕ,

2015 Rem ТО ПЕРЕМЕСТИТЪСЯ НA ПОЛОВИНУ РАССТОЯНИЯ К ТОЧКЕ ХО

2018 Rem И ВЫЧИСЛИТЬ НОВОЕ ЗНАЧЕНИЕ ФУНКЦИИ

2020 If FR< F(K) Then GoTo 2400

2040 For L1=1 To n: XR(L1) = (XR(L1) +XO(L1))/2: X(L1) - XR(L1): Next L1

2060 GoTo1490

2400 Rem ОБНОВИТЬ Х0 И ЗАМЕНИТЬ НАИХУДШУЮ ТОЧКУ НОВОЙ ТОЧКОЙ

2410 F(K) =FR '

2420 For L1 =1 To n

2440 XC(L.1) = К * XC(Ll) - C(K,L1)+ XR(L1)

2460 XC(L1)=XC(L1)/K:C(K,Ll)=XR(Ll)

2480 Next L1

2490 Rem УПОРЯДОЧИТЬ. ЗНАЧЕНИЯ ФУНКЦИИ И ТОЧКИ,

2493 Rem В КОТОРЫХ ОНА ВЫЧИСЛЕНА

2500 For J=1 To K-1

2520 For I=J + 1 To К

2540 If F(J)<=F(I) Then GoTo 2600

2560 F1=F(J):F(J)=F(I):F(I)=F1

2580 For L1=1 To n: Y(L1)= C(J, L1) :C(J,L1)=C(I, L1): C(I, L1) = Y(L1): Next L1

2600 Nex I: Next J

2610 Rem ЕСЛИ НАИМЕНЬШЕЕ ЗНАЧЕНИЕ ФУНКЦИИ УМЕНЬШЕНО,

2615 Rem ВЫСТАВИТЬ ПРИЗНАК ПЕЧАТИ'

2620 If F(1)<FM Then PP=1

2630 Rem ЕСЛИ УМЕНЬШЕНИЕ ФУНКЦИИ НЕ ОБНАРУЖЕНО,

2633 Rem ПРОВЕРКА КРИТЕРИЯ ЗАВЕРШЕНИЯ ПОИСКА МИНИМУМА НЕ ПРОИЗВОДИТСЯ

2640 If PP=0 Then GoTo 1190

2990 Rem НАЙТИ ОТКЛОНЕНИЕ ЗНАЧЕНИЙ ФУНКЦИИ

3000 S1 = 0: S2 =0

3020 For I=1 To K:S1=S1+F(I):S2=S2+F(I)*F(I): Next I

3040 SD= S2-S1*S1/K:SD=SD/K

3080 Rem НАЙТИ МАКСИМАЛЬНОЕ РАССТОЯНИЕ

3095 Rem ТОЧКАМИ КОМПЛЕКСА

3100 DM=0

3120 For I=1 To K-1: For J=I+1 To K

3140 D=0

3160 For L1=1 To n: D=D+C(I,L1)-C(J,L1)^2: Next L1

3180 D=Sqr(D)

3200 If D> DM Then DM=0

3220 Next J: Next I

3400 If PP=0 Then GoTo 3790

3500 MsgBox(“НОВАЯ ТОЧКА В СТРОКЕ 3500”)

3520 MsgBox(“МИНИМАЛЬНОЕ ЗНАЧЕНИЕ”=F1)

3540 MsgBox(“ТОЧКА МИНИМУМА”)

3560 For L1=1 To n: Worksheets(1).Cells(L1,9)=C(1,L1):Next L1

3600 FM=F(1):PP=0

3790 Rem ПРОВЕРКА СХОДИМОСТИ

3800 If SD>0.000001 And DM>0.0001 Then GoTo 1190

4000 MsgBox(“МИНИМУМ НАЙДЕН”)

4020 MsgBox(“ТОЧКА МИНИМУМА”)

4040 For L1=1 To n: Worksheets(1).Cells(L1,10)=C(1,L1):Next L1

4060 Worksheets(1).Cells(9,1)=F(1)

4100 End

5000 Z=-X(1)*X(2)*X(3)+3300

5050 fe=fe+1

5100 Return

6000 For ii= 1 To 2*n: EC(ii)=0:Next ii: EC1=0

6020 For ii= 1 Tom: IC(ii)=0:Next ii: IC1=0

6050 If IM= 1 Then GoTo 7100

6090 Rem ПРЕДЫДУЩАЯ СТРОКА ПРЕДНАЗНАЧЕНА ДЛЯ ПРОВЕРКИ НЕРАВЕНСТВА

6095 Rem GI(x)<=BI

6100 For ii= 1 No n

6120 If X(ii)<L(ii) Then EC(ii)=1: EC1=1

6140 If X(ii)>U(ii) Then EC(n+ii)=1: EC1=1

6160 Next ii

7100 G(1)=X(1)+3*X(2)+2*X(3)

7110 If G(1)=X(1)>72 Then IC(1)=1:IC=1

8000 Return

9000 ‘data 0,20,0,11,0,42

End Sub

 

Лекция 4








Дата добавления: 2018-06-28; просмотров: 574;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.188 сек.