Гипергеометрическое распределение случайных величин.
Важной особенностью рассмотренных дискретных распределений является то, что вероятность успеха остается постоянной в процессе испытаний, что соответствует эксперименту для независимых событий, когда шар снова возвращается в урну. Вероятность остается постоянной, даже тогда когда мы не возвращаем шар в урну, когда в ней имеется большое число шаров. В этом случае не возвращение нескольких шаров, после взятия из урны приведет к бесконечно малому изменению пропорций среди остающихся шаров. Однако если эксперимент осуществляется с небольшим количеством шаров и без возвращения после каждого опыта шара в урну, то очевидно, что вероятность появления успеха изменяется после каждого опыта. В этом случае эксперимент называется выбором без возвращения, и распределение исходов опыта описывается дискретным гипергеометрическим распределением.
Предположим, что рядом с крупным месторождением железных руд обнаружены десять гравимагнитных аномалий. Из литературных источников, описывающих рудные поля, сходные с нашим полем, известно, что только 40% подобных аномалий имеют рудную природу, то есть их источником являются залегающие на глубине магнетитовые руды. Однако у горнорудной корпорации в данный момент нет финансовых возможностей для осуществления проверки природы всех аномалий расположенных рядом с данным месторождением. В этом случае для расчета вероятности успеха может быть использовано гипергеометрическое распределение, так как подтверждение рудной природы у одной из аномалий уменьшает вероятность подтверждения этой природы у других аномалий и наоборот неподтверждение рудной природы у одной из аномалий увеличивает вероятность того, что оставшиеся аномалии имеют рудную природу. События, в которых частота появления одного исхода позволяет предсказать частоту появления другого исхода, называются взаимоисключающими друг друга. Для вычисления гипергеометрической вероятности используется левая часть формулы биноминального распределения, отвечающая за расчет количества комбинаций при проведении опыта и формула Байеса, то есть вычисления сводятся к произведению всех возможных комбинаций внутри совокупности по отношению к общему количеству залежей и скважин.
P = [(SX)*(N-Sn-x)]/(Nn)
Эту формула говорит, что мы рассчитываем вероятность x подтверждений рудной природы, при заверочном бурении n скважин, если мы делаем выборку из совокупности в N аномалий, из которых S аномалий предположительно имеют рудную природу. Если в текущем финансовом цикле мы имеем возможность заверить только 3 аномалии из 10, то по этой формуле можем рассчитать вероятности успеха или неуспеха при проведении данного опыта.
Какова вероятность того, что программа из трех скважин потерпит полный провал, то есть не одна из скважин не подтвердит рудную природу выбранных случайным образом трех гравимагнитных аномалий?
P = [(40)*(63)]/(103) = 0.167
В этом случае вероятность полного провала программы составляет 17%.
Какова вероятность того, что одна из трех скважин подтвердит рудную природу соответственно в одной из трех выбранных аномалий?
P = [(41)*(62)]/(103)=0.50
Вероятность, того, что будет подтверждена рудная природа у одной из выбранных случайным образом для заверки аномалий, равна 50%.
Можно посчитать все возможные варианты и построить гистограмму распределения вероятностей успехов, но ясно, что вероятность успеха в целом равна 83%, что следует из равенства 100% – 17% (вероятность неудачи) = 83% (вероятность удачи).
Лекция 5.
Дискретные распределения мы рассматривали в основном при фиксированном количестве испытаний, так в случае биноминального распределения мы считали, как распределяются вероятности комбинаций гербов и не гербов при трех бросаниях монеты, а что произойдет, если мы увеличим количество испытаний. Можно рассчитать вероятность заданного количества успехов (например, гербов) в 10, 15, 25, 50 бросаниях монеты. Эти вероятности давно рассчитаны и находятся в таблицах биноминального распределения, но так же легко они могут быть вычисленными на калькуляторе или при помощи небольшой компьютерной программы. Однако, при любом количестве испытаний, любая из возможных комбинаций обязательно осуществится на все 100%, поэтому площадь под графиком распределения всегда будет равна 1. А если число бросаний будет увеличиваться, то ширина столбиков будет все меньше и меньше и, в конце концов, вместо столбиков гистограмму можно изобразить плавной непрерывной кривой. В эксперименте бросания монеты мы имеем дело с дискретными исходами эксперимента, однако, в большинстве экспериментов на природных объектах, результаты не являются дискретными. В этом случае, как отмечалось ранее, при подсчете частот учитываются не отдельные значения, а количество чисел, попадающих в намеченные интервалы. Еще одно важное отличие дискретных величин от непрерывных, это то, что дискретные величины можно измерить с абсолютной точностью в отличие от непрерывных величин. В первую очередь это связано с тем, что при измерении свойств у природных объектов в подавляющем большинстве используются приборы, в которых уже заложены ограничения точности измерения, мы знаем, что чем совершеннее прибор, тем выше точность измерения, произведенная им. При повторных измерениях одного и того же свойства природного объекта всегда возникают отклонения малой величины, однако они связаны не только с точностью измерения прибором, но и с изменениями в условии проведения самого эксперимента, а также и с изменчивостью самого измеряемого природного объекта. Никогда не может быть получено единственное, точное истинное значение свойства природного объекта, всегда мы будем наблюдать непрерывное распределение возможных значений этого свойства, что как раз характерно для непрерывных случайных величин. Изменчивость, обусловленная неточностью конкретного прибора, с помощью которого мы производим измерения, возникает, когда делаются повторные измерения на абсолютно том же объекте без каких либо изменений в проведении опыта. Такую изменчивость объясняют и называют ошибками эксперимента или ошибками регистрации. Однако на практике все причины изменчивости проявляются сразу и отражаются в результатах измерений так, что нельзя отличить в силу каких причин данные изменения возникли, или в силу ошибки при измерении прибором, или в силу изменившихся условий эксперимента или в силу природной изменчивости измеряемого свойства. Оценить природную изменчивость по данному измеряемому свойству можно, когда измерения проводятся не на абсолютно том же объекте. Предположим, что мы обладаем столбиком керна некоторой длины (керн это каменный материал, поднятый из скважины). Мы хотим определить проницаемость данного материала, но не можем ввести для измерения проницаемости в прибор весь керн. Вместо этого мы вырезаем из керна несколько пластинок и измеряем проницаемость в каждой из них. Полученный результат и наблюдаемая изменчивость будет обусловлена природной изменчивостью керна, меняющимися условиями эксперимента и ошибкой измерения.
Еще раз остановимся на двух таких важных понятиях как “выборка” и “совокупность”. Совокупность представляет собой множество (либо конечных, либо бесконечных) элементов. Выборка – это подмножество элементов, выбранных из некоторой совокупности. В классических учебниках статистики часто используют термины – выборочная совокупность и генеральная совокупность, что идентично терминам просто выборка и совокупность. Измерения проницаемости, которые мы осуществили, были проведены по выборке образцов взятых из некоторой природной совокупности и те результаты, которые мы получили, являются оценками истинной проницаемости совокупности или изучаемых природных объектов. Обычно выборочные образцы из природной совокупности должны извлекаться случайным образом, что бы все особенности совокупности были представлены в нашей выборке, однако если исключить из выборки, некоторые образцы, отражающие особенности совокупности то мы получим смещенную выборку. Предположим, если мы не станем измерять проницаемость в пластинах керна не обладающих должной на наш взгляд прочностью, раздробленных и с видимыми порами, то мы получим искаженные представления о проницаемости, данной породы. То есть наши оценки истинной проницаемости природного объекта будут неверными. В статистике выделяются два вида ошибок: регистрации и репрезентативности. Ошибки регистрации могут иметь случайный (непреднамеренный) или систематический (тенденциозный) характер. Ошибки репрезентативности возникают в силу того, что выборка или выборочная совокупность не полностью отражают генеральную совокупность. Избежать ошибок репрезентативности нельзя, но можно установить границы возникновения этих ошибок. Чем больше по количеству измеряемых проб будет наша выборка, тем точнее будут наши оценки свойств совокупности.
Дата добавления: 2019-04-03; просмотров: 492;