Насколько точны выборочные оценки.
Выборочное среднее и выборочное среднее квадратическое отклонение есть оценки среднего и среднего квадратического отклонения для совокупности, вычисленные по случайной выборке. Понятно, что разные выборки дадут разные оценки. Для характеристики точности выборочных оценок используют среднюю ошибку. Среднюю ошибку можно подсчитать для любого показателя, но сейчас мы остановимся на средней ошибке среднего – она позволяет оценить точность, с которой выборочное среднее характеризует значение среднего по всей совокупности.
Проведём такой мысленный эксперимент. Пусть у нас имеется совокупность объёма N, параметры которой мы оцениваем по выборке объёма n. Будем брать все возможные выборки объёма n из совокупности, каждый раз вычисляя среднее и среднее квадратическое отклонение. Таких выборок будет очень и очень много. Например, если мы берём выборки по 10 элементов из совокупности в 200 элементов, то общее число всех возможных выборок будет порядка 1016.
Опишем распределение полученных выборочных средних. Можно доказать, что если переменная представляет собой сумму большого числа независимых переменных, то ее распределение стремится к нормальному, какими бы ни были распределения переменных, образующих сумму. Так как выборочное среднее определяется именно такой суммой, его распределение стремится к нормальному, причем, чем больше объем выборок, тем точнее приближение. (Если выборки принадлежат совокупности с нормальным распределением, распределение выборочных средних будет нормальным независимо от объема выборок.)
Поскольку распределение всевозможных выборочных средних нормальное, его можно описать с помощью среднего и среднего квадратического отклонения.
Так как рассматриваемое среднее значение есть среднее величин, которые сами являются средними значениями, обозначим его . Аналогично, среднее квадратическое отклонение выборочных средних обозначим .
Среднее выборочных средних совпадет со средним по совокупности m. Действительно, так как мы провели исследования всех возможных выборок, то каждый из элементов совокупности будет выбран равное число раз.
Подобно тому, как среднее квадратическое отклонение выборки s служит оценкой изменчивости роста марсиан, является оценкой изменчивости значений средних для множества выборок такого же объёма. Таким образом, величина служит мерой точности, с которой выборочное среднее является оценкой среднего по совокупности m. Поэтому носит название средней ошибки среднего.
Чем больше выборка, тем точнее оценка среднего и тем меньше его средняя ошибка. Чем больше изменчивость исходной совокупности, тем больше изменчивость выборочных средних; поэтому средняя ошибка среднего возрастает с увеличением среднего квадратического отклонения совокупности.
Истинная средняя ошибка среднего по выборкам объемом n, извлеченным из совокупности, имеющей среднее квадратическое отклонение s, равна: .
Собственно средняя ошибка – это наилучшая оценка величины по одной выборке: , где s – выборочное среднее квадратическое отклонение. Для обозначения средней ошибки среднего также часто применяется m.
Так как возможные значения выборочного среднего стремятся к нормальному распределению, истинное среднее по совокупности примерно в 95% случаев лежит в пределах 2 средних ошибок выборочного среднего. На этом основано определение доверительных интервалов, что будет рассмотрено в соответствующей теме.
Как уже говорилось, распределение выборочных средних приближенно всегда следует нормальному распределению независимо от распределения совокупности, из которой извлечены выборки. В этом и состоит суть утверждения, называемого центральной предельной теоремой. Эта теорема гласит следующее:
· Выборочные средние имеют приближенно нормальное распределение независимо от распределения исходной совокупности, из которой были извлечены выборки.
· Среднее значение всех возможных выборочных средних равно среднему исходной совокупности.
· Среднее квадратическое отклонение всех возможных средних по выборкам данного объема, называемое средней ошибкой среднего, зависит как от среднего квадратического отклонения совокупности, так и от объема выборки.
С увеличением объёма выборки, выборочное среднее и среднее квадратическое отклонение s дают все более точные оценки среднего m и среднего квадратического отклонения sпо совокупности. Увеличение точности оценки среднего отражается в уменьшении средней ошибки среднего . В отличие от среднего квадратического отклонения средняя ошибка среднего ничего не говорит о разбросе данных – она лишь показывает точность выборочной оценки среднего.
Хотя разница между средним квадратическим отклонением и средней ошибкой среднего совершенно очевидна, их часто путают. Большинство исследователей приводят в публикациях значение средней ошибки среднего, которая заведомо меньше среднего квадратического отклонения (в корень из объёма выборки раз). Авторам кажется, что в таком виде их данные внушают больше доверия. Может быть, так оно и есть, однако беда в том, что средняя ошибка среднего измеряет именно точность оценки среднего, но никак не разброс данных, который и интересен читателю. Описывая совокупность, всегда нужно приводить значение среднего квадратического отклонения.
Рассмотрим пример, позволяющий почувствовать различие между средним квадратическим отклонением и средней ошибкой среднего, а также уяснить, почему не следует пренебрегать средним квадратическим отклонением. Положим, исследователь, обследовав выборку из 20 человек, пишет в статье, что средний сердечный выброс составлял 5,0 л/мин со средним квадратическим отклонением 1 л/мин. Мы знаем, что 95% нормально распределенной совокупности попадает в интервал среднее плюс-минус два средних квадратических отклонения. Тем самым, из статьи видно, что почти у всех обследованных сердечный индекс составил от 3 до 7 л/мин. Такие сведения весьма полезны, их легко использовать во врачебной практике. Увы, приведенный пример далек от реальности. Скорее автор укажет не среднее квадратическое отклонение, а среднюю ошибку среднего. Тогда из статьи вы узнаете, что «сердечный выброс составил (5,0 ± 0,22) л/мин». И если бы мы спутали среднюю ошибку среднего со средним квадратическим отклонением, то пребывали бы в уверенности, что 95% совокупности заключено в интервал от 4,56 до 5,44 л/мин. На самом деле в этом интервале (с вероятностью 95%) находится среднее значение сердечного выброса. Впрочем, среднее квадратическое отклонение можно рассчитать самому – для этого нужно умножить среднюю ошибку среднего на квадратный корень из объема выборки (численности группы): . Правда, для этого нужно знать, что же именно приводит автор – среднее квадратическое отклонение или среднюю ошибку среднего.
Дата добавления: 2016-02-04; просмотров: 1217;