График эмпирической функции распределения проходит через правые верхние углы прямоугольника.
График накопленных частот и эмпирическая функция распределения на практике используется для приближения теоретической функции распределения.
Пример: Дан сгруппированный ряд наблюдений
Требуется построить гистограмму и график накопленных частот.
Рис.11. Гистограмма относительных частот.
Рис.12. График накопленных частот (кумулята)
Выборочные характеристики
Средние величины
Для того, чтобы количественно охарактеризовать самые существенные свойства распределения, а также для того, чтобы можно было сравнить разные распределения, вычисляют средние показатели - выборочные числовые характеристики.
В статистике используются различные величины в зависимости от того, какие цели при анализе материала ставит исследователь. Понятием средней величины пользуемся в тех случаях, когда требуется определить средний надой по стаду, средний привес, средний прирост стада, средние клинические показатели деятельности сердца, лёгких, среднего состава крови и во многих других случаях.
Различают следующие виды средних величин: средняя арифметическая ( ), средняя геометрическая ( ), средняя квадратическая ( ), средняя гармоническая ( ) , мода (М0) и медиана Ме.
Наиболее распространенным видом средних величин является средняя арифметическая, которая бывает простой и взвешенной.
Возможны следующие случаи:
1. Результаты наблюдения не сведены в вариационный ряд или все частоты равны единице или одинаковы. Тогда вычисляют простую среднюю арифметическую
,
где хi – значение признака
n – объём результатов (число наблюдений).
2. Частоты ni отличны друг от друга, то есть значения признака хi повторяются. В этом случае вычисляют среднюю арифметическую взвешенную (выборочную среднею)
3. Распределение интервальное. В этом случае вместо хi берут середину интервалов
Основные свойства среднего: 1)выборочное среднее является той точкой, сумма отклонений наблюдений от которой равна 0; 2)сумма квадратов расстояний между наблюдаемыми значениями и их средним арифметическим является минимальным.
Медиана выборки (термин был впервые введен Гальтоном, 1882)
Медиана – это значение варианта, который делит ранжированный ряд на равные по числу вариант части.
4 7 12 8 9 5 7 13 15
Ме = 12 Ме =
Свойство: сумма абсолютных расстояний между точками выборки и медианой минимальна.
Если признак Х представлен интервально:
медианному интервалу соответствует первая накопленная частота превосходящая n/2.
,
где - нижняя граница медианного интервала
– шаг разбиения, ширина класса
– накопленная частота интервала, предшествующего медианному интервалу
- абсолютная частота медианного интервала.
Модой(термин впервые введен Пирсоном,1894) называется вариант, имеющий наибольшую частоту.
Если распределение имеет несколько мод, то говорят, что оно мультимодально или многомодально (имеет два или более «пика»)
Мультимодальность распределения дает важную информацию о природе исследуемой переменной. Например, в социологических опросах, если переменная представляет собой предпочтения или отношение к чему-то, то мультимодальность может означать, что существует несколько определенно различных мнений. Мультимодальность так же служит индикатором того, что выборка не является однородной и наблюдения, возможно порождены двумя или более «наложенными» распределениями.
Класс с наибольшей частотой называется модальным.
Для определения моды интервальных рядов служит формула
,
где - нижняя граница модального интервала
– ширина класса
– абсолютная частота модального интервала
– абсолютная частота интервала, предшествующего модальному
– абсолютная частота интервала, следующего за модальным.
Пример: На основании многолетних клинических наблюдений, проводившихся в Сухумском питомнике обезьян, составлена следующая выборка, включающая 100 анализов на содержание кальция (мг %) в сыворотке крови низших обезьян (павианов-гамадрилов).В данном случае признак варьирует непрерывно в пределах от 9,0 до 14,7 мг %.
Задание: 1) составить интервальный вариационный ряд; 2) найти Мо, Ме;
3) построить график накопленных частот (кумуляту)
Решение. 1) Установим величину классового интервала:
Определим нижнюю границу первого класса:
Составим классовые интервалы:
Получилось 8 интервалов.
2) Строим вспомогательную таблицу и разносим все 100 вариаций по намеченным классовым интервалам.
Классы по уровню кальция в сыворотке крови, мг % | Срединные значения классов | Частоты | Накопленная частота | |
8,6-9,4 | 9,0 | 0,02 | ||
9,4-10,2 | 9,8 | 0,08 | ||
10,2-11,0 | 10,6 | 0,23 | ||
11,0-11,8 | 11,4 | 0,46 | ||
11,8-12,6 | 12,2 | 0,71 | ||
12,6-13,4 | 13,0 | 0,88 | ||
13,4-14,2 | 13,8 | 0,95 | ||
14,2-15,0 | 14,6 | |||
Сумма |
Модальный интервал 11,8-12,6 , т.к. ему соответствует наибольшая частота n=25. По формуле для моды интервального вариационного ряда имеем
Медианному интервалу соответствует первая накопленная частота, превосходящая (50). . Следовательно, медианный интервал 11,8-12,6. По формуле для медианы интервального вариационного ряда имеем
3) График накопленных частот
Дата добавления: 2017-02-20; просмотров: 833;