Определение статистических показателей популяций
Для изучения и использования наследуемости количественных признаков привлекаются соответствующие методы. Как правило, селекционеры лесных древесных пород знакомы с общепризнанными методами статистики (Дж.-К-Снедекор, 1961- А.В.Тюрин, 1961; А. К. Митропольский, 1965; О. А. Трулль, 1966; С. Пирс, 1969; П. Ф. Рокицкий, 1973; Б. А. Доспехов, 1979 и др.).
Каждая популяция может быть описана несколькими способами; термины, используемые для описания популяции, называются параметрами. Обычно изучаемые популяции слишком большие, чтобы можно было измерить все составляющие их индивидуумы. Поэтому, чтобы получить оценку какого-либо параметра, используют выборочные данные или выборочные измерения индивидуумов из популяции. При статистически правильном выборе полученные оценки выборки совпадают с оценками параметров популяции.
Наиболее общим и полезным параметром, используемым для описания популяции, является популяционная средняя, или средняя величина индивидуумов, которые составляют популяцию. Символически популяционная средняя выражается как
(12.1)
где X— средняя, ∑ — знак суммирования, Xi — индивидуальные наблюдения, n — число наблюдений.
Проще говоря, популяционная средняя — это сумма индивидуальных наблюдений, деленная на число наблюдений. Средняя может быть рассчитана для любой характеристики, для которой произведены измерения или получены балльные оценки.
Хотя популяционная средняя является наиболее распространенной и полезной величиной, она ничего не говорит об изменчивости, существующей в популяции, для которой рассчитана. Размах и характер изменчивости или распределения, являются жизненно важными для оценки и использования информации о популяции
Многие из количественных признаков имеют так называемое нормальное распределение, являющееся крайним выражением биномиального распределения, когда число измерений признака стремится к бесконечности или превышает по крайней мере 30 *100 наблюдений для разных признаков (см. раздел 10.1). Распределение изменчивости легче представить на рисунке (рис. 12.1).
В случае нормального распределения, чем больше образцы отличаются от среднего значения, тем реже они встречаются. Впервые нормальное распределение для биологических объектов было эмпирически установлено датским генетиком В. Иоганнсеном путем взвешивания 5494 семян фасоли. С тех пор большинство теорий по генетике базируются на нормальном распределении. Хотя нормальное распределение в чистом виде встречается нечасто, наблюдения обычно приближаются к нормальному распределению, так что предположение о нормальном распределении позволяет производить соответствующие статистические процедуры. Если встречаются другие виды распределения, то используют различные способы приведения наблюдаемых данных к нормальному распределению (Дж. У. Снедекор, 1961; П. Ф. Рокицкий, 1973 и др.).
Нормальные распределения установлены для многих характеристик у деревьев, в частности для высоты, диаметра и других характеристик роста. Иногда реальные измерения не могут быть проведены, и для описания фенотипов используют балльные или ранговые оценки. Например, при оценке прямизны стволов, состояния и других показателей используют 5-балльные шкалы. Такие наблюдения часто обрабатывают как если бы они имели нормальное распределение.
Параметр, который наиболее часто используют для описания распределения индивидуумов внутри популяции, называют вариансой, или дисперсией. Дисперсия рассчитывается по следующей формуле:
где σ2 — дисперсия, X— среднее значение признака, Xi — индивидуальное наблюдение, ∑ — знак суммирования, n — число наблюдений.
Дисперсия представляет собой сумму квадратов отклонений индивидуальных наблюдений от средней, деленную на число наблюдений, уменьшенное на единицу.
Выражение (и-1) обычно называют числом степеней свободы для оценки дисперсии. Большие дисперсии встречаются, если индивидуальные оценки широко рассеяны, и, соответственно, меньшие — при узком рассеивании (рис. 12.1).
Следующим-полезным параметром популяции является стандартное, или среднеквадратическое, отклонение, которое представляет собой корень квадратный из дисперсии:
Стандартное отклонение выражается в тех же единицах измерения, что и средняя популяции, и является очень полезным параметром для описания рассеивания индивидуальных наблюдений. Если измерения распределены нормально, то примерно 67% наблюдений оказываются в пределах одного стандартного отклонения от средней в ту и другую сторону (±σ); 95 % наблюдений оказываются в пределах двух стандартных отклонений от средней (±2σ). Иллюстрация этого положения приведена на рис. 12.2.
Популяции при этом часто описывают по их средней величине и стандартному отклонению:
Х±σ. (12,4)
Если, например, средняя величина деревьев в генетических экспериментах описывается как 20 ± 3 м, то это означает, что средняя высота насаждения 20 м, а стандартное отклонение — 3 м (дисперсия будет равна 9 М2). Если высоты в эксперименте были нормально распределены, то около 67 % деревьев будет находиться в пределах ± одного стандартного отклонения, или между 17 и 23 м высоты.
Бели отклонения индивидуальных измерений от средней величины находятся в пределах от -2ст до +2ст, то они входят в 95 % всех наблюдений популяции. Другими словами, значения признаков при нормальном распределении вероятностей превышают отклонения на 2ст (удвоенное стандартное отклонение) менее чем в 5 % случаев. Отклонение 95 % и 5%, или 19:1, принимается как надежная разница для многих биологических,
сельскохозяйственных и лесоводственных исследовании. Таким образом, когда значения превышают отклонение 2а от среднего популяции, отклонения считаются достаточно значимыми, и биологу надо искать другую причину, помимо случайности отклонения.
Стандартное отклонение, выраженное в процентах к среднему значению признака, называется коэффициентом вариации или коэффициентом изменчивости. Он обозначается буквами С или V. выражается в %:
(12.5)
Коэффициент вариации можно применять для сравнения опытов с различными единицами измерения. Коэффициент вариации меньше 10 % в биологических данных встречается редко. В зависимости от величины коэффициента вариации С. А. Мамаев для различных признаков лесных древесных пород разработал шкалу изменчивости (табл. 12.1). Хотя перечисленные параметры: средняя, дисперсия, стандартное отклонение, коэффициент вариации — часто используют для описания популяций, они не дают представления о характере наследственности или пропорциях изменчивости, обусловленной генетическими факторами. Поэтому наблюдаемые или оцениваемые фенотипические дисперсии должны быть разделены на их генетические и негенетические компоненты, обусловленные влиянием внешней среды. Вычисление этих компонентов
включает разделение фенотипической изменчивости на части, имеющие генетическое и негенетическое (обусловленное влиянием внешней среды) происхождение.
Таблица 12.1 Уровень изменчивости количественных признаков лесных древесных пород
Дата добавления: 2016-04-06; просмотров: 1875;