Особенности анализа статистического материала
Различают параметрическую и непараметрическую математическую статистики. Параметрическая статистика строится на основании параметров данной совокупности, например, средней арифметической X и среднем квадратическом отклонении а. Непараметрическая - на вариантах и частотах их встречаемости у данной выборки.
Большинство методов математической статистики разработаны для нормального закона распределения изучаемых показателей. В случае отклонения от нормального закона, применение обычных методов приводит к грубым ошибкам и выводам. Поэтому при наличии, в частности, асимметрии в распределении признака выполняют математическое преобразование исходных данных (например, возведение в какую-либо степень), с последующей проверкой полученных данных на нормальность распределения.
Применение методов для проверки статистических гипотез о достоверности различий между выборочными параметрами (X и а) требует предварительной проверки изучаемых признаков на нормальность распределения. Такими методами являются дисперсионный анализ, Т- критерий Стьюдента.
Основные статистические характеристики вычисляются по следующим формулам:
- средняя арифметическая
X=I Vi/n ,
где Vi - значение i-ой варианты, п - количество вариант;
- средняя квадратическая
o-2=(I(X-Vi)2)/ (n-1)
Для быстрых предварительных расчетов можно воспользоваться другой формулой (Н.А.Толоконцев, 1961):
О» (Vmax - Vmin)/K,
где Vmax - наибольшее значение из вариант, Vmin - наименьшее значение из вариант, К - коэффициент из таблицы 1.
Таблица 1
Коэффициенты К для вычисления среднего квадратического отклонения по амплитуде вариационного ряда
1,13 | 1,69 | 2,06 | 2,33 | 2,53 | 2,70 | 2,85 | 2,97 | |||
3,08 | 3,17 | 3,26 | 3,34 | 3,41 | 3,47 | 3,53 | 3,59 | 3,64 | 3,69 | |
3,74 | 3,78 | 3,82 | 3,86 | 3,90 | 3,93 | 3,96 | 4,00 | 4,03 | 4,06 |
- ошибка средней арифметический: m = б/V п;
- ошибка разности между средними:
tp=(X1-X2)/V(m12+m22)
при числе степеней свободы С=П!+п+2.
Таблица 2
Величина tst при заданной (0.05) вероятности распределения Стьюдента
С | >100 | |||||||||||
tst | 2,2 | 2,2 | 2,1 | 2,0 | 2,0 | 2,0 | 2,0 | 2,0 | 2,0 | 2,0 | 2,0 | 1.9 |
Высшим достижением эмпирического исследования является установление эмпирического закона, выраженного в аналитическом виде. Первым шагом на пути выявления эмпирического закона, суть которого связана с реально существующей причинно-следственной связью, является вычисление коэффициента корреляции, а затем факторного и регрессионного анализа. Здесь надо заметить, что выборка должна формироваться методом расслоенного отбора. В этом случае удается соблюсти следующие условия:
- независимые переменные представляют собой неслучайный набор чисел;
- случайные ошибки имеют нулевую среднюю и конечную дисперсию, подчинены нормальному закону распределения ;
- между независимыми переменными отсутствуют корреляция и автокорреляции.
Для определения независимости признаков полезно использовать факторный анализ, который позволяет снижать размерность описания взаимосвязей между признаками. Столбцы матрицы факторных весов содержат коэффициенты корреляции между фактором и признаком. Эта информация позволяет найти признаки, наиболее тесно связанные с данным фактором, т.е. между собой, а затем для любого из признаков найти независимые переменные для построения линейных уравнений множественной регрессии.
В работе В.М. Зациорского "Кибернетика, математика, спорт" (1970) приведена таблица результатов корреляционного анализа между достижениями в отдельных видах легкоатлетического десятиборья, представленных в виде набранных очков по отдельным видам многоборья. Эта корреляционная матрица была статистически обработана с помощью метода главных факторов по Г.Харману (1972). Решение представлено в табл.3.
Таблица 3 Факторные веса (умножены на 100) по видам десятиборья
Виды десятиборья | Факторы | |||
I | II | III | IV | |
Бег 100 м | -14 | -21 | ||
Прыжок в длину | ||||
Толкание ядра | -35 | -21 | -15 | |
Прыжок в высоту | -08 | -00 | ||
Бег 400 м | ||||
Бег 100 м с/б | -23 | -14 | ||
Метание диска | -32 | -00 | ||
Прыжок с шестом | -33 | |||
Метание копья' | -30 | -07 | ||
Бег 1500 м | -37 | |||
Вклад в общую дисперсию |
Как интерпретировать результат факторного анализа?
Выборка из 54 спортсменов была сформирована из участников Олимпийских игр 1952, 1956, 1960 гг. От олимпиады к олимпиаде подготовленность многоборцев растет, поэтому выборку можно рассматривать как совокупность атлетов с примерно равной технической, но разным уровнем физической подготовленности. Все квалифицированные десятиборцы имеют схожее телосложение, которое характеризуется длиной тела выше среднего 180-190, длинными ногами, узким тазом, широкими плечами, равномерной гипертрофией мьшщ на верхних и нижних конечностях. Мышцы должны быть с преимущественным содержанием быстрых мышечных волокон. Мышечная композиция наследуется, следовательно, уровень физической подготовленности десятиборцев определяется, прежде всего, силой (количеством миофибрилл в мышечных волокнах) мышц ног, рук, туловища, мышечной выносливостью (отношением массы митохондрий к массе миофибрилл в мышцах), размером сердца.
Эти теоретические умозаключения можно подтвердить в ходе анализа результатов факторного анализа (табл. 1). Например, высокие коэффициенты корреляции первого фактора с результатами в отдельных видах многоборья свидетельствуют о том, что с ростом квалификации атлета увеличивается сила всех основных мышц. Исключение составляет результат в беге на 1500 м, который обусловлен другим фактором (в таблице - это 3-й фактор).
После устранения влияния первого фактора из общей дисперсии выборки выявляется второй фактор. Он имеет наивысшие положительные коэффициенты корреляции (факторные нагрузки) с бегом на 400 м (48), 100 м (32) и 1500 м (19), отрицательно коррелирует с толканием ядра (-35), метанием диска (-32), метанием копья (30) и прыжком с шестом (-33); следовательно, локальная силовая выносливость мышц ног (относительно тяжелые ноги) способствует достижению высоких результатов во всех беговых дисциплинах, а избыточная масса мышц нижних конечностей отрицательно связана с результатами в метаниях. Следует напомнить, что положительный вклад силы мышц верхних и нижних конечностей уже был учтен в первом факторе.
Устранение влияния второго фактора на общую дисперсию выборки позволило выявить третий - аэробная подготовленность (видимо, уровень потребления кислорода на анаэробном пороге). Это умозаключение следует из наличия наивысшего коэффициента корреляции третьего фактора с набранными очками в беге на 1500 м (36). Третий фактор положительно коррелирует еще с результатом на 400 м (24).
После устранения влияния на общую дисперсию трех факторов, в оставшейся дисперсии основную долю составила дисперсия, приходящаяся на результат на 1500 м (-37), 400 м (29). Очевидно, что этот фактор связан с массой мышц верхнего плечевого пояса. Интенсивная работа массивных рук в беге на 400 м способствует увеличению амплитуды изменения высоты общего центра массы тела, а, значит, длины шага. Массивные руки в беге на 1500 м являются лишним грузом, интенсивная их работа приведет к увеличению потребления кислорода, которого , как правило, не хватает для мышц ног.
Таким образом, по результатам факторного анализа можно предложить построить уравнение множественной регрессии для предсказания суммы очков:
Y= аО + al*Xl + а2 *Х2 + аЗ*ХЗ,
где XI - толкание ядра, Х2 - бег на 400 м, ХЗ - время бега на 1500 м.
С помощью такого уравнения можно предсказывать результат в сумме многоборья для спортсменов, относящихся к данной генеральной совокупности, т.е. для действующих десятиборцев высшей квалификации 1952-1960 гг. Применять такое уравнение для нашего времени уже нельзя, поскольку поменялись правила начисления очков за результаты в отдельных видах. Требуется повторить исследование.
Следует сделать еще одно замечание: интерпретация результатов факторного анализа может корректно выполняться только на основе моделирования объектов - десятиборцев (в нашем случае - мысленного имитационного моделирования). Результат моделирования является лишь рабочей гипотезой, которую еще необходимо доказать прямыми исследованиями. Например, методами биомеханики можно доказать предположение о важности интенсивной работы рук в беге на 400 м, а методами биоэнергетики - отрицательное влияние работы мышц рук на скорость бега. В случае использования примитивных моделей, интерпретация факторных решений приводит к порождению новых терминов, не имеющих глубокого обоснования, засоряющих науку.
Дата добавления: 2015-06-05; просмотров: 961;