Глава 5 ОСНОВЫ МЕДИЦИНСКОЙ СТАТИСТИКИ
Существует целый ряд определений статистики. Выделим два из них.
Статистика — наука, изучающая закономерности массовых явлений методом обобщающих показателей.
Статистика — самостоятельная общественная наука, изучающая количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной, позволяющая методом обобщающих показателей изучить закономерности этих явлений, важнейших процессов в экономической, социальной жизни общества, в его здоровье, в системе организации медицинской помощи населению.
Являясь основным методов исследования общественного здоровья и здравоохранения, медицинская статистика в то же время представляет одну из отраслей статистики как науки о количественных изменениях в развитии общества, экономики и т.д.
В здравоохранении статистические методы исследования используют для:
1) изучения здоровья населения и факторов его определяющих;
2) анализа, оценки и планирования медицинской помощи;
3) специальных научных исследований.
Таким образом, можно выделить следующие разделы медицинской статистики:
— общетеоретические и методические основы статистики;
— статистика здоровья населения;
— статистика здравоохранения.
Основными этапами статистического исследования являются следующие:
1. составление плана и программы исследования;
2. сбор материала;
3. обработка и сводка материала;
4. статистический анализ.
1.1. Планисследования включает в себя целый ряд элементов. Во-первых, определяется цель исследования (или целевая установка), которая может быть структурирована на ряд подцелей (задач); число которых обычно составляет 3—6.
Далее следует знакомство с литературой, которое позволяет:
— получить представление об изучаемой проблеме;
— выбрать адекватную методику исследования;
— сформулировать рабочую гипотезу.
Рабочая гипотеза — это обоснованное предположение о результатах исследования. В случае несовпадения полученных результатов с рабочей гипотезой исследователь должен убедиться в: а) отсутствии ошибки в расчетах; б) адекватности выбранной методики исследования поставленным цели и задачам.
Очень важным элементом является выбор единицы наблюдения. Единица наблюдения (счета) — это первичный элемент статистической совокупности, наделенный всеми признаками, подлежащими изучению и регистрации.
В одних случаях определить единицу наблюдения достаточно просто (например, в случаях изучения смертности населения единицей будет один случай смерти). В других же - сложнее, так как единица наблюдения может отличаться при разных целях исследования. Например, при изучении заболеваемости населения единицей наблюдения может быть один житель, один случай заболевания (любого или какого-нибудь конкретного), один случай обращения за медицинской помощью и т.д.
В зависимости от степени охвата единиц наблюдения выделяют два метода исследования: сплошное (изучают все единицы наблюдения) и несплошное (выборочное).
Теоретическим обоснованием выборочного метода является закон больших чисел, сформулированный Бернулли: «При неограниченном увеличении числа однородных независимых опытов с практической достоверностью можно утверждать, что наблюдаемая частота случайного события будет сколь угодно мало отличаться от вероятности появления события в отдельном опыте».
Раскрывая смысл данного определения, следует выделить следующие основополагающие понятия:
Случайная величина - это величина, которая при реализации комплекса условий может принимать различные значения.
Статистическая вероятность, выражая численную меру объективной возможности появления того или иного события (при реализации определенного комплекса условий), является отношением числа опытов, в которых появилось событие, к общему числу опытов:
р — статистическая вероятность;
т - число опытов, в которых появилось то или иное событие;
п — общее число опытов. Величиной, обратной статистической вероятности, является альтернатива
Соответствие, устанавливаемое между всеми возможными численными значениями случайной величины и вероятностями их появления, называется законом распределения (который описывает случайную величину с вероятностной точки зрения). Основными типами распределения являются: альтернативный, нормальный (симметричный, асимметричный - правосторонний, левосторонний, бимодальный) и др.
Применение вероятностных методов в статистике позволяет выявить закономерность там, где на поверхности выступает кажущийся хаос случайных явлений, а теория вероятностей - это математическая теория, позволяющая изучить закономерности случайных явлений.
Таким образом, возвращаясь к выборочному методу исследования, можно отметить, что выводы, полученные на его основе (при наличии допустимой погрешности), могут быть распространены и на генеральную совокупность.
Однако при этом необходимым условием является репрезентативность выборки, т.е. ее способность отражать свойства генеральной совокупности. Репрезентативность должна быть как количественной, так и качественной. Условием обоснованного расчета необходимого числа наблюдений является допущение возможной ошибки, т.е. предположение максимально допустимого отклонения результатов выборочного исследования от генеральных значений.
Формула для определения предельной ошибки показателя:
Δ — предельная ошибка;
t — доверительный коэффициент, показывающий с какой вероятностью (надежностью) можно гарантировать достоверность полученного результата, обычно t берется равным 2;
р — величина показателя;
q — величина, обратная показателю, т.е. дополняющая его до основания;
п — число наблюдений,
Исходя из данной формулы, можно определить необходимое число наблюдений:
Могут быть использованы и другие формулы для расчета необходимого числа наблюдений:
N — численность генеральной совокупности. Или такая:
δ — среднее квадратическое отклонение (его величина определяется из предыдущих исследований или при собственном пилотажном исследовании).
Для обеспечения качественной репрезентативности выборки необходимо избегать систематических ошибок, т.е. рандомизировать выборку. Процесс рандомизации аналогичен подбрасыванию монеты, обеспечивающему равные шансы каждой единице наблюдения попасть в ту или иную группу. Рандомизация уравнивает вероятность воздействия как учитываемых факторов, так и тех, о существовании которых мы не подозреваем (что является одним из условий доказательной медицины).
Возможны разные варианта формирования выборки:
Случайная выборка формируется путем отбора единиц наблюдения наугад: например, по первой букве фамилии, алфавита, по жребию и т.д. Иногда применяются специально разработанные таблицы случайных чисел.
Механически выборка формируется о помощью механического (арифметического,, а к отбору единиц наблюдения. Например, при необходимости отбора 20% от всей генеральной совокупности можно отобрать каждый 5-й случай. Во многих случаях для отбора используются номера медицинских и других документов, день поступления в стационар и т.п.
Типическая (типологическая) выборка — это выборка, при формировании которой генеральная совокупность предварительно разбивается на типы с последующим отбором единиц наблюдения из каждой типической группы, при этом число единиц наблюдения можно отобрать пропорционально численности типической группы (пропорциональный типологический отбор) и непропорционально, т.е. отбирая разное число наблюдений из каждой группы (непропорциональный типологический отбор).
Так, например, предварительно можно разделить исследуемую группу по возрасту, полу, профессии, образованию, отобрать из каждой подгруппы -необходимое число единиц наблюдения. При изучении заболеваемости можно выделить несколько классов болезней и в каждом классе сформировать выборочную совокупность из лиц, подлежащих изучению.
Серийная выборка (гнездовой отбор) формируется с помощью отбора не отдельных единиц наблюдения, а целых групп, серий, или гнезд, в состав которых входят организованные определенным образом единицы наблюдения. Так, могут быть территориальные серии (деревни, районы), отдельные учреждения (больницы, детские сады и т.д.) и т.п. Отбор серий осуществляется с помощью случайной или механической выборки. Внутри каждой серии изучаются все единицы наблюдения.
Метод многоступенчатого отбора. По количеству этапов различают одноступенчатый, двухступенчатый, трехступенчатый отбор и т.п. Так, например, на первом этапе по краткой программе обследуются все рабочие -и служащие завода. Из всей совокупности работающих выбирают отдельную группу (женщины), которые обследуются по более полной программе: часть этой группы (женщин, имеющие детей) исследуются по подробной программе, а отдельные лица (женщины, имеющие ребенка с врожденным пороком развития) — по особенно детальной преграде (монографическое исследование).
Способы отбора на отдельных этапах исследования могут быть различными, например, на первом этапе — случайный отбор, на втором — механический и т.п.
Метод направленного отбора. Использование принципов направленного отбора позволяет выявить влияние неизвестных факторов при устранении влияния известных. Например, при изучении влияния стажа работающего на травматизм отбираются рабочие одной профессии, одного возраста, одного образовательного уровня.
Когортный метод. Под когортой в демографии понимают совокуп-4 ность людей, переживших одно и то же демографическое явление в течение одного и того же года. Иными словами, статистическую совокупность при этом методе составляют относительно однородные группы лиц, объединенные наступлением определенного демографического признака в один и тот же интервал времени. Например, при изучении вопросов, связанных с проблемой рождаемости, формируют совокупность (когорту) по признаку единого срока рождения женщин — исследование рождаемости по поколениям — или по признаку единого срока вступления в брак — исследование рождаемости по продолжительности семейной жизни. Кроме того, в когорту могут быть включены лица, у которых на момент исследования изучаемое явление отсутствует, но оно может появиться в дальнейшем.
Метод «копи-пара», или способ уравновешивания групп (метод парных сочетаний). В основе его лежит подбор для каждой единицы наблюдения исследуемой группы «копи-пары» по одному или нескольким признакам. Например, известно, что на уровень младенческой смертности влияют такие факторы, как масса тела и пол ребенка. При использовании Данного метода для каждого случая смерти ребенка из альтернативной совокупности благополучных случаев отбирается «копи-пара» по массе и полу. Этот способ отбора целесообразно применять для изучения редких явлений.
Это далеко не все методы выборочных исследований. Необходимо отметить также, что выборочное исследование является лишь одной из Разновидностей несплошного наблюдения. К вариантам несплошного наблюдения относят также монографическое описание и метод основного массива.
Монографическое исследование — тщательное, глубокое изучение одного человека, одного учреждения, одного села и т.д. Монографическое исследование иногда проводят перед основным с целью разработки программы, изучения различных организационных вопросов. Оно нередко проводится на одной и той же единице наблюдения с определенными временными интервалами. При этом создаются оптимальные условия для изучения динамики факториальных и результативных признаков.
Метод основного массиваохватывает большую часть единиц изучаемого объекта наблюдения. Этот метод иногда называют несовершенным сплошным. Например, при изучении здоровья детей, родители которых работают на текстильных предприятиях, для анализа следует отобрать только крупные комбинаты, исключая мелкие объекты. С организационных позиций значительно легче провести исследование на нескольких крупных объектах, чем на сотне мелких.
Следующим вопросом, отражаемым в плане исследования, является характер наблюдения, который может быть единовременным и текущим. При единовременном наблюдении исследователь получает информацию об объекте наблюдения на какой-либо момент времени (данные переписи населения, результаты профилактического осмотра); при текущем (применяемом значительно чаще) — в течение определенного времени (месяца, года и т.д.).
Объем исследования — это количество включенных в него единиц наблюдения (как отмечалось выше, определяется по специальным формулам).
Объект исследования — конкретная статистическая совокупность, подлежащая изучению (например, пациенты хирургического профиля, лечившиеся в поликлинике, больнице и т.д.).
План исследования должен включать в себя в такие вопросы, как:
— планируемые сроки работы;
— подбор, подготовка, обучение исполнителей;
— необходимые (и имеющиеся в наличии) материальные и финансовые ресурсы;
— источники информации, первичные учебные документы;
— тип работы (отчет, статья, диссертация, дипломная работа и т.д.).
1.2. Программа исследования — это перечень вопросов, подлежащих
изучению. Вопросы программы по существу составляют признаки изучаемой совокупности. Выделение признаков единиц наблюдения с последующей их группировкой называется типологизацией. Признаки делятся на количественные (вариационные) и качественные (атрибутивные, типологические). К количественным признакам относятся такие, варианты которых отличаются друг от друга определенной величиной (возраст, рост и т.д.). Качественные признаки позволяют отличать единицу наблюдения по содержанию (социальной принадлежности, характеру труда и пр.). Кроме того, признаки могут делиться на секторные (наличие в анамнезе факторов генетического, социального, профессионального риска) и результативные (наличие или отсутствие заболевания, характер его течения, исход).
Составляя программу исследования, исследователь, во-первых, руководствуется целью исследования (при этом важно как включить в программу все необходимые вопросы, так и не перегрузить ее ненужными, излишними вопросами); во-вторых, он должен четко представлять, откуда (из каких источников) будет получена информация) и насколько реально при этом получение ответов на те или иные вопросы.
2. Вторым этапом исследования является сбор материала, т.е. регистрация всех запланированных признаков для каждой единицы наблюдения. При этом на каждую единицу наблюдения заводится свой регистрационный документ (анкета, первичные учетные медицинские документы, специально разработанная карта исследования и т.д.). Сбор данных может осуществляться разными методами: анкетирование, интервьюирование, выкопировка сведений из первичной медицинской документации и т.д.
3. Третий этап обработки полученной информации начинается с проверки собранного материала, которая бывает количественной (соответствие количества единиц наблюдения и признаков запланированному) и логической (выявление логического несоответствия между признаками).
Далее необходимо провести группировку, т.е. разбить каждый признак на качественно однородные группы. При составлении группировки руководствуются:
а) целью исследования;
б) фактически собранным материалом;
в) объемом исследования (при числе наблюдений до 40 количество групп не должно превышать 5—6; при 40—60 наблюдений — 6—8; при 60-100 - 7-10; при 100-200 - 8-12; более 200 - 10-15 групп).
Когда материал сгруппирован, его шифруют, т.е. придают каждой группе определенный символ (шифр) для облегчения последующей обработки. Пример группировки:
№ признака | Признак | Группировка | Шифр |
Пол | мужчины женщины | ||
Возраст (лет) | до 29 30-39 40-49 50-59 60 лет и старше | ||
Диагноз | Острый инфаркт миокарда Хроническая ишемическая болезнь сердца Острое нарушение мозгового кровообращения Хроническое нарушение мозгового кровообращения Прочие болезни системы кровообращения |
Заканчивается третий этап составлением статистических таблиц. При этом необходимо провести сопоставление признаков, т.е. определить взаимосвязь и взаимозависимость между признаками, а затем выбрать те из них, которые представляют интерес для исследования.
Для этого составляется следующая таблица:
№ признака | Наименование признака | № сопостовляемого признака |
Пол | 2, 3, 4, 5, 6 | |
Возраст | 3, 4, 5, 6 | |
Диагноз | 4,5,6 | |
Срок лечения | 5,6 | |
Наличие осложнений | ||
Исход |
Статистические таблицы в зависимости от количества содержащихся в них признаков делятся на простые и сложные (а последние, в свою очередь, на групповые и комбинационные).
Простой называется таблица, в которой представлена итоговая сводка данных лишь по одному признаку.
В групповой таблице подлежащее характеризуется одним или несколькими сказуемыми (преимущественно двумя), но признаки, характеризующие подлежащее, не связаны между собой.
В комбинационной таблице признаки, характеризующие подлежащее, взаимосвязаны (таблица обычно содержит информацию о трех и более признаках).
Табличное подлежащее — это основной признак изучаемого явления, оно обычно располагается слева по горизонтальным строкам таблицы.
Сказуемое — признаки, характеризующие подлежащее, — располагаются обычно сверху (столбцы или вертикальные графы таблицы).
При составлении таблиц должны соблюдаться определенные требования:
— таблица должна иметь четкое, краткое заглавие, отражающее суть таблицы;
— таблица должна иметь единую последовательную порядковую нумерацию;
— оформление таблицы заканчивается итогами по графам и строкам;
— в таблице не должно быть пустых клеток (если нет признака, ставится прочерк).
Примеры таблиц.
1) Распределение детей по группам здоровья (макет простой таблицы).
3) Распределение детей по группам здоровья, возрасту и полу (макет комбинационной таблицы).
Группа здоровья | Число детей |
I | |
II | |
III | |
IV | |
V | |
Итого: |
2) Распределение детей по группам здоровья, возрасту (макет групповой таблицы).
Группа здоровья | Возраст (лет) | ||
0-3 4-6 7-10 11-14 | Всего | ||
I | |||
II | |||
III | |||
IV | |||
V | |||
Итого: |
Наряду с табличной формой, статистическая информация может быть представлена графически; в виде диаграмм, картограмм, картодиаграмм.
Диаграмма — это графическое изображение статистических величин с помощью различных геометрических фигур и знаков.
Картограммой называется географическая карта или ее схема, на которой различной краской или штриховкой изображена степень распространения какого-либо явления на различных участках территории.
Картодиаграммой называется такое географическое изображение, когда на географическую карту или ее схему статистические данные наносятся в виде столбиковых, секторных, фигурных и других диаграмм.
Диаграммы чаще используются в медико-социальных исследованиях, в то время, как картограмма и картодиаграммы — в медико-географических исследованиях.
Диаграммы можно классифицировать различным образом. По назначению принято различать диаграммы сравнения, структурные и динамические диаграммы. Выделяют также линейные, плоскостные и объемные графические изображения.
Для графического изображения относительных и средних величин используются различные геометрические фигуры: вертикальные прямоугольники (столбиковые и внутристолбиковые диаграммы), горизонтальные прямоугольники (ленточные диаграммы), квадраты (квадратные диаграммы), треугольники (пирамидальные диаграммы), круги (круговые диаграммы), секторы круга (секторные диаграммы), радиусы круга (радиальные диаграммы или диаграммы полярных координат), кривые, прямые или ломаные линии (линейные диаграммы, или графики), изображения объектов окружающего мира — людей, коек, машин и др. (фигурные диаграммы).
Для отображения каждого вида относительных величин рекомендуется использовать тот или иной вид диаграмм. Так, для изображения интенсивных показателей, показателей наглядности и соотношения чаще применяют столбиковые, линейные или фигурные диаграммы. Радиальные диаграммы чаще используются для отражения сезонности интенсивных коэффициентов. Графические изображения экстенсивных величин (показателей структуры) чаще располагают внутри какой-либо геометрической фигуры (внутристолбиковые иди секторные диаграммы).
При построении графических изображений следует соблюдать некоторые правила:
— каждая диаграмма должна иметь четкое, ясное, краткое название, отражающее ее содержание и порядковый номер;
— все элементы диаграммы (фигуры, знаки, окраска, штриховка) должны быть пояснены на самой диаграмме или в условных обозначениях (легенде);
— изображаемые графические величины должны иметь цифровые обозначения на самой диаграмме или в прилагаемой таблице;
— данные на диаграмме должны размещаться от большего к меньшему слева направо, снизу вверх и по часовой стрелке (но элемент «прочие» всегда располагается последним).
4. На четвертом этапе проводится анализ полученных данных, невозможный без расчета ряда статистических показателей.
Относительные величины (статистические коэффициенты)
В результате группировки и табличной сводки материалов наблюдения исследователь получает абсолютные величины. В ряде случаев этих абсолютных величин достаточно для характеристики размеров изучаемых явлений и процессов. Так, например, абсолютная численность населения в Китае и Индии показывает, что эти две страны являются лидерами в мире по численности населения. При учете ряда редких инфекционных заболеваний (малярия, дифтерия, трахома, СПИД и другие), важное значение имеет анализ даже единичных случаев заболевании. Большое практическое значение для правильного планирования медицинской помощи населению имеют также абсолютные величины численности населения и его отдельных возрастных групп; численность медицинского персонала и лечебно-профилактических учреждений; количество больничных коек и т.д.
Однако при рассмотрении абсолютных величин чаще всего можно сделать только некоторые предварительные выводы, и для дальнейшего анализа возникает необходимость в преобразовании этих величин в производные величины: относительные и средние. Необходимость перевода абсолютных величин в относительные можно пояснить простым примером.
В районе «А» выявлено в 2001 году 220 случаев острых желудочно-кишечных заболеваний, а в районе «Б» за этот период обнаружено 240 подобных случаев заболеваний. Можно ли сказать, что в районе «Б» выше уровень заболеваемости этими болезнями? Конечно же, нет. Для того, чтобы ответить на этот вопрос, надо знать численность населения в данных районах. Допустим в районе «А» проживает 200 тысяч, а в районе «Б» — 300 тысяч человек.
Относя число случаев желудочно-кишечных заболеваний в каждом районе к числу их жителей, получаем, в расчете на 10000 человек, следующие величины:
220·10000
Район «А» 200000 = 11%0
Вот теперь мы можем сделать заключение, что заболеваемость острыми желудочно-кишечными заболеваниями выше в районе «А».
Относительные величины (статистические коэффициенты), получаемые из соотношения двух сравниваемых чисел, для удобства сопоставления обычно умножаются на какое-либо круглое число (100, 1000, 10000, 100000 и т.д.), которое называется базой или основанием. В результате полученные коэффициенты приобретают форму «процентов» (%), «промилле» (%о), «продецимилле» (%оо), «просантимилле» (%ооо) и т.д. Чем реже встречается изучаемое явление, тем больше числовое основание следует избрать с тем, чтобы не было коэффициентов меньше единицы, которыми неудобно пользоваться,
По своему содержанию статистические коэффициенты, чаще всего применяемые в медицинской статистике, разделяются на три вида:
1) коэффициенты экстенсивности (показатели распределения, структуры, доли, удельного веса); 2) коэффициенты интенсивности (показателя частоты, распространенности); 3) коэффициенты (показатели) соотношения.
Экстенсивные коэффициенты характеризуют распределение явления или среды на его составные части, его внутреннюю структуру или отношение частей к целому (удельный вес).
При вычислении экстенсивных коэффициентов мы имеем дело только с одной статистической совокупностью и ее составом. Большинство экстенсивных коэффициентов обычно выражается в процентах, значительно реже — в промилле и в долях единицы. Методика вычисления экстенсивных коэффициентов проста:
Например, в 2001 г. число всех заболеваний детей в детском саду составило 205 случаев, в том числе 72 случая энтерита. Если принять все случаи заболевания детей за 100, а случаи заболеваний их энтеритом за х (икс), то доля энтерита среди всех заболеваний детей в детском саду составит:
В качестве примеров экстенсивных коэффициентов, применяемых в медицине и здравоохранении, можно назвать структуру заболеваемости населения; распределение госпитализированных больных по отдельным нозологическим формам; лейкоцитарную формулу и т.д.
Необходимо помнить, что экстенсивными показателями следует пользоваться для характеристики состава совокупности (явление, среда) в данном месте в данное время. Для динамических сравнений эти показатели непригодны. Сравнение удельных весов позволяет судить лишь о их порядковом номере в структуре (заболеваемости, смертности и т.д.), но не дает возможности говорить о частоте, распространенности данного явления. Для этой цели всегда необходимо знать численность среды, в которой проходит явление, и вычислить интенсивные коэффициенты.
Интенсивные коэффициенты характеризуют частоту (интенсивность, уровень, распространенность) явления в среде, в которой оно происходит и с которой непосредственно органически связано, за определенный промежуток времени, чаще всего за год.
При вычислении интенсивных коэффициентов необходимо знание двух статистических совокупностей, одна из которых представляет среду, а вторая — явление. Среда продуцирует это явление.
В демографической и санитарной медицинской статистике в качестве среды часто рассматривается население и при расчете к нему относят то или иное явление, например, число заболеваний за год, число рождений за год, число смертей за год и т.д. При вычислении показателя детской (младенческой) смертности средой является количество новорожденных и к нему относят число умерших детей в возрасте до 1 года.
Если вычисляется коэффициент летальности при туберкулезе, то средой будут все больные туберкулезом, а явлением - умершие от туберкулеза.
Коэффициенты интенсивности рассчитываются на основание 100, 1000, 10000, 100000 и т.д. в зависимости от распространенности явления. Однако в практике здравоохранения существуют общепринятые положения. Так, общая заболеваемость, рождаемость, смертность, младенческая смертность всегда выражается в промилле (%о), а заболеваемость с временной нетрудоспособностью рассчитывается на 100 работающих, летальность, частота осложнений выражаются в %.
Техника вычисления интенсивных коэффициентов выглядит следующим образом:
Например, в городе «Н» в 2001 г. жителей в возрасте 70—79 лет было 9845 человек; из этого числа в течение года умерло 784 человека. Для вычисления коэффициента смертности лиц в возрасте 70—79 лет необходимо составить и решить следующую пропорцию:
Коэффициент соотношения характеризует численное соотношение двух, не связанных между собой совокупностей, сопоставляемых только логически, по их содержанию. К ним относятся такие показатели, как число врачей или число больничных коек на 1000 населения; количество различных лабораторных исследований или число переливаний крови на 100 больных и т.д.
По методике вычисления коэффициенты соотношения сходны с интенсивными коэффициентами, хотя различны с ними по существу.
Дата добавления: 2015-01-29; просмотров: 2121;