WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 2 | 3 || 5 |

«Стентон Гланц Медико-биологическая Электронная книга Primer of BIOSTATISTICS FOURTH EDITION Stanton A. Glantz, Ph.D. ...»

-- [ Страница 4 ] --

8.3. На рис. 8.16 и в таблице под ним представлены результа ты четырех экспериментов. Вычислите для каждого экспери мента коэффициенты линейной регрессии и коэффициент кор реляции. В чем сходство и различие результатов эксперимен тов? Проверьте, выполняются ли условия применимости рег рессионного анализа.

8.4. Исследуя проницаемость сосудов сетчатки, Дж. Фиш ман и соавт. (G. A. Fishman et al. Blood-retinal barrier function in patients with cone or cone-rod dystrophy. Arch. Ophthalmoi, 104:545—548, 1986) решили выяснить, связан ли этот показа тель с электрической активностью сетчатки. Позволяют ли по лученные данные говорить о существовании связи?

Проницаемость сосудов Электрическая активность сетчатки сетчатки 19,5 0, 15,0 38, 13,5 59, 23,3 97, 6,3 119, 2,5 129, 13,0 198, 1,8 248, 6,5 318, 1,8 438, 8.5. Наиболее точную оценку объема левого желудочка дает рентгеноконтрастная вентрикулография — метод, требующий ка тетеризации сердца, а потому дорогой и небезопасный. Продол жается поиск методов, не требующих катетеризации. Р. Слуцкий* и соавт. (R. Slutsky et al. Left ventricular volumes by gated equilibrium * Роберт Слуцкий был обвинен в подтасовке данных, и ряд его работ объяв лен фальсификацией. Принадлежит ли цитируемая статья к их числу, мне неизвестно. Как бы то ни было, мы рассматриваем данные исключитель но в учебных целях. Интересующиеся судьбой работ Слуцкого могут об ратиться в Калифорнийский университет в Сан-Диего.

АНАЛИЗ ЗАВИСИМОСТЕЙ Рис. 8.16. К задаче 8.3.

Эксперимент А Эксперимент Б Эксперимент В Эксперимент Г X Y X Y X Y X Y 10 8,04 10 9,14 10 7,46 8 6, 8 6,95 8 8,14 8 6,77 8 5, 13 7,58 13 8,74 13 12,74 8 7, 9 8,81 9 8,77 9 7,11 8 8, 11 8,33 11 9,26 11 7,81 8 8, 14 9,96 14 8,10 14 8,84 8 7, 6 7,24 6 6,13 6 6,08 8 5, 4 4,26 4 3,10 4 5,39 19 12, 12 10,84 12 9,13 12 8,15 8 5, 7 4,82 7 7,26 7 6,42 8 7, 5 5,68 5 4,74 5 5,73 8 6, 278 ГЛАВА radionuclide angiography method. Circulation, 60:556—564, 1979) исследовали метод оценки объема левого желудочка по данным изо топной вентрикулографии с внутривенным введением изотопа.

Конечно-диастолический объем Конечно-систолический объем Изотопная Рентгенокон- Изотопная Рентгенокон вентрикуло- трастная вентри- вентрикуло- трастная вентри графия кулография графия кулография 75 101 35 48 75 30 126 126 52 93 106 23 201 195 103 260 265 182 40 60 14 293 288 166 95 94 27 58 67 24 91 81 50 182 168 139 91 89 50 88 102 40 161 150 57 118 94 41 120 129 48 Хорошо ли согласуются результаты?

8.6. Азотистый баланс — разность между количеством азо та, который попадает в организм с пищей, и количеством азота, выводимого из организма, — важный показатель полноценно сти питания. Отрицательный азотистый баланс свидетельству ет о том, что организм не получает достаточно белка. Нормы суточного потребления белка, рекомендуемые Всемирной организацией здравоохранения и Японским комитетом питания, рассчитаны главным образом на мужчин. Целью исследования К. Канеко и Г. Койке (К. Kaneko, G. Koike. Utilization and requi rement of egg protein in Japanese women. J. Nutr. Sci. Vitaminol.

(Tokyo), 31:43—52, 1985) было определить количество белка в АНАЛИЗ ЗАВИСИМОСТЕЙ рационе, необходимое для поддержания нулевого азотистого ба ланса у японских женщин. Связь суточного потребления азота и азотистого баланса определили при калорийности суточного рациона 37 и 33 ккал/кг. Были получены следующие данные.

Калорийность суточного рациона 37 ккал/кг 33 ккал/кг Потребление Азотистый Потребление Азотистый азота, мг/кг баланс, мг/кг азота, мг/кг баланс, мг/кг 49 –30 32 – 47 –22 32 – 50 –29 32 – 76 –22 51 – 77 –15 53 – 99 –10 51 – 98 –11 52 – 103 –10 74 118 –1 72 – 105 –4 74 – 100 –13 98 98 –14 97 – Найдите уравнения регрессии для обеих групп. Изобразите на одном рисунке результаты наблюдений и линии регрессии.

Является ли различие межцу линиями регрессии статистически значимым? Для группы 37 ккал/кг найдите величину потребле ния азота, обеспечивающую нулевой азотистый баланс.

8.7. В. Ернайчик (W. Jernajczyk. Latency of eye movement and other REM sleep parameters in bipolar depression. Biol. Psychiatry, 21:465—472, 1986), изучая физиологию сна при депрессии, стол кнулся с необходимостью оценки тяжести этого заболевания.

Шкала депрессии Бека основана на опроснике, заполняемом самим больным. Она проста в применении, однако специфич ность ее недостаточна. Применение шкалы депрессии Гамиль тона более сложно, поскольку требует участия врача, но имен но эта шкала дает наиболее точные результаты. Тем не менее автор был склонен использовать шкалу Бека. В самом деле, если ее специфичность недостаточна для диагностики, то это еще не 280 ГЛАВА говорит о том, что ее нельзя использовать для оценки тяжести депрессии у больных с уже установленным диагнозом. Срав нив оценки по обеим шкалам у 10 больных, В. Ернайчик полу чил следующие результаты.

Номер Оценка по шкале Оценка по шкале больного депрессии Бека депрессии Гамильтона 120 211 313 422 537 627 714 820 937 10 20 Насколько согласованы оценки?

8.8. Полоскание с хлоргексидином предотвращает образо вание зубного налета, но имеет вкус, который трудно назвать приятным, кроме того, оно окрашивает зубы. Полоскание на основе хлорида аммония приятнее на вкус, не окрашивает зубы;

считается, однако, что оно менее эффективно. Ф. Эшли и соавт.

(F. P. Ashley et al. Effect of a 0,1% cetylpyridinium chloride mouth rinse on the accumulation and biochemical composition of dental plaque in young adults. Caries Res., 18:465—471, 1984) сравнили эффективность двух видов полоскания. Участники исследова ния полоскали рот одним из растворов, после чего зубной налет отделяли и взвешивали. Опыт проводился 48 часов: за меньший срок налет не успевал накопиться в количестве, достаточном для точного взвешивания. Исследователей больше интересова ло образование налета за 24 часа, поэтому в середине опыта налет оценивали визуально по специально разработанной шка ле. Чтобы оценить точность визуальных оценок, их проводили и на 48-м часу и сравнивали с результатами взвешивания. Результаты АНАЛИЗ ЗАВИСИМОСТЕЙ сопоставления двух способов оценки зубного налета представ лены в таблице.

Визуальная оценка зубного Сухой вес налета, баллы зубного налета, мг 25 2, 32 1, 45 2, 60 2, 60 3, 65 2, 6S 3, 78 8, 80 5, 83 4, 100 5, 110 5, 120 4, 125 5, 140 11, 143 8, 143 11, 145 7, 148 14, 153 12, Насколько, судя по этим данным, можно полагаться на визу альный способ оценки?

8.9. Нормальный эритроцит легко меняет форму и проходит через мельчайшие сосуды. При генетическом дефекте -цепи гемоглобин полимеризуется, в результате форма части эритро цитов меняется, они становятся ригидными, закупоривают со суды и разрушаются. Такова в сильно упрощенном виде сущ ность серповидноклеточной анемии — тяжелого заболевания с многообразными проявлениями. Наиболее мучительны болевые кризы. Они развиваются, когда под влиянием гипоксии про исходит массовая полимеризация гемоглобина, деформация эритроцитов и закупорка сосудов. Существует предположение, 282 ГЛАВА что дело не только в деформации и ригидности эритроцитов — определенную роль играет также повышенная склонность эри троцитов к адгезии — прилипанию к эндотелию (внутренней выстилке сосудов). Р. Хебелл и соавт. (R. Hebbel et al. Erythrocyte adherence to endothelium in sickle-cell anemia: a possible deter minant of disease severity. N. Engl. J. Med., 302:992—995, 1980) решили выяснить, есть ли связь между тяжестью заболевания и адгезивностью эритроцитов. Прежде всего необходимо было разработать способы оценки этих признаков.

Для оценки тяжести серповидноклеточной анемии была по строена специальная шкала.

Показатель Число баллов Ежегодное число болевых кризов, требующих госпитализации или применения наркотических анальгетиков 1–5 6–10 более 10 Язвы на коже Поражение сетчатки Поражение ЦНС (судороги, инсульт) Поражение костей (инфаркты, асептический некроз) Баллы за отдельные признаки суммировали, таким образом казедый больной получал от 0 до 13 баллов и более (по 2 балла дается за каждый инфаркт или асептический некроз кости).

Для оценки адгезивности эритроцитов известное их коли чество наносили на культуру эндотелия, инкубировали и затем смывали. Подсчитав число смытых эритроцитов, определяли число прилипших. Одновременно такой же опыт делали с нор мальными эритроцитами. Результат выражали в виде коэффи циента адгезии: отношения числа прилипших эритроцитов боль ного к числу прилипших эритроцитов здорового.

Было обследовано 20 больных. У каждого оценили тяжесть заболевания и коэффициент адгезии. Подтверждают ли эти дан АНАЛИЗ ЗАВИСИМОСТЕЙ ные гипотезу о связи между адгезивностью эритроцитов и тя жестью серповидноклеточной анемии?

Тяжесть заболевания, баллы Коэффициент адгезии 0 1, 0 1, 1 1, 1 1, 1 1, 1 2, 1 2, 1 3, 2 2, 2 3, 3 3, 3 3, 3 6, 4 2, 5 3, 5 5, 5 17, 6 5, 9 19, 11 25, 8.10. Какова вероятность выявить коэффициент корреляции не меньше 0,6 при объеме выборки 39 и уровне значимости 5%?

8.11. Каков должен быть объем выборки, чтобы с вероят ностью 80% выявить коэффициент корреляции не меньше 0, при уровне значимости 5%.

8.12. Ожирение предрасполагает к развитию инсулинонеза висимого сахарного диабета. При этом играет роль тип ожире ния: наиболее опасным считается так называемое ожирение по мужскому типу, когда жир откладывается преимущественно на туловище (при ожирении по женскому типу жир откладывается главным образом на бедрах и ягодицах). Однако далеко не у всех людей с ожирением по мужскому типу развивается инсулине 284 ГЛАВА независимый сахарный диабет. Необходимо действие дополни тельного фактора, предположительно генетического. Т. Эндр и соавт. (Т. Endre et al. Insulin resistance is coupled to low physical fitness in normotensive men with a family history of hypertension.

J. Hypertension, 12:81—88, 1994) исследовали связь чувствитель ности к инсулину (ее снижение лежит в основе инсулинонеза висимого сахарного диабета) и отношения объема талии к объе му бедра (показатель типа ожирения). Индекс чувствительнос ти к инсулину рассчитывали как логарифм снижения уровня глюкозы плазмы после введения инсулина. В исследование вош ло 15 мужчин, у которых не было родственников первой степе ни с артериальной гипертонией (1 -я группа) и 15 мужчин, у которых такие родственники были (2-я группа).

1-я группа 2-я группа Отношение Индекс чувстви- Отношение Индекс чувстви объема талии к тельности к объема талии к тельности к объему бедра инсулину объему бедра инсулину 0,775 1,322 0,800 1, 0,800 1,301 0,810 0, 0,810 1,130 0,850 0, 0,800 0,929 0,875 0, 0,850 1,021 0,850 0, 0,860 1,000 0,870 0, 0,925 1,106 0,910 0, 0,900 0,954 0,925 0, 0,925 0,813 0,925 0, 0,945 1,041 0,940 0, 0,945 1,021 0,945 0, 0,950 0,978 0,960 0, 0,975 0,740 1,100 0, 1,050 0,778 1,100 0, 1,075 0,574 0,990 0, Одинакова ли связь показателей в обеих группах?

Глава Анализ повторных измерений В гл. 3—5 мы рассмотрели методы сравнения данных, получен ных на нескольких группах. В типичном случае мы сравнивали группу получавших препарат с группой получавших плацебо.

Об эффективности препарата судили по статистической значимо сти различий между этими группами. Если разброс в группах велик, эффект лечения «тонет» в нем, и мы не выявляем реаль но существующих различий. Существует другой подход. В нем вместо двух групп нужна одна, а сравнению подлежит состоя ние каждого больного до и после лечения. Методически такой подход достаточно труден — ведь нужно быть уверенным, что изменение состояния не обусловлено естественным течением болезни. Тем не менее учет изменения состояния у каждого боль ного в отдельности, нивелируя влияние разброса данных, значи тельно повышает чувствительность статистических критериев.

Выявить изменение, располагая парами наблюдений, позво ляет парный критерий Стьюдента. С него мы и начнем, после чего перейдем к сравнению более чем двух состояний больного.

286 ГЛАВА Для сравнения нескольких измерений, выполненных у каж дого из больных, предназначен дисперсионный анализ повтор ных измерений, В нем разброс результатов измерений разлага ется на три составляющие: разброс значений между больными, в реакциях одного и того же больного и, наконец, между мето дами лечения. Как обычно, рассматриваемые процедуры осно ваны на предположении о нормальном распределении измеряе мого признака. (В гл. 10 излагаются не требующие этого ранго вые методы.) И, завершая рассмотрение методов анализа повтор ных измерений, мы разберем критерий Мак-Нимара. Он позво ляет выявить изменения не числовых, а качественных призна ков, представленные таблицами сопряженности.

ПАРНЫЙ КРИТЕРИЙ СТЬЮДЕНТА Раньше, чтобы оценить эффективность лечения, мы выбирали две группы. Одна проходила лечение, другая нет. Затем мы вы числяли среднее по каждой группе и определяли статистичес кую значимость различия этих средних. Теперь мы набираем одну группу, измеряем у каждого больного значение признака до и после лечения и вычисляем изменение признака. Затем на ходим среднее изменение и проверяем статистическую значи мость его отличия от нуля.

Такой подход более точно улавливает различия, вызванные лечением, нежели сравнение двух независимых групп, «зашум ленное» разбросом значений у разных больных.

Почему такой подход повышает чувствительность критерия, легко понять из следующего примера. На рис. 9.1 А и 9.1 Б пред ставлены одни и те же данные. Различие в том, как они по лучены. Данные на рис. 9.1А получены в результате наблюде ния за двумя независимыми группами: левый столбец образуют данные о суточном диурезе больных, получавших плацебо, пра вый — получавших препарат. Напротив, оба столбца на рис. 9.1Б относятся к одним и тем же больным, левый содержит данные о величине диуреза до приема препарата, правый — после при ема. Отрезками соединены пары точек, относящиеся к одному больному.

АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ Рис. 9.1. А. Суточный диурез у 10 человек после приема плацебо и у других 10 человек после приема препарата (предполагаемого диуретика). На основании таких данных нельзя сделать вывод о наличии диуретического эффекта. Б. Суточный диурез у 10 че ловек после приема плацебо и у них же— после приема препарата. Диуретический эф фект налицо. Обратите внимание, что положение точек на обоих графиках одинаково.

Учет изменения диуреза у каждого обследованного в отдельности позволил выявить эффект, который был скрыт, пока мы рассматривали группы в целом.

Глядя на рис. 9.1 А, никак не скажешь, что препарат оказы вает диуретический эффект. Разброс данных слишком велик по сравнению со скромной тенденцией к увеличению диуреза.

Вычислив критерий Стьюдента, получим t = 1,33. Это меньше t0,05 =2,101 — критического значения при уровне значимости 0, и числе степеней свободы = 2(n – 1) = 2(10 – 1) = 18. Тем самым, статистически значимых различий не выявлено.

Казалось бы, результат в случае повторных измерений (рис.

9.1Б) будет таким же. Ведь положение точек на рисунках совпа дает. Однако теперь мы располагаем дополнительной ин формацией: мы знаем, как изменился диурез у каждого больно 288 ГЛАВА го. Судя по наклону отрезков, препарат увеличил диурез у 8 из 10 больных. А это достаточно веский довод в пользу того, что препарат — диуретик.

Перейдем к количественной оценке этого впечатления. Оце нить статистическую значимость изменения позволяет парный критерий Стьюдента. Нулевая гипотеза будет состоять в том, что среднее изменение равно нулю.

В общем случае критерий Стьюдента можно представить в таком виде:

Оценка параметра - Истинное значение параметра t =.

Стандартная ошибка оценки параметра Интересующий нас параметр — истинное среднее измене ние диуреза — обозначим. Его оценкой является наблюдае мое (выборочное) среднее изменение диуреза d. Выборочное стандартное отклонение изменения диуреза составляет d - d ( ) sd =, n - а стандартная ошибка sd sd =.

n Таким образом, критерий Стьюдента принимает вид:

d t =.

sd При условии справедливости нулевой гипотезы = 0. Подста вив это значение в формулу, получим:

d t =.

sd Осталось сравнить полученное значение с критическим для выбранного уровня значимости и числа степеней свободы = n – l.

Подытожим. Когда имеются данные об изменении интересу АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ ющего признака у каждого больного, для оценки статистичес кой значимости этих изменений нужно сделать следующее.

• Вычислить величину изменения для каждого больного d.

• Вычислить среднее этих изменений d и его стандартную ошибку.

sd • Вычислить значение критерия Стьюдента t = d sd.

• Сравнить полученное значение t с критическим для числа степеней свободы = п – 1.

Если обычный критерий Стьюдента требует нормального распределения самих данных, то парный критерий Стьюдента требует нормального распределения их изменений.

Курение и функция тромбоцитов Известно, что курение способствует развитию ишемический бо лезни сердца. Известно также, что определенную роль в патоге незе этого заболевания играют тромбоциты. Связан ли эффект курения с влиянием на тромбоциты? В поисках ответа на этот вопрос П. Левин исследовал влияние курения на функцию тром боцитов*. Одним из показателей, который интересовал иссле дователя, была агрегация тромбоцитов — доля тромбоцитов, слипшихся под воздействием аденозиндифосфата — вещества, стимулирующего агрегацию.

Одиннадцати добровольцам было предложено выкурить по сигарете. Перед курением и сразу после него были взяты пробы крови и определена агрегация тромбоцитов.

Результаты представлены на рис. 92. Левый столбик образо вали наблюдения до выкуривания сигареты, правый — после.

Отрезками соединены наблюдения, относящиеся к одному доб ровольцу. Когда из одной точки на рисунке выходит два отрезка, это значит, что данный результат наблюдался у двух больных.

Агрегация тромбоцитов до курения составила в среднем 43,1%, после курения — 53,5%. Стандартные отклонения равны 15,9 и 18,7% соответственно. Уже при взгляде на эти цифры ясно, что о статистической значимости различий вряд ли может идти речь.

* P. H. Levine. An acute effect of cigarette smoking on platelet function: a possible link between smoking and arterial thrombosis. Circulation, 48: 619-623, 1973.

290 ГЛАВА Рис. 9.2. Агрегация тромбоцитов до и после выкуривания сигареты. Агрегация тромбо цитов повысилась, но значит ли это, что она повысилась от табака?

Действительно, расчет критерия Стьюдента в том виде, в каком он был изложен в гл. 4, дает t = 1,405, что меньше критического значения для 5% уровня значимости и 20 степеней свободы. При сравнении двух независимых групп следовало бы признать вли яние курения статистически не значимым. Однако в данном слу чае наблюдалась одна группа, причем данные позволяют вы числить изменения для каждого ее члена.

Сделав это, мы обнаружим, что у всех обследованных, за ис АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ ключением одного, агрегация тромбоцитов после курения по высилась. Выпишем изменения у каждого из обследованных.

Получим 2, 4, 10, 12, 16, 15, 4, 27, 9, –1 и 15%. Средняя величи на изменения d = 10,3%. Стандартное отклонение величины изме нения sd = 8% и стандартная ошибка sd = 8,0 = 11 = 2,41%. Тог да:

d 10, t = = = 4,27.

sd 2, В табл. 4.1 находим критическое значение t0,01 для уровня зна чимости 0,01 и = п – 1 степеней свободы. Оно равно 3,169, то есть меньше полученного нами. Таким образом, повышение аг регации тромбоцитов после курения статистически значимо.

На этом выводе Левин не остановился. Если курение повы шает агрегацию тромбоцитов, то значит ли это, что повышение вызвано курением табака! Нет, не значит. С тем же успехом можно признать причиной вдыхание окиси углерода, выделяю щейся при горении сигареты. Не менее веской причиной будет и волнение, испытываемое участниками эксперимента. Имеющиеся данные не позволяют отвергнуть такие объяснения. Значит, нуж но провести эксперименты, совпадающие с исходным во всем, кроме интересующего нас фактора — в данном случае курения сигарет с табаком. Именно это и сделал Левин. Добровольцам пришлось выкуривать не только обычные, но и безникотиновые сигареты из салатных листьев. Кроме того, им предлагали по держать в зубах незажженную сигарету, изображая курение.

Результаты приведены на рис. 9.3 вместе с данными с рис. 9.2.

Оказалось, что в отличие от обычной сигареты незажженная или безникотиновая сигарета не вызывает повышения агрегации тромбоцитов.

Разобранное исследование служит иллюстрацией следующе го правила.

Единственным различием между контрольной и экспериментальной группой должно быть воздействие иссле дуемого, и никакого другого, фактора.

Чем лучше удается вычленить действие изучаемого фактора, тем достовернее выводы эксперимента. Так, рассмотренный экс 292 ГЛАВА Рис. 9.3. Агрегация тромбоцитов до и после изображения курения с незажженной сига ретой, выкуривания сигареты с салатными листьями, выкуривания сигареты с табаком.

Похоже, что именно табак, а не сам факт курения и не дым вызывает повышение агре гации тромбоцитов.

перимент доказал, что повышение агрегации тромбоцитов вы звано не просто курением, а именно курением табака.

Затронув вопрос о планировании эксперимента, стоит упо мянуть еще об одной важной проблеме. Кроме необходимости выделить исследуемый фактор и тем самым исключить неодно значное толкование результатов эксперимента, нужно избежать искажений, привносимых участниками эксперимента. В меди АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ цинских экспериментах человек не только оказывает воздействие и наблюдает его результат — он присутствует и как объект на блюдений. Но люди пристрастны и внушаемы. Пристрастность экспериментатора может повлечь неосознанную подтасовку. А лаборантке, поборнице некурения, не составит труда чуть-чуть завысить долю склеившихся тромбоцитов в крови курилыцика и чуть-чуть занизить ее для некурящего.

При проведении клинических испытаний на первый план выходит роль больного. Особенно велика она, если критерием эффективности служат его собственные оценки (боль умень шилась — усилилась, стал спать лучше — хуже). Вера больно го в новый метод лечения — могучий (и благотворный) фактор, однако объективной оценке он мешает. Вернемся к исследова ниям агрегации тромбоцитов. Как в данном случае на результат эксперимента может повлиять испытуемый? Человек не может усилием воли изменять состояние своих тромбоцитов, однако, обратившись еще раз к рис. 9.3, можно заметить, что у добровольцев, которым только еще предстояло выкурить (воз можно, безвредную салатную) сигарету, агрегация тромбоци тов была заметно выше, чем у тех, которым было известно, что им придется лишь подержать сигарету в зубах. Следовательно, не только субъективные оценки, но и объективные показатели могут изменяться под влиянием отношения испытуемого к экспериментальному воздействию.

Чтобы исключить влияние субъективного фактора, Левин применил двойной слепой метод. Суть метода в том, что экс периментальное воздействие не известно ни испытуемым, ни наблюдателям, оценивающим его результаты. В эксперименте Левина ни исследователям, ни добровольцам не было известно содержимое сигарет, а производившим анализ крови лаборан там — курил ли доброволец, и если да, то что именно.

В действительности исследование Левина не было полнос тью двойным слепым (о чем свидетельствуют различия исход ной агрегации тромбоцитов). Действительно, даже если о со держимом сигареты добровольцам не сообщали, они могли легко определить его на вкус.

Предвидя подобные трудности, исследование часто заранее планируют как простое слепое. В этом случае одна из сторон 294 ГЛАВА (обычно наблюдатель) осведомлена о характере эксперимен тального воздействия, а другая (обычно испытуемый) — нет.

Наконец, характер исследования может быть таков, что ни одну из сторон нельзя держать в полном неведении и обе располага ют частью информации — в таких случаях говорят о частично слепом исследовании.

Завершая обсуждение парного критерия Стьюдента, повто рим, что он используется для проверки эффективности одного метода лечения в случае, когда имеются данные о состоянии каждого участника до и после лечения. Когда же требуется срав нить эффективность нескольких методов лечения, испытанных на одних и тех же больных, применяют дисперсионный анализ повторных наблюдений. Для его изложения нам потребуется пересмотреть тот вариант дисперсионного анализа, который был изложен в гл. 3, то есть вариант на случай использования раз ных методов для лечения разных больных. Затем перейдем к варианту дисперсионного анализа на случай повторных наблю дений за одними и теми же больными, подвергаемыми разным методам лечения.

НОВЫЙ ПОДХОД К ДИСПЕРСИОННОМУ АНАЛИЗУ* Напомним вкратце схему дисперсионного анализа, изложенную в гл. 3. В качестве нулевой гипотезы мы брали предположение о том, что несколько (обычно более двух) методов лечения облада ют равной эффективностью, то есть экспериментальные груп пы — это просто выборки из одной нормально распределенной совокупности и различия между ними обусловлены случайно стью. Для проверки нулевой гипотезы мы сравнивали разброс * Если этот раздел, посвященный дисперсионному анализу повтор ных измерений, покажется вам слишком утомительным из-за оби лия выкладок, пропустите его при первом чтении. Только не забудь те вернуться, когда возникнет необходимость. А она обязательно воз никнет. Эксперименты, для обработки которых предназначен этот вариант дисперсионного анализа, типичны для медицины. Сам же анализ, увы, не очень. Чаще приходится сталкиваться с многократ ным использованием критерия Стьюдента, совершенно ошибочным (см. гл. 4).

АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ Таблица 9.1. Сердечный выброс, л/мин Группа Контрольная Макароны Мясо Фрукты 4,6 4,6 4,3 4, 4,7 5,0 4,4 4, 4,7 5,2 4,9 4, 4,9 5,2 4,9 4, 5,1 5,5 5,1 4, 5,3 5,5 5,3 5, 5,4 5,6 5,6 5, Среднее 4,96 5,23 4,93 4, Вариация 0,597 0,734 1,294 1, Среднее по всем группам = 4, Общая вариация = 4, значений относительно групповых средних с разбросом самих групповых средних. Если разброс средних значительно превы шал разброс значений, мы отвергали нулевую гипотезу. В качес тве показателя разброса мы использовали дисперсию. Диспер сию можно определить как сумма квадратов отклонений, делен ную на число степеней свободы. Теперь показателем разброса будет служить сама сумма квадратов отклонений*, которую мы будем называть вариацией. Основываясь на вариации, мы повто рим построение дисперсионного анализа. Перспектива второй раз разбирать уже знакомый метод не слишком вдохновляет, од нако мы будем вознаграждены: новый взгляд позволит нам пе рейти к дисперсионному анализу повторных измерений.

В гл. 3 мы рассмотрели такой пример. Чтобы выяснить, влия ет ли питание на сердечный выброс, из 200 обитателей городка были случайным образом выбраны четыре группы по семь чело век в каждой. Члены первой (контрольной) группы продолжали питаться как обычно, членам второй группы пришлось есть одни макароны, третьей — мясо, а четвертой — фрукты. Эксперимент длился ровно месяц, после чего у каждого участника был изме * Такой подход мы уже использовали в гл. 8 при рассмотрении регрес сионного анализа.

296 ГЛАВА рен сердечный выброс. Как видно из рис. 3.1, диета не влияет на величину сердечного выброса. Экспериментальные группы — это просто четыре случайные выборки из нормально распреде ленной совокупности. Однако рис. 3.1 недоступен исследовате лю, в распоряжении которого есть только данные об участни ках эксперимента. Эти данные представлены на рис. 3.2 и в табл.

9.1. Как видим, группы все же различаются по средней величи не сердечного выброса. Можно ли объяснить эти различия случайностью?

Новые обозначения Прежде чем двигаться дальше, введем новые обозначения (табл.

9.2). Отвлечемся от фруктов и макарон и вообще специфики рассматриваемого эксперимента. Перенумеруем группы от 1 до 4. Участников исследования также перенумеруем и впредь бу дем называть больными (хотя применительно к данному слу чаю это не совсем удачно). Значения признака (в данном случае это сердечный выброс) обозначим Х, например Х25 — значение гб у 5-го больного 2-й группы. Средние по группам обозначим, Xг например X3 — среднее по 3-й группе. Под средними в таблице мы видим групповые вариации Sг — суммы квадратов отклоне ний от среднего по группе:

Sг = Xгб - Xг.

() б Значок «б» под символом суммы означает, что мы суммиру ем значения для всех больных данной группы. Для примера рас считаем вариацию для 1-й группы:

S1 = X1б - X1 = () б =(4,6 – 4,96)2 + (4,7 – 4,96)2 + (4,7 – 4,96)2 + (4,9 – 4,96)2 + +(5,1 – 4,96)2 + (5,3 – 4,96)2 + (5,4 – 4,96)2 = 0,597.

Вспомним определение выборочной дисперсии:

X - X ( ) s2 =, n - АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ Таблица 9.2. Обозначения однофакторного дисперсионного ана лиза Группа Х11 Х21 Х31 Х Х12 Х22 Х32 Х Х13 Х23 Х33 Х Х14 Х24 Х34 Х Х15 Х25 Х35 Х Х16 Х26 Х36 Х Х17 Х27 Х37 Х Среднее Xг X1 X2 X3 X 2 2 2 ( ) ( ) ( ) ( ) Вариация Sг X1б - X1 X2б - X2 X3б - X3 X4б - X б б б б Среднее по всем группам X Xгб - X () Общая вариация г б где п — объем выборки. В числителе стоит сумма квадратов от клонений от выборочного среднего, то есть вариация. Тем са мым S s2 =.

n - Следовательно, выборочную дисперсию для группы можно записать как Sг sг =, n - где п — численность группы. Если все выборки извлечены из одной совокупности, оценкой ее дисперсии можно взять сред нее выборочных дисперсий. Такая оценка называется внутприг рупповой дисперсией:

2 2 2 2 sвну = s1 + s2 + s3 + s4, () m где m — число групп, в данном случае равное 4. Заменим теперь 298 ГЛАВА каждую выборочную дисперсию ее выражением через вариа цию:

1 S1 S2 S3 S, sвну =+ + + m n -1 n -1 n -1 n - где n — численность каждой из групп. Перенесем n – 1 под дроб ную черту:

1 S1 + S2 + S3 + S sвну =.

m n - В числителе — сумма вариаций по всем группам. Назовем ее внутригрупповой вариацией и обозначим Sвну. Обратите внима ние, что внутригрупповая вариация — это сумма квадратов от клонений от групповых средних, поэтому она не зависит от того, различаются эти средние или нет.

В примере с диетой и сердечным выбросом Sвну = 0,597 + 0,734 + 1,294 + 1,200 = 3,825.

Перепишем еще раз формулу для внутригрупповой диспер сии:

Sвну sвну =.

m n - ( ) В знаменателе теперь стоит выражение, знакомое нам по гл. 3.

Это внутригрупповое число степеней свободы: = m(n – 1). В вну рассматриваемом примере = 4(7 – 1) = 24. Таким образом, вну внутригрупповую дисперсию можно выразить через внугригруп повую вариацию и внутригрупповое число степеней свободы:

Sвну sвну =.

вну По данным из табл. 9.1 находим 3, sвну = = 0,159.

Как нам известно из гл. 3, чтобы вычислить F, помимо внут АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ ригрупповой нужна межгрупповая дисперсия. Внутригруппо вую дисперсию нам удалось выразить через вариацию и число степеней свободы. Проделаем те же действия с межгрупповой дисперсией.

Межгрупповая дисперсия sмеж отражает разброс групповых средних. Мы вычисляли ее по формуле 2 sмеж = nsX.

Здесь равно sX 222 X1 - X + X2 - X + X3 - X +… + Xm - X ( ) ( ) ( ) ( ) sX =.

m - В более общем виде:

Xг - X ( ) г sX =, m - где т — число групп. Под символом суммы стоит значок «г», это означает, что теперь мы суммируем по группам, а не по боль ным. Подставив это выражение в формулу межгрупповой дисперсии, получим:

n Xг - X ( ) г sмеж =, m - Величину в числителе назовем межгрупповой вариацией и обозначим Sмеж:

Sмеж = n Xг - X.

( ) г Тогда Sмеж sмеж =.

m - В этой формуле мы снова обнаруживаем число степеней сво боды из гл. 3, на этот раз это межгрупповое число степеней сво боды: = т – 1. Тем самым меж 300 ГЛАВА Sмеж sмеж =.

меж В нашем примере (табл. 9.1) = m – 1 = 4 – 1 = 3. Тогда меж sмеж = 0,685 3 = 0,228.

Формула для критерия F в новых обозначениях принимает вид:

Sмеж меж F =.

Sвну вну Соответственно, в рассматриваемом примере 0, F = =1,4.

0, Новая формула для F получена непосредственно из приве денной в гл. 3 и отличается от нее только обозначениями. Поэто му, конечно, значение F = 1,4 совпадает с найденным в гл. 3.

Естественно спросить, зачем же потребовались столь про странные рассуждения и многочисленные тождественные заме ны? Неужели для одного только повторения ранее полученных результатов? Ответ состоит в том, что переход к использованию вариации дает возможность понять, из каких компонентов она складывается, и в дальнейшем перейти к дисперсионному ана лизу повторных измерений.

Разложение общей вариации Внутригрупповая вариация Sвну служит мерой разброса значе ний внутри трупп. В свою очередь, межгрупповая вариация Sмеж — это мера разброса групповых средних, то есть различий между группами. Но существует и мера общего разброса зна чений. Это общая сумма квадратов отклонений всех наблюдае мых значений от их общего среднего. Она называется общей вариацией и обозначается Sобщ:

Sобщ = Xгб - X.

() г б АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ Два символа суммы означают, что суммирование произво дится по всем группам и всем больным внутри каждой группы.

Число степеней свободы общей вариации обозначается общ и равно тп – 1, то есть оно на единицу меньше общего числа больных (т — число групп, п — число больных в каждой груп пе).

В рассматриваемом примере Sобщ = 4,51 и = 4 7 – 1 = общ Обратите внимание, что общая дисперсия, вычисленная по всем наблюдениям, равна Xгб - X () Sобщ Sобщ г б sобщ == =.

mn -1 mn -1 общ Существует ли связь между рассмотренными видами вариа ции: общей, внугригрупповой и межгрупповой? Оказывается, существует, и очень простая. Общая вариация равна сумме внут ригрупповой и межгрупповой вариаций:

Sобщ = Sвну + Sмеж.

Докажем справедливость этого разложения (это доказатель ство можно пропустить). Тождественно верно Xгб - X = Xгб - Xг + Xг - X.

() () ( ) Возведем левую и правую части тождества в квадрат:

Xгб - X = Xгб - Xг + Xг - X.

() () ( ) Просуммируем левую часть по всем наблюдениям:

Xгб - X.

() г б Это не что иное, как общая вариация Sобщ.

Правая часть преобразуется в Xгб - Xг + 2 Xгб - Xг Xг - X + Xг - X.

() ()( ) ( ) Суммируя по всем наблюдениям, получим Xгб - Xг + 2 Xгб - Xг Xг - X + Xг - X.

() ()( ) ( ) г б г б г б 302 ГЛАВА Первый член этого выражения, Xгб - Xг, представ () г б ляет собой значение Sвну.

Покажем, что второй член, 2 Xгб - Xг Xг - X, тожде ()( ) г б ственно равен нулю.

В самом деле, разность - X Xг в каждой из групп посто ( ) янна, и поэтому ее можно вынести за знак суммирования по больным:

2 Xгб - Xг Xг - X = 2 Xг - X Xгб - Xг.

()( ) ( ) () г б г б Но— это среднее по группе, то есть Xгб б Xг =.

n В таком случае Xгб - Xг = Xгб - Xг = Xгб - nXг = () бб б б Xгб = n б - Xг = n Xг - Xг = 0.

() n Рассмотрим третий член. Поскольку Xг - X для всех боль ных в группе одинаково, Xг - X = n Xг - X, ( ) ( ) бг а это величина Sмеж.

Итак, имеем:

Sобщ = Sвну + 0 + Sмеж = Sвну + Sмеж, что и требовалось доказать.

Как общая вариация разлагается на две составляющие — вну тригрупповую и межгрупповую, так и общее число степеней свободы разлагается на внутригрупповое и межгрупповое. Дей ствительно, поскольку = mn – 1, = m – 1 и = m(n – 1), то общ меж вну + = m – 1 + m(n – 1) = m(l + n – l) – l = mn – l =.

меж вну общ АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ Рис. 9.4. Разложение вариации и числа степеней свободы при дисперсионном анализе.

Таблица 9.3. Таблица дисперсионного анализа для эксперимента с 4 диетами Число степеней Вариация свободы Дисперсия Межгрупповая 0,685 3 0, Внутригрупповая 3,825 24 0, Общая 4,51 Sмеж меж 0, F == =1, Sвну вну 0, 304 ГЛАВА Рис. 9.5. Разложение вариации и числа степеней свободы при дисперсионном анализе повторных измерений.

АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ Оба разложения изображены на рис. 9.4. Перечисленные ве личины обычно включают в таблицы дисперсионного анализа наподобие табл. 9.3.

Теперь, наконец, мы располагаем средствами, необходимы ми в дисперсионном анализе повторных измерений.

ДИСПЕРСИОННЫЙ АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ До сих пор мы имели дело с несколькими группами больных, которые подвергались различным методам лечения. В дисперсионном анализе повторных измерений ситуация иная:

одни и те же больные последовательно подвергаются несколь ким методам лечения или просто наблюдаются в несколько пос ледовательных моментов времени. По-другому распределяется и общая вариация Sобщ (рис. 9.5). Прежде всего можно выделить межиндивидуальную (SМИ) и внутрииндивидуальную (SВИ) ва риацию, последняя, в свою очередь, распадается на обусловлен ную методом лечения (Sле) и остаточную (Sост), обусловленную случайными колебаниями, ошибкой измерения и т. п.

Обозначения, которые мы будем использовать в дисперсион ном анализе повторных измерений, приведены в табл. 9.4. Пред ставлены 4 больных, каждого из которых последовательно ле чили 3 методами. Значения интересующего нас признака обо Таблица 9.4. Обозначения, используемые в дисперсионном ана лизе повторных измерений Метод лечения Среднее Вариация Больной 12 3Xб SВИб 1 X11 Х21 Х31 X1 Xм ( - X ) м Xм 2 Х12 Х22 Х32 X2 ( - X ) м Xм 3 Х13 Х23 X33 X3 ( - X ) м 4 Х14 Х24 Х34 X4 Xм ( - X ) м Среднее T1 T2 T 306 ГЛАВА значены Х, например, Х12 — значение у 2-го больного при 1-м мб методе лечения, Х31 — значение у 1-го больного при 3-м методе лечения и так далее. Величины (,, и ) — это Xб X1 X2 X3 X «индивидуальные» средние (средние значения признака при всех методах лечения у 1-го, 2-го и т. д. больного):

Xмб м Xб =, m где т — число методов лечения. (,, и ) — средние Tм T1 T2 T3 T значения признака у всех больных при 1-м, 2-м и т. д. методе лечения:

Xмб б Tм =, n где п — число больных.

Общая вариация — это сумма квадратов отклонений всех зна чений (у всех больных при всех методах лечения) от общего среднего, которое составляет Xмб м б X = ;

mn таким образом, Sобщ = Xмб - X.

() м б Соответствующее число степеней свободы = тп – 1.

общ Общая вариация складывается из межиндивидуальной и внутрииндивидуальной вариации. Рассчитаем внутрииндивиду альную вариацию SВИ. У первого больного сумма квадратов от клонений от индивидуального среднего X1 равна SВИ = Xм1 - X1.

() м У второго больного SВИ = Xм2 - X2.

() м АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ и так далее. Чтобы рассчитать внутрииндивидуальную вариа цию, просуммируем по всем больным:

SВИ б SВИ = SВИ + SВИ + SВИ + SВИ = Xмб - Xб.

() 1 2 3 б м Соответствующее число степеней свободы составляет ВИ = = n(m – 1).

Перейдем к межиндивидуальной вариации. Она складывается из квадратов отклонений индивидуальных средних от об Xб щего среднего X :

SМИ = m Xб - X.

( ) Множитель т появляется из-за того, что каждое — это Xб среднее по т методам лечения. Число степеней свободы МИ = = n – 1.

Можно показать*, что общая вариация равна сумме внутри- и межиндивидуальной вариаций:

Sобщ = SВИ + SМИ.

Теперь из внутрииндивидуальной вариации нам предстоит выделить вариацию, связанную с лечением Sле, и остаточную вариацию Sост, связанную со случайными отклонениями и ошиб ками измерения. Вариация, связанная с лечением, складывает ся из квадратов отклонений средних по методам лечения от Tм общего среднего X :

Sле = n Tм - X.

( ) Наличие коэффициента п связано с тем, что каждое Т — это м среднее по п больным.

Соответствующее число степеней свободы = m – 1.

ле Остаточная вариация — вторая составляющая внутриинди видуальной вариации — получается вычитанием:

Sост = SВИ - Sле.

* Вывод этого равенства см. в: В. J. Winer, D. R. Brown, К. М. Michels.

Statistical principles in experimental design, 3d ed. McGraw-Hill, New York, 1991.

308 ГЛАВА Аналогично вычисляется и остаточное число степеней свобо ды :

ост = ВИ – = n(m –1) – (m – 1) = (n – 1)(m – 1).

ост ле Теперь мы можем получить две независимые оценки диспер сии: на основании вариации, связанной с лечением Sле sле =, ле и на основании остаточной вариации:

Sост sост =, ост после чего можно применить знакомый нам критерий F:

sле F =.

sост Далее следует поступить как при обычном дисперсионном анализе. Вычисленное значение F сравнивают с критическим для выбранного уровня значимости и числа степеней свободы.

Чтобы воспользоваться табл. 3.1, нужно в качестве взять меж, а в качестве — соответственно.

ле вну ост Боюсь, читателя утомили сложные выкладки и громоздкие термины, которыми несколько перегружен этот раздел. Пора пе рейти к практическим применениям. Как мы уже говорили, дис персионный анализ повторных наблюдений можно использо вать не только когда к одним и тем же больным применяется несколько методов лечения, но и когда больные просто наблюда ются в несколько разных моментов времени. Именно на таком, очень простом примере мы и рассмотрим применение дисперси онного анализа повторных измерений.

Гидралазин при первичной легочной гипертензии Первичная легочная гипертезия — редкое и чрезвычайно тяже лое заболевание, при котором вследствие неизвестных причин повышается давление в артериях легких. Стенки артерий утол АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ щаются, что затрудняет газообмен в легких. Из-за повышенной нагрузки на правый желудочек страдает сердце. Без лечения больные живут не более нескольких лет. Гидралазин — препа рат, расширяющий сосуды, — успешно используется при гипертонической болезни. Л. Рубин и Р. Питер* предположили, что его можно использовать и при первичной легочной гипер тензии. В исследование вошли 4 больных. Измерения произво дили трижды: перед началом лечения, спустя 48 ч и 3—6 мес лечения. (В дальнейшем мы будем говорить просто о 1,2 и 3-м измерениях.) Измеряли, в частности, легочное сосудистое со противление. Этот показатель отражает тяжесть легочной ги пертензии: чем выше сопротивление, тем тяжелее гипертензия.

Результаты представлены на рис. 9.6. Похоже, данные говорят в пользу препарата. С другой стороны, они получены на мало численной выборке. Поэтому не будем доверяться впечатлени ям, а воспользуемся дисперсионным анализом повторных из мерений.

Обратимся к табл. 9.5. Здесь помимо первичных данных при ведены средние значения легочного сосудистого сопротивления для каждого из 4 больных и для каждого из трех моментов изме рения. Например, у второго больного среднее легочное сосуди стое сопротивление составило 17,0 + 6,3 + 6, X2 == 9,83, а среднее легочное сосудистое сопротивление при 1-м измере нии:

22,2 +17,0 +14,1+17, T1 ==17,58.

Среднее сопротивление по всем измерениям = 11,63, а об X щая вариация Sобщ = 289,82.

В табл. 9.5 приведены также суммы квадратов отклонений от индивидуального среднего. Например, для второго больного SВИ = (17,0 – 9,83)2 + (6,3 – 9,83)2 + (6,2 – 9,83)2 = 77,05.

* L. J. Rubin and R. H. Peter. Oral hydralazine therapy for primary pulmonary hypertension. N. Engl. J. Med., 302:69—73, 1980.

310 ГЛАВА Рис. 9.6. Изменение легочного сосудистого сопротивления у 4 больных с легочной ги пертензией при лечении гидралазином.

Внутрииндивидуальная вариация составляет SВИ = 147,95 + 77,05 + 18,35 + 21,45 = 264,80.

Можно найти межиндивидуальную вариацию SМИ = 3[(12,73 – 11,63)2 + (9,83 – 11,63)2 + + (10,63 – 11,63)2 + (13,33 – 11,63)2] = 25,02.

Заметьте, что, как это и должно быть, выполняется равенство Sобщ = SВИ + SМИ.

Рассчитаем Sле (теперь эта вариация связана со временем, но мы оставим прежнее обозначение):

Sле = 4[(17,58 – 11,63)2 + (7,73 – 11,63)2 + (9,60 – 11,63)2] = 218,93.

Соответствующее число степеней свободы:

АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ Таблица 9.5. Легочное сосудистое сопротивление у больных пер вичной легочной гипертензией на фоне лечения гидралазином Измерение Больной 1 2 3 Среднее Вариация 1 22,2 5,4 10,6 12,73 147, 2 17,0 6,3 6,2 9,83 77, 3 14,1 8,5 9,3 10,63 18, 4 17,0 10,7 12,3 13,33 21, Среднее 17,58 7,73 9, Общее среднее X = 11,63. Общая вариация Sобщ = 289,82.

= m – 1 = 3 – 1 = 2.

ле Наконец, остаточная вариация определяется равенством Sост = SВИ – Sле = 264,80 – 218,93 = 45, и имеет = (n – 1)(m – 1) = (4 – 1)(3 – 1) = 6 степеней свободы.

ост Все найденные величины сведены в табл. 9.6. Обратите вни мание, что здесь общая вариация разложена на большее число составляющих, чем в табл. 9.3. Причина в том, что теперь рас сматриваются результаты повторных измерений одной группы, а не однократных измерений нескольких групп.

Вычисляем оценку дисперсии на основании вариации, обу словленной лечением:

Sле 218, sле = = =109, ле и на основании остаточной вариации:

Sост 45, sост = = = 7,65.

ост Теперь, наконец, можно вычислить F:

sле F = =14,31.

sост Критическое значение для числа степеней свободы = 2 и меж 312 ГЛАВА Таблица 9.6. Таблица дисперсионного анализа (исследование гидралазина при первичной легочной гипертензии) Число степеней Оценка Вариация свободы дисперсии Межиндивидуальная SМИ = 25,02 Внутрииндивидуальная SВИ = 264,80 обусловленная лечением Sле = 218,93 2 109, остаточная Sост = 45,87 6 7, Общая Sобщ = 289,82 sле F = =14, sост = 6 составляет 10,92, то есть меньше полученного нами. Та вну ким образом, легочное сосудистое сопротивление нельзя счи тать постоянным. По крайней мере в один из моментов легоч ное сосудистое сопротивление значимо отличается от наблюда емого в остальные моменты. Ответить на вопрос, что это за момент и что это за отличия, дисперсионный анализ не может.

Для этого следует воспользоваться методами множественных сравнений (гл.4).

Как выявить различия в повторных измерениях В гл. 4 мы познакомились с критерием Стьюдента с поправкой Бонферрони. Он вычисляется как обычный критерий Стьюдента:

Xi - X j t =.

2s n Однако уровень значимости в каждом из сравнений, соглас но поправке Бонферрони, принимается равным = /k, где — истинный уровень значимости (по всем сравнениям в целом), а k — число сравнений. Критерий Стьюдента с поправкой Бон феррони, как и другие методы множественного сравнения, при меняется лишь после того, как дисперсионный анализ обнару жит сам факт существования различий.

АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ При дисперсионном анализе повторных измерений схема ис пользования критерия остается прежней. Отличие в том, что в формуле для t вместо s2 следует взять остаточную дисперсию sост, а средние по группам заменить на средние по методам ле чения (моментам наблюдения) Tм. Тогда формула для t примет вид:

Ti - Tj t =.

2sост n Полученное значение нужно сравнить с критическим зна чением для распределения Стьюдента при степенях свобо ост ды.

Вернемся к эксперименту с гидралазином. Остаточная оцен ка дисперсии sост = 7,65. Число больных при каждом измерении n = 4.

Сравним 1-е и 2-е измерения:

17,58 - 7, t == 5,036.

2 7, Сравним 1-е и 3-е измерения:

17,58 - 9, t == 4,080.

2 7, И наконец, 2-е и 3-е измерения:

7,73 - 9, t == -0,9561.

2 7, Чтобы вероятность ошибочно обнаружить различие была в совокупности по всем трем сравнениям меньше 0,05, нужно в каждом отдельном сравнении использовать в три раза меньший уровень значимости 0,05/3 = 0,016. Для этого уровня значимости 314 ГЛАВА и при числе степеней свободы = 6 находим по табл. 4.1 кри тическое значение, приближенно равное 3,37 (поскольку табли ца не содержит значений для = 0,016, оно расчитывается приблизительно по соседним значениям = 0,01 и = 0,02).

Значения t для первых двух сравнений больше критического, а для третьего — меньше. Поэтому при уровне значимости 0, (но ни в коем случае не 0,016, используемом в каждом сравне нии) различие в величине общего легочного сопротивления до и после приема гидралазина статистически значимо, а между из мерениями на фоне приема гидралазина статистически незначимо.

Заканчивая обсуждение парных сравнений, скажем, что вме сто поправки Бонферрони можно воспользоваться более точным критерием Ньюмена—Кейлса или критерием Тыоки. Кроме того, в рассматриваемом примере, где измерения, выполненные до начала лечения, играют роль «контрольной группы», пригоден и критерий Даннета для множественного сравнения с контро льной группой. Все эти критерии описаны в гл. 4. При их при менении нужно, как и в случае критерия Стьюдента с поправкой Бонферрони, в качестве оценки дисперсии брать, а при на sост хождении критического значения использовать число степеней свободы остаточной вариации.

Чувствительность дисперсионного анализа повторных измерений Чувствительность вычисляется так же, как в обычном дисперси онном анализе, с той разницей, что в качестве оценки для s ис пользуется sост, а вместо численности отдельных групп — чис ленность единственной рассматриваемой группы.

КАЧЕСТВЕННЫЕ ПРИЗНАКИ: КРИТЕРИЙ МАК-НИМАРА Парный критерий Стьюдента и дисперсионный анализ повтор ных измерений применимы, только если зависимый признак яв ляется числовым и, сверх того, подчиняется нормальному зако ну распределения. Как быть, если признак качественный, то есть имеет своими значениями не числа, а «названия» (с такими при АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ знаками мы познакомились в гл. 5). Они часто встречаются в медицине. Например, диагноз — типичный качественный при знак. Сейчас мы познакомимся с критерием Мак-Нимара. Он предназначен для анализа повторных измерений качественных признаков и в некотором смысле является аналогом парного критерия Стьюдента. Знакомство с новым критерием мы нач нем с примера.

Проба с динитрохлорбензолом при онкологических заболеваниях Ослабление иммунитета повышает риск онкологических забо леваний. Считается также, что при уже развившемся злокачест венном новообразовании ослабление иммунитета — плохой прогностический признак и наоборот — сохранность иммуни тета говорит о высокой вероятности успеха лечения. Для оцен ки состояния иммунитета применяется кожная проба с динитро хлорбензолом. Проба считается положительной, если через часов после нанесения динитрохлорбензола на кожу развивает ся выраженная воспалительная реакция. Положительная проба говорит о сохранности иммунитета.

Ряд авторов оспаривают значение пробы, указывая, в част ности, на то, что воспалительная реакции может быть вызвана местнораздражающим действием динитрохлорбензола и не от ражает состояния иммунитета.

Чтобы выяснить этот вопрос, Рот и соавт.* проделали сле дующий опыт. На кожу больных наносили динитрохлорбензол и одновременно — на соседний участок кожи — кротоновое масло. Кротоновое масло оказывает местнораздражающее дей ствие, которое не зависит от состояния иммунитета. Если оба раздражителя вызовут сходную реакцию, рассуждал автор, то в обоих случаях она не отражает состояния иммунитета.

В табл. 9.7 приведены результаты опыта. Знак «плюс» соот ветствует наличию реакции, знак «минус» — отсутствию. При виде такой таблицы хочется немедленно рассчитать 2. Посмот * J. A. Roth, F. R. Eilber, J. A. Nizle, D. L. Morton. Lack of correlation between skin reactivity to dinitrochlorobenzene and croton oil in patients with cancer.

N. Engl. J. Med., 293:388–389, 1975.

316 ГЛАВА рим, что из этого получится. Вычисленное с поправкой Йейтса значение 2 = 1,107. Это заметно меньше критического значе ния 3,841, соответствующего уровню значимости 0,05 при од ной степени свободы. Напрашивается вывод вроде: «Статисти чески значимых различий между реакцией на динитрохлорбен зол и кротоновое масло не выявлено».

В этой формулировке есть неточность, на первый взгляд не значительная. При построении критерия 2 в гл. 5 мы проверя ли нулевую гипотезу об отсутствии связи между признаками.

Например, мы предполагали, что аспирин не влияет на частоту тромбоза. Если нулевая гипотеза отвергалась, мы признавали существование связи между признаками. Если строки таблицы представлены двумя методами лечения, это равнозначно приз нанию различий эффективности этих методов. В данном слу чае это не так, поэтому мы должны ограничиться констатацией отсутствия связи между реакцией на динитрохлорбензол и кро тоновое масло. В отличие от поспешного вывода, который мы привели выше, это утверждение говорит в пользу самостоятель ного значения пробы с динитрохлорбензолом: если бы она да вала те же резулътатьт, что и проба с кротоновым маслом, это как раз и говорило бы о том, что ее результат, скорее всего, обус ловлен местнораздражающим действием.

Этого мало. С помощью критерия Мак-Нимара мы покажем, что динитрохлорбензол дает меньше положительных результа тов пробы, чем кротоновое масло.

Реакция только на динитрохлорбензол наблюдалась у 23 боль ных, а только на кротоновое масло — у 48. Если действие ди нитрохлорбензола и кротонового масла примерно одинаково, то больные, у которых наблюдалась реакция только на один раз дражитель, разделились бы примерно поровну — у одной поло вины реакцию вызвал бы динитрохлорбензол, у другой — крото новое масло. Следовательно, ожидаемое число в обоих случаях (23 + 48)/2 = 35,5. Для сравнения наблюдаемых чисел с ожидае мыми воспользуемся критерием 2. (Поскольку число степеней свободы равно 1, применим также поправку Йейтса.) Имеем:

АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ Таблица 9.7. Кожная реакция на ДНХБ и кротоновое масло Реакция на динитрохлорбензол +– + 81 Реакция на кротоновое масло – 23 O - E - 2 = = E 23 - 35,5 - 48 - 35,5 =+= 8,817.

35,5 35, Для уровня значимости 0,01 табличное значение 2 с одной степенью свободы равно 6,635 (см. табл. 5.7), то есть меньше вычисленного. Таким образом, оказывается, что действие дини трохлорбензола отличается от действия кротонового масла.

Рассмотренный пример показывает, сколь далекими от исти ны могут оказаться выводы при необоснованном применении статистических методов.

Критерий Мак-Нимара, подобно парному критерию Стью дента, часто используется для выявления изменений в наблюде ниях типа «до—после», когда интересующий нас признак при нимает одно из двух значений («есть—нет»). Другое, очень важ ное, применение критерия связано с анализом парных наблю дений. Что это такое, вы узнаете, решив задачи 9.9 и 9.10.

А теперь перечислим шаги критерия Мак-Нимара.

• Исключите из рассмотрения больных, реакция которых была неизменной, и подсчитайте число тех, чья реакция изменилась.

• Поделите это число пополам.

• Вычислите меру отклонения наблюдаемого числа меняющих реакцию больных от ожидаемого. Для этого воспользуйтесь критерием 2 с поправкой Йейтса.

• Сравните полученное значение 2 с критическим, имеющим одну степень свободы.

318 9.1..., 8.8, :.,. ( ).

.

32 60 25 45 65 60 68 83 120 110 ?

9.2. (, ),.,. :,.

.. (. Baker et al. Influence of preimmunization antibody levels on the specificity of the immune response to related polysaccharide antigens. N. Engl. J. Med., 303:173—178, 1980) 20..

АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ Концентрация антител до и после вакцинации Антитела к пневмококкам, Антитела к стрептококкам, мкг/мл мкг/мл После После До вакцинации вакцинации До вакцинации вакцинации 79 163 0,4 0, 100 127 0,4 0, 133 288 0,4 0, 141 1154 0,4 0, 43 666 0,5 0, 63 156 0,5 0, 127 644 0,5 0, 140 273 0,5 0, 145 231 0,5 0, 217 1097 0,6 12, 551 227 0,6 0, 170 310 0,7 1, 1049 1189 0,7 1, 986 1695 0,8 0, 436 1180 0,9 1, 1132 1194 0,9 1, 129 1186 1,0 2, 228 444 1,0 0, 135 2690 1,6 8, 110 95 2,0 3, Оцените статистическую значимость изменения уровня ан тител к пневмококкам и стрептококкам.

9.3. Чему равна вероятность обнаружить не менее чем дву кратное увеличение концентрации антител к пневмококкам и стрептококкам при уровне значимости 0,05? Графики чувстви тельности критерия Стьюдента, изображенные на рис. 6.9, при менимы к парному критерию Стьюдента, если используемое в них п приравнять к удвоенному объему выборки.

9.4. Решите задачу 9.2 с помощью дисперсионного анализа повторных измерений. Как связаны между собой значения F и парного критерия Стьюдента?

320 ГЛАВА 9.5. При ишемической болезни сердца курение может выз вать приступ стенокардии. Это связано с тем, что никотин уве личивает потребность миокарда в кислороде, а окись углерода связывается с гемоглобином, тем самым снижая поступление кислорода. Однако не способствуют ли развитию приступов и другие компоненты табачного дыма? Чтобы выяснить это, У.

Аронов (W. Aronow. Effect of non-nicotine cigarettes and carbon monoxide on angina. Circulation, 61:262—265, 1979) определил у 12 больных ишемической болезнью сердца продолжительность физической нагрузки до развития приступа стенокардии. У каж дого больного опыт проводили до и после выкуривания пяти безникотиновых сигарет, а затем до и после вдыхания эквива лентного количества окиси углерода. Были получены следую щие результаты.

Длительность нагрузки до развития приступа стенокардии, се кунды Курение безникотиновых Вдыхание окиси сигарет углерода Больной До После До После 1 289 155 281 2 203 117 186 3 359 187 372 4 243 134 254 5 232 135 219 6 210 119 225 7 251 145 264 8 246 121 237 9 224 136 212 10 239 124 250 11 220 118 209 12 211 107 226 Какие выводы позволяют сделать эти данные?

9.6. Определяя эффективность гидралазина, Л. Рубин и Р.

Питер измеряли не только легочное сосудистое сопротивление, но и сердечный выброс. Результаты приведены в таблице.

АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ Измерение Больной 1 3,5 8,6 5, 2 3,3 5,4 8, 3 4,9 8,8 6, 4 3,6 5,6 5, Менялся ли сердечный выброс?

9.7. Существует операция ушивания желудка для похудания.

Уменьшенный желудок наполняется быстрее и чувство насыще ния возникает при меньшем объеме съеденной пиши. Нельзя ли обойтись без операции и ограничиться сдавливанием живота надувным поясом? При оценке эффективности последнего ме тода А. Гелибтер и соавт. (A. Geliebter et al. Extraabdominal pres sure alters food intake, intragastric pressure, and gastric emptying rate. Am. J. Physiol., 250:R549—R552, 1986) наблюдали, какой объем пищи съедают добровольцы. Однако истинная цель исследования была скрыта. Участникам опыта объясняли, что по давлению внутри поясов измеряется увеличение живота во время еды и что исследователям нужно подобрать такое исход ное давление, при котором измерения были бы наиболее точны.

От участников требовалось есть до появления сытости. Вот ка ких показателей они достигли.

Исходное давление в поясе, мм рт. ст.

Участник 010 1 448 470 2 472 424 3 631 538 4 634 496 5 734 547 6 820 578 7 643 711 Что позволяют заключить эти данные?

9.8. По данным предыдущей задачи определите вероятность выявить снижение объема съеденной пищи на 100 мл при уров не значимости 5%.

322 ГЛАВА 9.9. У плода легкие не функционируют. Артериальный про ток — сосуд, соединяющий аорту и легочную артерию, — позво ляет крови, минуя легкие, попадать в плаценту, где и происхо дит газообмен. После рождения артериальный проток закрыва ется;

если этого не происходит, то кровь, по-прежнему минуя легкие, не насыщается кислородом и не очищается от двуокиси углерода. Закрытию артериального протока способствует индо метацин. Однако на результаты лечения влияет множество обсто ятельств — гестационный возраст, возраст начала лечения, со путствующие заболевания и их лечение. В таких случаях для оценки лечения можно применить следующий метод: найти па ры детей с совпадающими значениями всех факторов, которые могут повлиять на результат терапии, затем случайным обра зом одному ребенку из пары назначить индометацин, а другому — плацебо. Предположим, такое исследование было проведено и дало следующий результат:

Индометацин Эффект есть Эффекта нет Плацебо Эффект есть 65 Эффекта нет 27 Эффективен ли индометацин?

9.10. Представим результаты исследования по-другому.

Эффект есть Эффекта нет Индометацин 92 Плацебо 78 Какой вывод можно сделать по этим данным? Почему из менилось заключение по результатам того же исследования? Ка кой способ представления результатов лучше?

9.11. Просмотрите все статьи, опубликованные в доступном вам медицинском журнале за последний год. В скольких из них можно было бы применить дисперсионный анализ, повторных измерений? В скольких из них он действительно использован?

Какие методы использованы в остальных статьях? Совпали бы, по-вашему, их выводы с выводами дисперсионного анализа по вторных измерений?

Глава Непараметрические критерии Для определения эффективности одного или нескольких мето дов лечения используется дисперсионный анализ, в частности критерий Стьюдента. Эти критерии основаны на допущении, что наблюдаемый признак подчиняется нормальному распределению.

Более того, для применимости этих методов требуется, чтобы сравниваемые совокупности имели одинаковые дисперсии. Раз личными могут быть только значения средних. По их различию и судят о различии совокупностей. Применяя тот или иной метод, нужно быть уверенным, что допущения, на которых он основан, выполняются хотя бы приближенно. Иначе велик риск, что, вы полнив, казалось бы, правильную последовательность действий, мы придем к ошибочным выводам.

Условия применимости дисперсионного анализа и критерия Стьюдента выполняются часто, но не всегда. В одних случаях слишком велика разница дисперсий, в других распределение да леко от нормального. Наконец, измеряемый признак может ока заться нечисловым или «не вполне числовым». В такой ситуации 324 ГЛАВА следует воспользоваться непараметрическими методами. Один из таких критериев знаком нам по гл. 5 — это критерий 2, дру гой пример — критерий Мак-Нимара (гл. 9). Теперь мы займем ся непараметрическими критериями, основанными на рангах.

Ранее мы уже встречались с порядковыми признаками. При рода порядковых признаков такова, что о двух значениях мож но сказать лишь, какое больше или меньше, но в принципе нельзя — на сколько или во сколько раз. (Любой количественный при знак можно рассматривать как порядковый, но не наоборот.) Первое, что следует сделать при анализе таких признаков, это перейти к их рангам — номерам, под которыми будут стоять исходные данные, если выстроить их по возрастанию. Крите рии, основанные на рангах, не нуждаются в предположениях о типе распределения. Единственное требование состоит в том, чтобы тип распределения в сравниваемых совокупностях был одинаковым. При этом не нужно знать, что это за распределе ние и каковы его параметры.

Мы начнем с аналогов критерия Стьюдента — критерия сум мы рангов Манна—Уитни и критерия Уилкоксона. Затем будет изложен критерий Крускала—Уоллиса — аналог дисперсионно го анализа и критерий Фридмана — аналог дисперсионного ана лиза повторных измерений.

ПАРАМЕТРИЧЕСКИЕ И НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ.

КАКОЙ ВЫБРАТЬ?

Математическая модель, которая используется при построении дисперсионного анализа, предполагает нормальное распределе ние. Вспомним жителей маленького городка, которых мучили диетами, якобы влияющими на сердечный выброс (гл. 3), и му жественных добровольцев, принимавших совершенно неэффек тивный диуретик (гл. 4), — все это были выборки из нормально распределенной совокупности. Поэтому критические значения F и t, которые мы нашли в этих главах, дадут правильное пред ставление о статистической значимости различий только в слу чае, если выборки извлечены именно из такой совокупности.

Параметрические методы, как видно уже из их названия, опе НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ рируют параметрами распределения. В частности, дисперсион ный анализ и его частный случай, критерий Стьюдента, основа ны на сравнении средних и дисперсий. Но эти параметры пра вильно описывают только нормально распределенную совокуп ность. Если распределение далеко от нормального, среднее и дисперсия дадут о нем неверное представление. Столь же невер ными окажутся и критерии, основанные на этих параметрах.

В гл. 2 мы изучали рост юпитериан (см. рис. 2.3А). Средний рост составил 37,6см, а стандартное отклонение 4,5см. На рис.

2.3Б изображено, как выглядело бы нормальное распределение с такими параметрами. Оно мало похоже на распределение, наблю даемое в действительности. Если бы распределение роста юпи териан было нормальным, рост большинства из них оказался бы в пределах 37—38 см и рост практически всех — в интервале от 26 до 49 см. Однако картина иная. Рост большинства юпитериан группируется вокруг 35 см, то есть ниже среднего. При этом ин тервал, охватывающий все значения роста (от 31 до 52 см), сме щен вправо, то есть распределение асимметрично.

Непараметрические методы, которые мы рассмотрим в этой главе, заменяют реальные значения признака рангами. При этом мы сохраняем большую часть информации о распределении, но избавляемся от необходимости знать, что это за распределение.

Нас не интересуют более параметры распределения, отпадает и необходимость равенства дисперсий. Остается в силе только пред положение, что тип распределения во всех случаях одинаков*.

Если выполняется условие нормальности распределения, пара метрические критерии обеспечивают наибольшую чувствитель ность. Если же это условие не выполняется хотя бы приблизи тельно, их чувствительность существенно снижается и непара метрические критерии дают больше шансов выявить реально существующие различия. Что будет, если применить непарамет рический критерий при нормальном распределении? Чувстви тельность критериев, которые мы рассмотрим в этой главе, со ставляет в этом случае примерно 95% от чувствительности их пара * Кроме того, теоретически распределение должно быть непрерывным. При практическом применении непараметрических критериев этим условием можно пренебречь.

326 ГЛАВА метрических аналогов (это обстоятельство можно использовать для оценки чувствительности непараметрических критериев и определения необходимого числа наблюдений).

Как выяснить, согласуются ли данные с предположением о нормальности распределения? Простейший способ состоит в том, чтобы нанести их на график, подобный тем, которые мы рисовали, изучая рост инопланетян в гл. 2. Нарисовав график, прикиньте, похож ли он на нормальное распределение. Та ли у него форма, достаточно ли он симметричен относительно сред него, покрывает ли интервал, равный плюс-минус двум стан дартным отклонениям от среднего, практически все наблюде ния? Сравните графики для разных групп. Близок ли разброс значений? Ответив на все вопросы утвердительно, воспользуй тесь параметрическим критерием. В противном случае следует использовать непараметрический критерий. Изложенный нехит рый прием почти наверняка поможет правильно выбрать тип критерия.

Для тех, кто не привык полагаться на зрительные впечатле ния, укажем еще два способа, иногда более точные и всегда бо лее трудоемкие. Первый основан на использовании нормальной вероятностной бумаги. Вы легко поймете, о чем идет речь, если когда-нибудь видели логарифмическую бумагу. Вся разница в том, что на логарифмической бумаге вертикальная ось програ дуиро-вана так, чтобы графиком экспоненты была прямая, а на нормальной вероятностной бумаге прямой окажется функция нормального распределения. На такую бумагу определенным образом наносят имеющиеся значения. Если они расположатся почти на одной прямой, можно применять параметрические методы. Второй способ опирается на критерий 2. Он позволяет сравнить реальные данные с теми, которые дало бы нормаль ное распределение, имеющее то же среднее и дисперсию. Мы не будем останавливаться на этих процедурах*, поскольку их выводы наверняка совпадут с теми, что даст простая прикидка.

Как правило, основная трудность состоит не в том, какой из * Желающие могут познакомиться с ними по книгам J. H. Zar. Bio-statstical analisys. 2nd ed. Prentice-Hall, Englewood Cliffs, N. J., 1984 и W. J. Dixon, F.

J. Massey, Jr. Introduction to statistical analisys. 4th ed., McGraw-Hill, New York, 1983.

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ перечисленных способов выбрать, а в том, что объем выборки слишком мал, чтобы применить любой из них. Убедительные сви детельства в пользу гипотезы нормальности или против нее встре чаются редко. Гораздо чаще все решают интуиция, привычка и вкус исследователя. Существуют две точки зрения на то, как сле дует поступать в таких случаях. Согласно одной, в отсутствие очевидных противоречий между данными и гипотезой их нор мального распределения следует применить параметрический метод. Согласно другой, если нет явного подтверждения гипоте зы нормальности распределения, лучше воспользоваться непа раметрическим методом. Сторонники первой точки зрения упи рают на то, что параметрические методы более чувствительны и более известны. Приверженцы второй резонно замечают, что исследователь не должен исходить из предположений, которые нельзя проверить, и что, применяя непараметрические критерии, мы почти ничем не рискуем — ведь даже в случае нормального распределения их чувствительность не намного ниже чувстви тельности параметрических. Ни одна из сторон пока не одержа ла верх, и похоже, этого не произойдет никогда.

СРАВНЕНИЕ ДВУХ ВЫБОРОК: КРИТЕРИЙ МАННА—УИТНИ Напомним схему, по которой строились все параметрические методы, будь то критерий Стьюдента, дисперсионный или кор реляционный анализ. Из нормально распределенной совокуп ности мы извлекали все возможные выборки определенного объ ема и строили распределение значений соответствующего кри терия. Теперь, упорядочив значения признака и перейдя от ре альных значений к рангам, мы поступим несколько иначе. Мы просто перечислим все возможные варианты упорядочивания двух групп.

Как это сделать, мы покажем на простом примере. Чтобы ва риантов упорядочивания было не слишком много, рассмотрим опыт с участием 7 добровольцев. Из них 3 принимают плацебо (контрольная группа), а 4 препарат, предположительно диуретик (экспериментальная группа). В табл. 10.1 приведены данные о суточном диурезе. Против каждого значения диуреза указан 328 ГЛАВА Таблица 10.1. Эксперимент с диуретиком Плацебо Препарат (контрольная группа)(экспериментальная группа) Суточный Суточный диурез, мл Ранг диурез, мл Ранг 1000 1 1400 1380 5 1600 1200 3 1180 1220 Т = его ранг — место в общем упорядоченном ряду. Рангом наимень шей величины будет 1;

ранг наибольшей величины равен числу наблюдений, то есть 7. Если препарат увеличивает диурез, то ранги в экспериментальной группе должны быть больше, чем В контрольной. Мерой отличия изберем сумму рангов в меньшей из групп и обозначим ее Т. В нашем примере меньшая группа — контрольная. Соответствующее значение Т равно 9.

Достаточно ли мало значение T, чтобы отклонить гипотезу об отсутствии действия препарата?

Для ответа на этот вопрос рассмотрим совокупность всех воз можных перестановок. Заметьте, после перехода к рангам нам уже не нужно рассматривать сами исходные величины и сово купность их возможных значений. Поэтому наши дальнейшие рассуждения полностью применимы к любым двум группам на блюдений по 3 и 4 наблюдения в каждой.

Итак, нулевая гипотеза — гипотеза об отсутствии влияния препарата на диурез. Если она справедлива, любой ранг может равновероятно оказаться в любой из групп. Чтобы узнать, велика ли вероятность случайно получить перестановку из табл. 10.1, рассмотрим все возможные перестановки. Понятно, что распреде лить ранги по двум группам — это то же самое, что набрать ран ги для одной из групп (оставшиеся автоматически попадут во вто рую). Тогда, перечислив все варианты выбора 3 рангов из 7, мы тем самым перечислим все варианты распределения семи рангов по двум группам. Число способов по-разному выбрать 3 ранга из 7 равно 35. Все 35 вариантов приведены в табл. 10.2. Крестиком помечены ранги, попадающие в контрольную группу. В правом НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Таблица 10.2. Варианты разделения 7 рангов на две группы по 3 и 4 ранга Ранги Сумма 1 2 3 4 5 6 7 рангов 330 ГЛАВА Рис. 10.1. 35 возможных сумм рангов для меньшей из групп (см. табл. 10.2).

столбце для каждого из вариантов указана величина T — сумма рангов меньшей (контрольной) группы. Если нанести значения T на график, получится распределение, показанное на рис. 10.1.

Если справедлива нулевая гипотеза, то все сочетания рангов рав новероятны. Это значит, что если, например, Т = 12 в 5 вариан тах из 35, то вероятность случайно получить значение T = равна 5/35. Таким образом, на рис. 10.1 изображено распреде ление значений T в случае справедливости нулевой гипотезы об отсутствии действия препарата. По форме оно напоминает распределение t (рис. 4.5). Однако есть и отличия. Действитель но, распределение t непрерывно. Оно построено по бесконеч ной совокупности значений, вычисленных для бесконечного числа выборок из бесконечной нормально распределенной совокупности. Напротив, распределение Т конечно и дискрет но, то есть имеет ступенчатый вид, принимая значения лишь в конечном числе целочисленных точек.

Глядя на рис. 10.1, легко определить вероятность получить то или иное значение Т при условии справедливости нулевой гипотезы. Например, значения T = 9 и Т = 15 наблюдаются в вариантах, то есть вероятность появления каждой из этих сумм равна 3/15. Вероятность получить значение Т, равное 8 или 16, составляет 2/35 = 0,057. Будем считать эти значения T крити ческими. В нашем опыте Т = 9, так что нулевую гипотезу отвер гнуть мы не можем.

Уровень значимости обычно принимают равным 5% или 1%.

Можно ли установить такой уровень в нашем примере? Оказы вается, нет. У нас есть всего 13 разных значений Т, поэтому уро вень значимости может меняться только скачками. Назвав про извольный уровень значимости, мы скорее всего обнаружим, что нет такого значения Т, которому бы он соответствовал. В качестве критического берут то значение Т, которому соответ НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ствует уровень значимости, наиболее близкий к 1 или 5%. В нашем примере ближе всего к 5% находится уровень значимос ти 5,7%, соответствующий Т = 8.

Критические значения критерия Манна— Уитни приведены в табл. 10.3. Столбец критических значений содержит пары чи сел. Различия статистически значимы, если Т не больше перво го из них или не меньше второго. Например, когда в одной группе 3 человека, а в другой 6, различия статистически значимы, если T 7 или T 23.

Изложенный вариант критерия известен как T-критерий Ман на—Уитни*. Порядок его вычисления таков.

• Данные обеих групп объединяют и упорядочивают по возрас танию. Ранг 1 присваивают наименьшему из всех значений, ранг 2 — следующему и так далее. Наибольший ранг присваи вают самому большому среди значений в обеих группах. Если значения совпадают, им присваивают один и тот же средний ранг (например, если два значения поделили 3-е и 4-е места, обоим присваивают ранг 3,5).

• Для меньшей группы вычисляют Т — сумму рангов ее чле нов. Если численность групп одинакова, Т можно вычислить для любой из них.

• Полученное значение T сравнивают с критическими значени ями. Если Т меньше или равно первому из них либо больше или равно второму, то нулевая гипотеза отвергается (разли чия статистически значимы).

Что делать, если нужной численности групп в таблице не оказалось? Можно самому построить распределение Т. К сожале нию, с ростом численности групп сделать это становится все труднее. Например, если объем каждой из групп равен 10, то * Существует еще U-критерий Манна—Уитни, в котором вместо Т вы числяют U, при этом U = T – nм(nм + 1)/2, где nм — численность меньшей из групп. Об этом варианте критерия можно прочесть в книге S. Siegel, N. J. Castellan. Nonparametric Statistics for the Behavio ral Sciences, 2nd ed. McGraw-Hill, N. Y., 1988. Подробный вывод Т критерия и его связь с U-критерием приведены в книге F. Mosteller, R. Rourke. Sturdy Statistics: Nonparametrics and Order Statistics, Addison-Wesley, Reading, Mass., 1973.

332 ГЛАВА Таблица 10.3. Критические значения критерия (двусторонний вариант) Манна— Уитни Численность Приблизительный уровень значимости группы 0,05 0, Точное Точное мень- боль- Критические значе- Критические значе шей шей значения ние значения ние 3 4 6 18 0, 5 6 21 0, 5 7 20 0, 6 7 23 0,048 6 24 0, 7 7 26 0,033 6 27 0, 7 8 25 0, 8 8 28 0,042 6 30 0, 4 4 11 25 0,057 10 26 0, 5 11 29 0,032 10 30 0, 5 12 28 0, 6 12 32 0,038 10 34 0, 7 13 35 0,042 10 38 0, 8 14 38 0,048 11 41 0, 8 12 40 0, 5 5 17 38 0,032 15 40 0, 5 18 37 0,056 16 39 0, 6 19 41 0,052 16 44 0, 7 20 45 0,048 17 48 0, 8 21 49 0,045 18 52 0, 6 6 26 52 0,041 23 55 0, 6 24 54 0, 7 28 56 0,051 24 60 0, 7 25 59 0, 8 29 61 0,043 25 65 0, 8 30 60 0,059 26 64 0, 7 7 37 68 0,053 33 72 0, 8 39 73 0,054 34 78 0, 8 8 49 87 0,050 44 92 0, НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ число вариантов равно 184756. Поэтому лучше воспользовать ся тем, что при численности групп, большей 8, распределение Т приближается к нормальному со средним nм nм + nб + () µT = и стандартным отклонением nмnб nм + nб + (), T = где nм и nб — объемы меньшей и большей выборок*.

В таком случае величина T - µT zT = T имеет стандартное нормальное распределение. Это позволяет сравнить zT с критическими значениями нормального распре деления (последняя строка табл. 4.1). Более точный результат обеспечивает поправка Йейтса:

T -µT zT =.

T Роды по Лебуайе В последние десятилетия произошел коренной пересмотр взгля дов на родовспоможение. Акушерская революция совершалась под лозунгом «Отец вместо седативных средств». Восторже * Если некоторые значения совпадают, стандартное отклонение должно быть уменьшено согласно формуле:

nмnб N + ( ) nмnб T = - i -1 i i +1, 12N N - ( )( ) ( ) где N = nм и nб — общее число членов обеих выборок, i — число значений i-го ранга, а суммирование производится по всем совпадаю щим рангам.

334 ГЛАВА ствовала точка зрения, согласно которой при нормальных родах следует прибегать к помощи психологических, а не лекарствен ных средств. Что делать конкретно, мнения расходились. Мас ла в огонь подлила книга Лебуайе «Рождение без насилия».

Французский врач предлагал комплекс мер, призванных свести к минимуму потрясение, которое испытывает новорожденный при появлении на свет. Роды надлежит принимать в тихом затем ненном помещении. Сразу после родов ребенка следует уложить на живот матери и не перерезать пуповину, пока та не переста нет пульсировать. Затем, успокаивая младенца легким погла живанием, нужно поместить его в теплую ванну, чтобы «вну шить, что разрыв с организмом матери — не шок, но удоволь ствие». Лебуайе указывал, что дети, рожденные по его методи ке, здоровее и радостнее других. Многие врачи считали, что предложенная методика не только противоречит общепринятой практике, но и создает дополнительную опасность для матери и ребенка. Тем не менее у Лебуайе нашлись и сторонники.

Как часто бывает в медицине, отсутствие достоверных дан ных могло затянуть спор на многие годы. Пока Н. Нелсон и со авт.* не провели клиническое испытание, материалы ограни чивались «клиническим опытом» автора методики.

В эксперименте Нелсон, проведенном в клинике канадского университета Макмастер, участвовали роженицы без показаний к искусственному родоразрешению, срок беременности кото рых составлял не менее 36 недель и которые были согласны ро жать как по обычной методике, так и по Лебуайе. Роженицы были случайным образом разделены на две группы. В контроль ной роды проводились по общепринятой методике в нормально освещенном помещении с обычным уровнем шума;

после рож дения пуповина немедленно перерезалась, ребенка пеленали и отдавали матери. В экспериментальной группе роды принима лись по методике Лебуайе. В обеих группах при родах присут ствовали мужья, применение обезболивающих средств было ми * N. Nelson, M. Enkin, S. Saigal, К. Bennett, R. Milner, D. Sackett. A randomized clinical trial of the Leboyer approach to childbirth. N. Engl.

J. Med., 302: 655–660, 1980.

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ нимальным. Тем самым, группы различались только в том, в чем методика Лебуайе не совпадает с общепринятой.

То, в какую группу попала роженица, было известно самой роженице и всем, кто присутствовал при родах. На этом этапе эффект плацебо исключить было невозможно. Однако уже на этапе послеродового наблюдения одна из сторон, а именно вра чи, которые оценивали состояние ребенка, не знали, по какой методике происходили роды. Таким образом исследование Нел сон было простым слепым: условия знала только одна из сто рон, наблюдателю же они были неизвестны.

Для оценки развития детей была разработана специальная шкала. Из числа детей, рожденных по обычной методике, оцен ку «отлично» по этой шкале получали примерно 30%. Изучив труды Лебуайе, Нелсон и соавт. пришли к выводу, что пред лагаемый метод, судя по заявлениям автора, гарантирует оцен ку «отлично» у 90% детей. Приняв уровень значимости = 0,05, исследователи рассчитали, что для обеспечения 90% вероятности выявить такие различия в каждой из групп должно быть по детей.

Работа продолжалась целый год. За это время исследователи провели беседы с 187 потенциальными участницами, разъяс няя им смысл предстоящего эксперимента. 34 женщины не по дошли по состоянию здоровья, 97 отказались участвовать в эксперименте (из них 70 собирались рожать только по методике Лебуайе). Из оставшихся 56 женщин одна успела родить до рандомизации. В результате число участниц сократилось до 55.

Их и разделили случайным образом на две группы. После того как из исследования выбыла одна из попавших в контрольную группу, в этой группе оказалось 26, а в экспериментальной рожениц. Однако у 6 женщин в контрольной группе и у 8 в экспериментальной возникли осложнения, и их пришлось ис ключить из участия в эксперименте. В итоге в каждой из групп оказалось по 20 женщин. Вы видите, насколько трудно обеспе чить достаточную численность групп даже в простом исследо вании*.

Оценка по шкале развития производилось сразу после родов, * D. Sackett, M. Gent. Controversy in counting and attributing events in clinical trials. N. Engl. J. Med., 301:1410–1412, 1979.

336 ГЛАВА Рис. 10.2. Продолжительность бодрствования в первый час жизни после обычных ро дов и родов по Лебуайе. Обратите внимание, что в обеих группах распределение асим метрично — преобладают высокие значения.

а также спустя несколько месяцев. Мы остановимся на одном из показателей — времени бодрствования в первый час жизни.

Предполагалось, что чем лучше состояние новорожденного, тем более он активен. Значит, у младенцев, рожденных по Лебуайе, время бодрствования должно быть продолжительнее, чем у рож денных по обычной методике.

Из рис. 10.2 видно, что данные не подчиняются нормально му распределению. Особенно это заметно в экспериментальной группе. Тем самым, параметрические методы, например крите рий Стьюдента, к этим данным неприменимы. Поэтому вос пользуемся непараметрическим критерием Манна—Уитни.

Объединим данные, относящиеся к обеим группам, и упоря дочим их по возрастанию. В табл. 10.4 кроме суммарного време ни бодрствования указан также его ранг. Поскольку численность групп одинакова, сумму рангов Т можно вычислить для любой из них. Подсчитаем T для контрольной группы. Она равна 374.

Размер групп достаточен, чтобы воспользоваться нормальным приближением для Т. Поэтому перейдем от Т к zT. Итак, полагая истинной нулевую гипотезу, вычисляем среднее всех возмож ных значений Т nм nм + nб +1 20 20 + 20 + () () µT = = = НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Таблица 10.4. Продолжительность бодрствования в первый час жизни, мин Роды по обычной Роды методике Ранг по Лебуайе Ранг 5,0 2 2,0 10,1 3 19,0 17,7 4 29,7 20,3 6 32,1 22,0 7 35,4 24,9 8 36,7 26,5 9 38,5 30,8 11 40,2 34,2 13 42,1 35,0 14 43,0 36,6 16 44,4 37,9 18 45,6 40,4 21 46,7 45,5 25 47,1 49,3 31 48,0 51,1 33 49,0 53,1 36 50,9 55,0 38 51,2 56,7 39 52,5 58,0 40 53,3 T = и стандартное отклонение nмnб nм + nб + () 20 20 T = = = 36, 97.

12 Таким образом, с учетом поправки Йейтса, T -µT - 374 - 410 zT =. = = 0, 962.

T 36, В табл. 4.1 находим 5% критическое значение для бесконеч 338 ГЛАВА ного числа степеней свободы. Найденное критическое значение равно 1,960, то есть больше полученного. Тем самым, имею щиеся данные не позволяют отклонить гипотезу о том, что мла денцы, рожденные по методике Лебуайе, по своей активности ничем не отличаются от остальных.

Общая оценка развития также не показала существенной раз ницы между двумя группами детей. Исследование Нелсон и со авт. — пример тщательно спланированного и проведенного кли нического испытания. На четко поставленный вопрос был по лучен ответ. Сегодня мало кто помнит о родах по Лебуайе. Не беда — на смену идут роды под водой. Оценка их влияния на развитие ребенка, быть может, станет темой будущих исследо ваний.

СРАВНЕНИЕ НАБЛЮДЕНИЙ ДО И ПОСЛЕ ЛЕЧЕНИЯ:

КРИТЕРИЙ УИЛКОКСОНА В гл. 9 было описано использование парного критерия Стью дента для сравнения состояния больных до и после лечения.

Однако для применения этого критерия необходимо, чтобы из менения имели нормальное распределение. Существует крите рий, основанный на рангах, не ограниченный этим условием, — это критерий Уилкоксона. Принцип критерия следующий.

Для каждого больного вычисляют величину изменения призна ка. Все изменения упорядочивают по абсолютной величине (без учета знака). Затем рангам приписывают знак изменения и сум мируют эти «знаковые ранги» — в результате получается зна чение критерия Уилкоксона W.

Как видим, используется информация об абсолютной вели чине изменения и его знаке (то есть уменьшении или увели чении наблюдаемого признака). Метод основан на рангах, поэ тому не нуждается в предположениях о типе распределения из менений. Как в случае с критерием Манна— Уитни, здесь так же можно перечислить все возможные величины W и найти кри тическое значение.

Обратите внимание, исходно ранга присваиваются в соот ветствии с абсолютной величиной изменения. Так, например, НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Таблица 10.5. Действие диуретика Суточный диурез, мл До После Величина Ранг изме- Знаковый Участник приема приема изменения нения ранг 1 1490 1600 110 5 2 1300 1850 550 6 3 1400 1300 –100 4 – 4 1410 1500 90 3 5 1350 1400 50 2 6 1000 1010 10 1 W = величины 5,32 и –5,32 получат один и тот же ранг, а уже затем рангам будет присвоен знак изменения.

Рассмотрим пример. Допустим, мы исследуем некий препа рат, предположительно диуретик. Дадим его 6 добровольцам и сравним диурез до и после приема препарата. Результаты пред ставлены в табл. 10.5.

У 5 человек диурез увеличился. Значит ли это, что препарат является диуретиком?

Упорядочим изменения диуреза по абсолютной величине и присвоим им ранги от 1 до 6. Затем, приписав рангу каждого изменения соответствующий изменению знак, перейдем к зна ковым рангам (последний столбец табл. 10.5). Наконец, вычис лим сумму знаковых рангов W = 13.

Если препарат не оказывает действия, сумма рангов со зна ком «+» должна быть примерно равна сумме рангов со знаком «–» и значение W окажется близким нулю. Напротив, если пре парат увеличивает (или уменьшает) диурез, будут преобладать положительные (отрицательные) ранги и значение W будет от личным от нуля.

Чтобы найти критическое значение W, выпишем все 64 воз можных исхода опыта (табл. 10.6 и рис. 10.3). В четырех случа ях значение W no абсолютной величине равно или превосходит 19. Таким образом, отвергая нулевую гипотезу при |W| > 19, мы обеспечим уровень значимости 4/64 = 0,0625. Изменение диу реза в нашем опыте надо признать статистически не значимым:

340 ГЛАВА Таблица 10.6. Возможные сочетания знаковых рангов для 6 пар измерений Ранги Сумма зна 1 2 3 4 5 6 ковых рангов – – – – – – – + – – – – – – – + – – – – – – – + – – – – – – – + – – – – – – – + – – – – – – – + – + + – – – – – + – + – – – – + – – + – – – + – – – + – – + – – – – + – – + + – – – – – + – + – – – – + – – + – – – + – – – + – – – + + – – – – – + – + – – – – + – – + – – – – + + – – – – – + – + – – – – – + + + + + – – – – + + – + – – – + + – – + – – + + – – – + – + – + + – – – + – + – + – – + – + – – + – + – – + + – – + – – + – + + – – – + + НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Таблица 10.6. Окончание Ранги Сумма зна 1 2 3 4 5 6 ковых рангов – + + + – – – – + + – + – – – + + – – + – + – + + – – + – + – + – + – – + + – – + + + – – – + + – + – – + – + + – – – + + + + + + + – – – + + + – + – + + + – – + + + – + + – + + – + – + + + – – + + + – + + + – + – + + – + + – + – + + + – – + + + – + + + + – – + + + – + – + + – + + – + – + + + – – + + + + + + + + + – + + + + – + + + + – + + + + – + + + + – + + + + – + + + + + + + + + + + 342 ГЛАВА Рис. 10.3. 64 возможные суммы рангов для группы из 6 человек (см. табл. 10.6). 4 наи больших по абсолютной величине значения помечены черным.

Р < 0,0625. На самом деле в таблице имеется 14 значений W, по абсолютной величине не меньших 13. Поскольку 14/64 = 0,219, мы могли бы записать Р < 14/64.

Как и в случае критерия Манна— Уитни, распределение W не является непрерывным и поэтому нельзя указать критичес кое значение, для которого уровень значимости в точности рав нялся бы, например, 5%. В табл. 10.7 приведены критические значения, наиболее близкие к 5 и 1% уровням значимости для случая, когда численность группы не превосходит 20.

Если число пар измерений больше 20, то распределение W достаточно близко к нормальному со средним µW = 0 и стандарт ным отклонением n n +1 2n + ( )( ), W = где n — число пар наблюдений (то есть численность группы).

Можно, таким образом, использовать W - µW W zW ==.

W n n +1 2n + ( )( ) Чтобы приближение было более точным, воспользуемся по правкой Йейтса на непрерывность:

W zW =.

n n +1 2n + ( )( ) НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Таблица 10.7. Критические значения W (двусторонний вариант) п W РпW Р 5 15 0,062 13 65 0, 6 21 0,032 57 0, 19 0,062 14 73 0, 7 28 0,016 63 0, 24 0,046 15 80 0, 8 32 0,024 70 0, 28 0,054 16 88 0, 9 39 0,020 76 0, 33 0,054 17 97 0, 10 45 0,020 83 0, 39 0,048 18 105 0, 11 52 0,018 91 0, 44 0,054 19 114 0, 12 58 0,020 98 0, 50 0,052 20 124 0, 106 0, F. Mostellerand R. Rourke. Sturdy statistics: nonparametrics and order statistics, Addison Wesley, Reading, Mass., 1973.

При анализе наблюдений до—после встречается два вида сов падений. Это, во-первых, совпадение величин, которым присва иваются ранги. Такая ситуация возникает при использовании любого рангового метода, будь то критерий Манна—Уитни или коэффициент корреляции Спирмена. Как всегда, совпадающим величинам присваивается общий ранг, равный среднему мест, занимаемых ими в упорядоченном наборе*.

Единственная особенность — то, что в случае наблюдений (до—после) речь идет о совпадении не самих величин наблюдае * Если некоторые значения совпадают, стандартное отклонение должно быть уменьшено в соответствии со следующей формулой:

n n +1 2n +1 i -1 i i + ( )( ) W = ( ) ( ), где n — численность группы, i, - число значений i-го ранга.

344 ГЛАВА мого признака, а их изменений. Другой вид совпадения — совпа дение значений «до» и «после». Каждую такую пару наблюде ний нужно исключать из расчета, соответственно уменьшая на единицу объем выборки.

Повторим последовательность шагов, позволяющую по на блюдениям, выполненным до и после лечения, проверить его эффективность.

• Вычислите величины изменений наблюдаемого признака. От бросьте пары наблюдений, которым соответствует нулевое изменение.

• Упорядочите изменения по возрастанию их абсолютной ве личины и присвойте соответствующие ранги. Рангами оди наковых величин назначьте средние тех мест, которые они делят в упорядоченном ряду.

• Присвойте каждому рангу знак в соответствии с направле нием изменения: если значение увеличилось — «+», если уменьшилось — «–».

• Вычислите сумму знаковых рангов W*.

• Сравните полученную величину W с критическим значени ем. Если она больше критического значения, изменение пока зателя статистически значимо.

А теперь применим критерий Уилкоксона к анализу рассмот ренного в гл. 9 эксперимента Левина.

Курение и функция тромбоцитов В гл. 9 мы разобрали исследование Левина, посвященное вли янию курения на функцию тромбоцитов. В частности, на рис.

9.2 приведены результаты опыта с выкуриванием сигареты: агре гация тромбоцитов до и после этого вредоносного воздействия.

Рассмотрим еще раз эти данные (табл. 10.8). Обратим внимание на 4-й столбец: здесь показана величина изменения интересую * Существует вариант критерия Уилкоксона, в котором суммируют только положительные или только отрицательные знаковые ранги.

На выводе это никак не сказывается, однако значение W, естест венно, получается другим. Поэтому важно знать, на какой вариант критерия рассчитана имеющаяся в вашем распоряжении таблица критических значений.

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Таблица 10.8. Агрегация тромбоцитов до и после сигареты выкуривания Участ- До После Измене- Ранг изме- Знаковый ранг ник курения курения ние нения изменения 1 25 27 2 2 2 25 29 4 3,5 3, 3 27 37 10 6 4 44 56 12 7 5 30 46 16 10 6 67 82 15 8,5 8, 7 53 57 4 3,5 3, 8 53 80 27 11 9 52 61 9 5 10 60 59 –1 1 – 11 28 43 15 8,5 8, W = Рис. 10.4. Изменение агрегации тромбоцитов после выкуривания сигареты. Вряд ли мы имеем дело с нормальным распределением, об этом свидетельствует, в час тности, «выпадающее» значение 27%. В таких случаях непараметрические мето ды, например критерий Уилкоксона, предпочтительнее параметрических, таких, как критерий Стьюдента.

щего нас показателя. Можно ли считать распределение изме нения нормальным? При большом желании да, но следует все же признать, что для суждения о типе распределения данных слишком мало. Смущает и «выскакивающее» значение 27% — оно наводит на мысль о возможной асимметрии распределения.

В подобных случаях лучше не рисковать и воспользоваться не параметрическим критерием. Применим критерий Уилкоксона.

Выпишем абсолютные величины изменений в порядке воз растания. Полученные ранги приведены в пятом столбце табл.

10.8, а шестой столбец содержит те же ранги, но со знаками, соответствующими направлению изменения. Сумма знаковых 346 ГЛАВА рангов W = 2 + 3,5 + 6 + 7 + 10 + 8,5 + 3,5 + 11 + 5 + (–l) + 8,5 = 64.

В табл. 10.7 находим 1,8% критическое Значение для суммы ран гов. Оно равно 52, то есть меньше полученного нами. Поэтому мы признаем изменение агрегации тромбоцитов статистически значимым (Р < 0,018).

СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП:

КРИТЕРИЙ КРУСКАЛА-УОЛЛИСА В гл. 3 была рассмотрена задача сравнения нескольких выбо рок. Эта задача возникает, например, когда нужно определить, одинаково ли эффективны несколько методов лечения, каждый из которых испытывается на отдельной группе. Предполагалось, что данные, полученные для каждой из групп, подчиняются нор мальному распределению, причем дисперсии по всем группам примерно одинаковы. На этом допущении и основан изложен ный в гл. 3 однофакторный дисперсионный анализ. Сейчас мы познакомимся с его непараметрическим аналогом, не. требую щим предположения о нормальности распределения. Это кри терий Крускала—Уоллиса.

Критерий Крускала—Уоллиса представляет собой обобще ние критерия Манна—Уитни. Сначала все значения, независимо от того, какой выборке они принадлежат, упорядочивают по воз растанию. Каждому значению присваивается ранг — номер его места в упорядоченном ряду. (Совпадающим значениям при сваивают общий ранг, равный среднему тех мест, которые эти величины делят между собой в общем упорядоченном ряду.) Затем вычисляют суммы рангов, относящихся к каждой группе, и для каждой группы определяют средний ранг. При отсутствии межгрупповых различий средние ранги групп должны оказать ся близки. Напротив, если существует значительное расхожде ние средних рангов, то гипотезу об отсутствии межгрупповых различий следует отвергнуть. Значение критерия Крускала— Уоллиса H и является мерой такого расхождения средних рангов.

Для простоты положим, что групп всего три. Обобщение на большее число групп получится автоматически. Имеются ре зультаты измерения некоторого признака в трех группах. Чис НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ленность групп — n1, n2 и n3. Значения объединим, упорядочим и каждому присвоим ранг. Вычислим сумму рангов для каждой группы — R1, R2 и R3. Найдем средние ранги:

R1 = R1 n1, R2 = R2 n и R3 = R3 n3.

Общее число наблюдений N = n1 + n2 + n3. Для объединенной группы рангами являются числа 1,2,..., N и общая сумма рангов равна N N + ( ).

1+ 2 +… + N -1 + N = ( ) Тогда средний ранг R для объединенной группы равен 1 + 2 + … + N N + R ==.

N Теперь найдем величину D, равную D = n1 R1 - R + n2 R2 - R + n3 R3 - R.

( ) ( ) ( ) Это прямой аналог межгрупповой вариации, знакомой нам по гл. 9. Величина D зависит от размеров групп. Чтобы полу чить показатель, отражающий их различия, следует поделить D на N(N +1)/12. Полученная величина D H == ( ) n Rм - R м N N +1 12 N N + ( ) ( ) является значением критерия Крускала—Уоллиса. Суммирова ние в приведенной формуле производится по всем группам.

Как найти критическое значение Н? Можно было бы просто перечислить все сочетания рангов, как это делалось для кри териев Манна—Уитни и Уилкоксона. Однако сделать это до вольно трудно — число вариантов слишком велико. К счастью, если группы не слишком малы, распределение H хорошо при ближается распределением 2 с числом степеней свободы = = k – 1, где k — число групп. Тогда для проверки нулевой гипо тезы нужно просто вычислить по имеющимся наблюдениям зна чение Н и сравнить его с критическим значением 2 из табл. 5.7.

В случае трех групп приближение с помощью 2 пригодно, если численность каждой группы не меньше 5. Для четырех групп — 348 ГЛАВА если общее число наблюдений не менее 10. Но если группы со всем малы, не остается ничего, кроме как обратиться к таблице точных значений распределения Крускала—Уоллиса (мы не приводим эту таблицу из-за ее громоздкости).

Итак, чтобы выяснить, одинаково ли действие нескольких методов лечения, каждый из которых испытывается на отдель ной группе, нужно проделать следующее.

• Объединив все наблюдения, упорядочить их по возрастанию.

Совпадающим значениям ранги присваиваются как среднее тех мест, которые делят между собой эти значения*.

• Вычислить критерий Крускала—Уоллиса Н.

• Сравнить вычисленное значение Н с критическим значени ем 2 для числа степеней свободы, на единицу меньшего числа групп. Если вычисленное значение Н окажется больше кри тического, различия групп статистически значимы.

Приведем пример использования критерия Крускала—Уоллиса.

Влияние пероральных контрацептивов на выведение кофеина Ряд лекарственных средств и пищевых продуктов (кофе, чай и прохладительные напитки) содержат кофеин. Беременным не сле дует увлекаться крепким кофе, поскольку кофеин может оказать неблагоприятное влияние на плод, а выведение кофеина у бере менных замедлено. Существует предположение, что замедлен ное выведение кофеина обусловлено высоким уровнем половых гормонов во время беременности. Р. Патвардан и соавт.** реши ли косвенно подтвердить это предположение, определив скорость * При большом числе совпадающих рангов значение H следует поделить на i ( -1 i i + ) ( ), 1 N N - ( ) где N — число членов всех групп, i — как обычно, число рангов в i-й связке, а суммирование производится по всем связкам.

** R. Patwardhan, P. Desmond, R. Johnson, S. Schenker. Impaired elimination of caffeine by oral contraceptives. J. Lab. Clin. Med., 95:603—608, 1980.

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Таблица 10.9. Период полувыведения кофеина Женщины Не принимающие Принимающие пероральных пероральные Мужчины контрацептивов контрацептивы T1/2, ч Ранг T1/2, ч Ранг T1/2, ч Ранг 2,04 1 5,30 12 10,36 5,16 10 7,28 19 13,28 6,11 15 8,98 21 11,81 5,82 14 6,59 16 4,54 5,41 13 4,59 8 11,04 3,51 4 5,17 11 10,08 3,18 2 7,25 18 14,47 4,57 7 3,47 3 9,43 4,83 9 7,60 20 13,41 11,34 3,79 9,03 7,21 Сумма рангов 146 128 Средний ранг 11,23 14,22 24, выведения кофеина у женщин, принимающих пероральные кон трацептивы. (При приеме пероральных контрацептивов уровень эстрогенов и прогестагенов в крови повышается — то же самое происходит и при беременности.) Скорость выведения кофеина (как и других веществ) непо стоянна — она прямо пропорциональна его концентрации в пла зме. Поэтому нет смысла измерять скорость выведения, скажем, в миллиграммах в минуту. Вместо этого используют период по лувыведения (T1/2) — время уменьшения концентрации вдвое:

после того как вещество всосется и поступит в кровь, эта вели чина остается постоянной, пока вещество не будет почти пол ностью выведено из организма.

T1/2 определили у женщин, принимающих и не принимаю щих пероральные контрацептивы, а также у мужчин. Числен ность групп составила соответственно 9, 9 и 13 человек. Каж 350 ГЛАВА дый участник эксперимента принимал 250 мг кофеина, что со ответствует примерно 3 чашкам кофе, после чего дважды опре деляли концентрацию кофеина в крови и рассчитывали T1/2. Ре зультаты представлены в табл. 10.9.

Общий средний ранг 1 + 2 + … + 31 N + 1 31 + R == = = 16.

31 2 Вычисляем взвешенную сумму квадратов отклонений сред них по группам от общего среднего D = 13(11,23 – 16)2 + 9(14,22 – 16)2 + 9(24,67 – 16)2 = 1000, и значение критерия Крускала—Уоллиса 12 H = D = 1000,82 = 12,107.

N N + 1 31 31 + ( ) ( ) По табл. 5.7 находим 1% критическое значение 2 с числом степеней свободы = k – l = 3 – l = 2. Оно равно 9,210, то есть меньше полученного нами. Таким образом, различия групп ста тистически значимы (Р < 0,01).

Непараметрическое множественное сравнение Потребность во множественном сравнении возникает всякий раз, когда с помощью дисперсионного анализа (или его непа раметрического аналога — критерия Крускала—Уоллиса) обна руживается различие нескольких выборок. В этом случае и тре буется установить, в чем состоит это различие. В гл. 4 мы по знакомились с параметрическими методами множественного сравнения. Они позволяют сравнить группы попарно и затем объединить их в несколько однородных наборов так, что раз личия между группами из одного набора статистически незна чимы, а между группами из разных наборов — значимы. Кроме того, они позволяют сравнить все группы с контрольной.

К счастью, параметрические методы множественного срав нения легко преобразовать в непараметрические. Когда объемы выборок равны, для множественного сравнения используют не НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ параметрические варианты критериев Ньюмена—Кейлса и Дан нета. Когда же объемы выборок различны, применяется крите рий Данна. Опишем вкратце эти методы.

Начнем с критериев для выборок равного объема. Критерии Ньюмена—Кейлса и Даннета совпадают практически полнос тью, поскольку критерий Даннета есть просто вариант крите рия Ньюмена—Кейлса для сравнения всех выборок с одной кон трольной.

Формула для непараметрического варианта критерия Нью мена—Кейлса:

RA - RB q =, n2l nl + ( ) где RA RB — суммы рантов двух сравниваемых выборок, п — объем каждой выборки, l — интервал сравнения. Вычисленное q сравнивается с критическим значением в табл. 4.3 для беско нечного числа степеней свободы.

Значение непараметрического критерия Даннета определя ется формулой:

Rкон - RA q =, nl l + ( ) где Rкон, — сумма рангов контрольной выборки, а остальные ве личины те же, что в Критерии q. Уточним только, что l — число всех выборок, включая контрольную. Значение q сравнивается с критическим значением для бесконечного числа степеней сво боды (табл. 4.4).

Наконец, для сравнения выборок разного объема использу ется критерий Данна. Впрочем, ничто не мешает применить его и к выборкам одинакового объема. Значение критерия Данна:

RA - RB Q =, N N + 1 1 ( )+ 12 nA nB 352 ГЛАВА Таблица 10.10. Критические значения Q для попарного сравне ния групп Число сравниваемых Уровень значимости выборок k 0,05 0, 2 1,960 2, 3 2,394 2, 4 2,639 3, 5 2,807 3, 6 2,936 3, 7 3,038 3, 8 3,124 3, 9 3,197 3, 10 3,261 3, 11 3,317 3, 12 3,368 3, 13 3,414 3, 14 3,456 3, 15 3,494 3, 16 3,529 3, 17 3,562 3, 18 3,593 3, 19 3,622 4, 20 3,649 4, 21 3,675 4, 22 3,699 4, 23 3,722 4, 24 3,744 4, 25 3,765 4, где и — средние ранги двух сравниваемых выборок, пA и пB RA RB — их объемы, а N — общий объем всех сравниваемых выборок.

Критические значения Q приведены в табл. 10.10. «Стягива ющее» сравнение проводится как в критерии Ньюмена—Кейлса.

Критерием Данна можно воспользоваться и для сравнения с контрольной выборкой. Приэтом формула для Q остается преж ней, только критические значения находятся уже по табл. 10.11.

Еще одна чашка кофе Вернемся к исследованию выведения кофеина. Мы уже устано вили, что между тремя группами (группа мужчин и две группы НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Таблица 10.11. Критические значения Q для сравнения с кон трольной группой Число сравниваемых Уровень значимости выборок k 0,05 0, 2 1,960 2, 3 2,242 2, 4 2,394 2, 5 2,498 3, 6 2,576 3, 7 2,639 3, 8 2,690 3, 9 2,735 3, 10 2,773 3, 11 2,807 3, 12 2,838 3, 13 2,866 3, 14 2,891 3, 15 2,914 3, 16 2,936 3, 17 2,955 3, 18 2,974 3, 19 2,992 3, 20 3,008 3, 21 3,024 3, 22 3,038 3, 23 3,052 3, 24 3,066 3, 25 3,078 3, J. H. Zar, Biostatistical analysis, 2nd ed., Prentice-Hall, Englewood Cliffs, N.J., 1984.

женщин — принимающих и не принимающих пероральные кон трацептивы) существует различие в скорости выведения кофеи на. Однако осталось неизвестным, какие группы отличаются друг от друга, а какие похожи. Для ответа на этот вопрос предназначены методы множественного сравнения. Поскольку численность групп разная, применим критерий Данна.

Из табл. 10.9 видно, что сильнее всего различаются средние ранги в 3-й группе (женщины, принимающие пероральные кон трацептивы) и в 1-й группе (мужчины). Вычисляем значение критерия Данна:

354 ГЛАВА R3 - R1 24, 67 - 11, Q === 3, 409.

31 31 + 1 1 ( ) N N + 1 1 ( ) + + 12 n3 n1 12 9 В табл. 10.10 находим 5% критическое значение для k = 3. Оно равно 2,394, то есть меньше выборочного. Тем самым, различия групп статистически значимы (Р < 0,05). Продолжим стягиваю щие сравнения. Следующая пара групп — женщины, прини мающие пероральные контрацептивы (3-я группа), и женщины, не принимающие пероральных контрацептивов (2-я группа):

R3 - R2 24, 67 - 14, Q == = 2, 438.

31 31 + 1 1 ( ) N N + 1 1 ( ) + + 12 n3 n2 12 9 Это значение также больше критического.

Наконец, для оставшейся пары групп:

R2 - R1 14, 22 - 11, Q === 0, 7583, 31 31 + 1 1 ( ) N N + 1 1 ( ) + + 12 n2 n1 12 9 что меньше критического. Итак, выведение кофеина у женщин, принимающих пероральные контрацептивы, медленнее, чем у женщин, не принимающих пероральных контрацептивов, и у мужчин;

последние же две группы по скорости выведения ко феина друг от друга не отличаются. Предположение о влиянии половых гормонов на выведение кофеина подтвердилось.

ПОВТОРНЫЕ ИЗМЕРЕНИЯ: КРИТЕРИЙ ФРИДМАНА Если одна и та же группа больных последовательно подвергается нескольким методам лечения или просто наблюдается в разные моменты времени, применяют дисперсионный анализ повторных измерений (гл. 9). Но чтобы использование дисперсионного ана лиза было правомерно, данные должны подчиняться нормально НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Таблица 10.12. Данные для расчета критерия Фридмана.

Пример Больной Метод лечения 12 11 2 24 1 33 4 42 3 51 4 Сумма рангов 11 14 13 му распределению. Если вы в этом не уверены, лучше восполь зоваться критерием Фридмана — непараметрическим аналогом дисперсионного анализа повторных измерений.

Логика критерия Фридмана очень проста. Каждый больной ровно один раз подвергается каждому методу лечения (или наб людается в фиксированные моменты времени). Результаты наб людений у каждого бального упорядочиваются. Обратите вни мание, что если раньше мы упорядочивали группы, то теперь мы отдельно упорядочиваем значения у каждого больного незави симо от всех остальных. Таким образом, получается столько упо рядоченных рядов, сколько больных участвует в исследовании.

Далее, для каждого метода лечения (или момента наблюдения) вычислим сумму рангов. Если разброс сумм велик — различия статистически значимы.

В табл. 10.12 описаны результаты испытания 4 методов лече ния на 5 больных. В таблице указаны не сами значения, а их ранги среди данных, относящихся к одному больному. Каждая строка, кроме последней, соответствует одному больному. Пос ледняя строка содержит суммы рангов для каждого из методов лечения. Различие сумм невелико;

не похоже, чтобы эффектив ность какого-то метода отличалась от эффективности других.

Теперь обратимся к табл. 10.13. Различие в эффективности методов выражено предельно четко — упорядочение одинако во для всех больных. Во всех случаях наиболее эффективным оказался первый метод лечения, следующим — третий, за ним четвертый, и наконец, наименее эффективным — второй.

356 ГЛАВА Таблица 10.13. Данные для расчета критерия Фридмана.

Пример Метод лечения Больной 14 1 24 1 34 1 44 1 54 1 Сумма рангов 20 5 15 Перейдем к количественному оформлению наших впечатле ний. Критерий Фридмана сходен с критерием Крускала—Уол лиса и вычисляется следующим образом. Сначала рассчитаем среднюю сумму рангов, присвоенных одному методу. (Именно этой величине равнялась бы сумма рангов любого из методов, если бы они были в точности равноэффективны.) Затем вы числим сумму квадратов S отклонений истинных сумм рангов, полученных каждым из методов, от средней суммы.

Разберем это на примере данных из табл. 10.12 и 10.13. Для каждого больного средний ранг равен (1 + 2 + 3 + 4)/4 = 2,5. В общем случае при k методах лечения средний ранг равен 1 + 2 + … + k k + =.

k Если каждым методом лечилось n больных, средняя сумма рангов равна п(k +1)/2. В нашем примере п = 5. Поэтому сред няя сумма рангов равна 5(4 + 1)/2 = 12,5.

Значение критерия S определяется формулой n k + S = Rм ( ), где Rм — истинные суммы рангов для методов лечения. Тогда для табл. 10.12 находим:

S = (11 – 12,5)2 + (14 – 12,5)2 + (13 – 12,5)2 + (12 – 12,5)2 = =(–1,5)2 + (1,5)2 + (0,5)2 + (–0,5)2 = 5, НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ а для табл. 10.13:

S = (20 – 12,5)2 + (5 – 12,5)2 + (l5 – 12,5)2 + (10 – 12,5)2 = = (7,5)2 + (–7,5)2 + (2,5)2 + (–2,5)2 = 125.

Значение S для второй таблицы значительно превосходит зна чение для первой, что соответствует нашим первоначальным впечатлениям. Величина S позволяет судить, одинакова ли эф фективность исследуемых методов.

Однако поделив ее на nk(k + 1)/12, мы получим более удоб ный критерий:

12 12 n k + r = S = Rм - ( ).

nk k + 1 nk k + 1 ( ) ( ) Это и есть критерий Фридмана. При большой численности группы его величина приблизительно следует распределению 2 с числом степеней свободы = k – 1. Однако при k = 3 и n и при k = 4 и n 4 это приближение оказывается слишком гру бым. В таком случае нужно воспользоваться приведенными в табл. 10.14 точными значениями.

r Повторим порядок расчета критерия Фридмана.

• Расположите значения для каждого больного по возрастанию, каждому значению присвойте ранг.

• Для каждого из методов лечения подсчитайте сумму при своенных ему рангов.

• Вычислите значение.

r • Если число методов лечения и число больных присутствует в табл. 10.14, определите критическое значение по этой таб r лице. Если число методов лечения и число больных достаточ но велико (отсутствует в таблице), воспользуйтесь критичес ким значением 2 с числом степеней свободы = k – 1.

• Если рассчитанное значение превышает критическое — r различия статистически значимы.

Теперь применим критерий Фридмана для анализа уже зна комого исследования.

Таблица 10.14. Критические значения критерия Фридмана k = 3 k = 2 n r Р n r Р 3 6,00 0,028 2 6,00 0, 4 6,50 0,042 3 7,00 0, 8,00 0,005 8,20 0, 5 5,20 0,093 4 7,50 0, 6,40 0,039 9,30 0, 8,40 0,008 5 7,80 0, 6 5,33 0,072 9,96 0, 6,33 0,052 6 7,60 0, 9,00 0,008 10,20 0, 7 6,00 0,051 7 7,63 0, 8,86 0,008 10,37 0, 8 6,25 0,047 8 7,65 0, 9,00 0,010 10,35 0, 9 6,22 0,048 8,67 0, 10 6,20 0, 8,60 0, 11 6,54 0, 8,91 0, 12 6,17 0, 8,67 0, 13 6,00 0, 8,67 0, 14 6,14 0, 9,00 0, 15 6,40 0, 8,93 0, k — число методов лечения (моментов наблюдения), п — число больных, — уровень значимости.

Owen. Handbook of statistical tables. US Department of Eneigy, Addison-Wesley, Reading, Mass., 1962.

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Таблица 10.15. Легочное сосудистое сопротивление при лече нии гидралазином Легочное сосудистое сопротивление До лечения Спустя 3— (контрольное) Спустя 48 часов месяцев Больной Величина Ранг Величина Ранг Величина Ранг 1 22,2 3 5,4 1 10,6 2 17,0 3 6,3 2 6,2 3 14,1 3 8,5 1 9,3 4 17,0 3 10,7 1 12,3 Гидрапазин при первичной легочной гипертензии В табл. 10.15 воспроизведены данные о легочном сосудистом сопротивлении из табл. 9.5. В предыдущей главе мы примени ли к ним дисперсионный анализ повторных измерений. Это допустимо в случае нормального распределения. Но данных так мало, что судить о распределении невозможно. Поэтому при бегнем к критерию Фридмана, не требующему нормальности распределения.

Имеем три измерения (k = 3) у четырех больных (п = 4). Сред ний ранг для каждого наблюдения 1 + 2 + 3/3 = 2. Средняя сум ма рангов для каждого измерения равна 4 2 = 8. Сумма квадра тов отклонений для трех наблюдений:

S = (12 – 8)2 + (5 – 8)2 + (7 – 8)2 = (42) + (–3)2 + (–1)2 = 26, 12 r = S = 26 = 6, 5.

nk k + 1 4 3 ( ) Эта величина совпадает с критическим значением при r п = 4 и k = 3. Соответствующий точный уровень значимости составляет 0,042. Таким образом, различия между измерени ями статистически значимы (Р < 0,05).

Множественное сравнение после применения критерия Фридмана Как всегда, за выявлением различий между несколькими мето дами лечения должно последовать выяснение, в чем состоят эти 360 ГЛАВА различия, то есть попарное сравнение методов лечения. По скольку число больных, подвергшихся каждому методу лече ния, одинаково, для этой цели легко приспособить критерий Ньюмена—Кейлса. Если считать один из методов лечения «контролем», то остальные можно сравнить с ним при помощи критерия Даннета. Если речь идет о повторных наблюдениях в ходе лечения, таким контролем естественно считать значения, полученные перед началом лечения.

Итак, для попарного сравнения методов лечения (или мо ментов наблюдения) применяется критерий Ньюмена—Кейлса:

RA - RB q =, nl l + ( ) где RA и RB — суммы рангов для двух сравниваемых методов лечения, l — интервал сравнения, а п — число больных. Найден ное значение q сравнивается с критическим из табл. 4.3 для бес конечного числа степеней свободы. Если найденное значение больше критического, различие методов лечения (моментов на блюдения) статистически значимо.

Для сравнения с контрольной группой применяется крите рий Даннета:

Rкон - RA q =, nl l + ( ) где l — число всех групп, включая контрольную, Rкон — сумма рангов в контрольной группе. Остальные величины определяют ся, как в формуле для q. Значение q сравнивается с критичес ким из табл. 4.4 для бесконечного числа степеней свободы.

Пассивное курение при ишемической болезни сердца При ишемической болезни сердца коронарные артерии сужены атеросклеротическими бляшками. В отсутствие физической на грузки, когда потребность миокарда в кислороде низка, это ни как не сказывается на состоянии больного. Однако при физи НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ческой нагрузке, когда потребность миокарда в кислороде уве личивается, коронарные артерии уже не могут обеспечить соот ветствующего увеличения кровотока и развивается приступ сте нокардии.

Курение для больных ишемической болезнью сердца особен но вредно. Тому есть несколько причин. Первая — при курении происходит сужение артерий и ухудшается кровоток. К сердцу поступает меньше кислорода и питательных веществ, затрудня ется удаление продуктов метаболизма. Вторая причина — окись углерода из сигаретного дыма проникает в кровь и связывается с гемоглобином, замещая кислород. И наконец, третья причина — никотин и другие содержащиеся в табачном дыме вещества снижают сократимость миокарда, уменьшая кровоток и снаб жение кислородом и питательными веществами всех органов, в том числе самого миокарда. В результате переносимость физи ческой нагрузки снижается — приступы стенокардии возника ют при менее интенсивной и продолжительной физической на грузке.

Приводит ли к таким же последствиям пассивное курение?

На этот вопрос попытался ответить У. Аронов*.

В эксперименте участвовали 10 больных ишемической бо лезнью сердца. Переносимость физической нагрузки определя ли как время, в течение которого больной мог выполнять работу (крутить велотренажер) до возникновения приступа стенокардии.

У каждого больного определяли переносимость физической нагрузки, затем в течение 2 часов он отдыхал в отдельной ком нате, где присутствовала специальная группа окуривателей из человек. Окуриватели либо не курили, либо выкуривали по сигарет, в последнем случае помещение либо проветривали, либо не проветривали. После такого отдыха переносимость фи зической нагрузки определяли вновь. Исследование продолжа лось 3 дня, и каждый больной испытал (в случайном порядке) все три вида отдыха, по одному в день. Результаты представле ны в табл. 10.16.

Сначала, рассматривая данные как 6 отдельных измерений, * W. S. Aronow. Effect of passive smoking on angina pectoris. N. Engl. J. Med., 299: 21—24, 1978.

362 ГЛАВА оценим статистическую значимость различий между ними. При меним критерий Фридмана. Средний ранг равен 1 + 2 + 3 + 4 + 5 + = 3, 5.

Средняя сумма рангов по каждому измерению 3,510 = 35.

Тогда:

S = (44 – 35)2 + (53 – 35)2 + (39 – 35)2 + + (20 – 35)2 + (44 – 35)2 + (10 – 35)2 = 1352, r = 1352 = 38, 629.

10 6 6 + ( ) Полученное значение больше 20,517 — критического зна чения 2 для 0,1% уровня значимости при n = k – 1 = 6 – 1 = степенях свободы (см. табл. 5.7). Тем самьм, различия статисти чески значимы.

Чтобы понять, в чем заключаются различия, применим кри терий Ньюмена—Кейлса. Все измерения перенумеруем как по казано в табл. 10.6, расположим по убыванию сумм рангов и приступим к попарному сравнению. Крайние суммы рангов — 53 при 2-м измерении и 10 при 6-м измерении. Интервал срав нения l = 6, число больных n = 10.

R2 - R6 53 - q == = 7, 268.

10 6 nl l + ( ) Значение q превышает 4,030 — критическое значение q для уровня значимости = 0,05, интервала сравнения l = 6 и беско нечного числа степеней свободы (табл. 4.3А). Различия стати стически значимы. Остальные попарные сравнения приведены в табл. 10.17. Уровни четко разделяются на три группы. Первая группа (максимальная переносимость физической нагрузки) включает 1, 2, 3 и 5-е измерения, то есть все три измерения до отдыха, а также измерение после отдыха на свежем воздухе. Вто рая группа представлена единственным измерением — после отдыха в прокуренном, но проветриваемом помещении. Нако Таблица 10.16. Продолжительность физической нагрузки у больных ишемической болезнью сердца до и после отдыха при пассивном курении разной интенсивности, с Пассивное курение, Пассивное курение без Свежий воздух проветривание проветривания 12 34 До отдыха После отдыха До отдыха После отдыха До отдыха После отдыха Больной Время Ранг Время Ранг Время Ранг Время Ранг Время Ранг Время Ранг 1 193 4 217 6 191 3 149 2 202 5 127 2 206 5 214 6 203 4 169 2 189 3 130 3 188 4 197 6 181 3 145 2 192 5 128 4 375 3 412 6 400 5 306 2 387 4 230 5 204 5 199 4 211 6 170 2 196 3 132 6 287 3 310 5 304 4 243 2 312 6 198 7 221 5 215 4 213 3 158 2 232 6 135 8 216 5 223 6 207 3 155 2 209 4 124 9 195 4 208 6 186 3 144 2 200 5 129 10 231 6 224 4 227 5 172 2 218 3 125 Сумма рангов 44 53 39 20 44 Среднее 231,6 241,9 232,3 181,1 233,7 145, время W, S. Aronow. Effect of passive smoking on angina pectoris. N. Engl. J.Med., 299:21–24, 1978.

364 ГЛАВА Таблица 10.17. Попарные сравнения Разность Критичес Сравне- сумм кое значе ние рангов l q ние q P < 0, 2 и 6 53 – 10 = 43 6 7,268 4,030 Да 2 и 4 53 – 20 = 33 5 6,600 3,858 Да 2 и 3 53 – 39 = 14 4 3,430 3,633 Нет 2 и 5 53 – 44 = 9 3 Нет 2 и 1 53 – 44 = 9 2 Нет 1 и 6 44 – 10 = 34 5 6,800 3,858 Да 1 и 4 44 – 20 = 24 4 5,879 3,633 Да 1 и 3 44 – 39 = 5 3 1,581 3,314 Нет 1 и 5 44 – 44 = 0 2 Нет 5 и 6 44 – 10 = 34 4 8,329 3,633 Да 5 и 4 44 – 20 = 24 3 7,590 3,314 Да 5 и 3 44 – 39 = 5 2 2,236 2,772 Нет 3 и 6 39 – 10 = 29 3 9,171 3,314 Да 3 и 4 39 – 20 = 19 2 8,497 2,772 Да 4 и 6 20 – 10 = 10 2 4,472 2,772 Да нец, третья группа (переносимость физической нагрузки мини мальная) также содержит единственное измерение — после от дыха в прокуренном непроветриваемом помещении. Между из мерениями, вошедшими в разные группы, различия статистически значимы (при = 0,05). Общий вывод из работы Аронова: пас сивное курение снижает переносимость физической нагрузки при ишемической болезни сердца.

ВЫВОДЫ Изложенные в этой главе методы предназначены для проверки тех же гипотез, что критерий Стьюдента и дисперсионный ана лиз, но при этом не требуют, чтобы данные подчинялись нор мальному распределению. Заменяя исходные данные рангами и избавляясь тем самым от необходимости делать какие-либо пред положения относительно типа распределения, мы сохраняем большую часть информации о значениях признака и их изме НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ нениях. Если распределение все же оказывается нормальным, то при этом происходит некоторое снижение чувствительнос ти. Однако если распределение отлично от нормального, непараметрические методы чувствительнее параметрических.

Обратите внимание, что, оперируя не данными, а рангами, рассмотренные методы строятся, в сущности, по тому же прин ципу, что и рассмотренные ранее пераметрические, такие, как критерий Стьюдента и дисперсионный анализ. Заменив данные рангами, мы делаем следующее.

• Формулируем нулевую гипотезу, то есть предполагаем, что наблюдаемые различия случайны.

• Выбираем критерий, то есть числовое выражение различий.

• Определяем, каким было бы распределение величины кри терия при условии справедливости нулевой гипотезы.

• Находим критическое значение, то есть величину, которую при справедливости нулевой гипотезы значение критерия превышает достаточно редко (точнее, с вероятностью, рав ной уровню значимости ).

• Вычисляем значение критерия для наших данных и сравниваем его с критическим: если вычисленное значение больше, при знаем различия статистически значимыми. Выбор между па раметрическими и непараметрическими методами определя ется прежде всего характером данных. Имея дело с порядко выми признаками, не остается ничего, кроме как воспользо ваться непараметрическими методами. Если признак число вой, стоит подумать, нормально ли его распределение. Тут могут помочь как общие соображения, так и графическое пред ставление данных. Даже если нет веских оснований сомне ваться в нормальности распределения, но данных мало, или вы не хотите делать никаких предположений о типе распреде ления — воспользуйтесь непараметрическими методами.

ЗАДАЧИ 10.1 Анализы, инструментальные исследования и лекарст венные средства назначает врач, а платит за них главным об разом больной. Многие врачи весьма смутно представляют себе 366 ГЛАВА К задаче 10.1.

Среднегодовые расходы Среднегодовые расходы на обследование одного на лечение одного больного, долл. больного, долл.

До озна- После озна- До озна- После озна комления с комления с комления с комления с Врач расходами расходами расходами расходами 1 20 20 32 2 17 26 41 3 14 1 51 4 42 24 29 5 50 1 76 6 62 47 47 7 8 15 60 8 49 7 58 9 81 65 40 10 54 9 64 11 48 21 73 12 55 36 66 13 56 30 73 стоимость своих назначений и не озабочены тем, чтобы умень шить расходы больного. Чтобы побудить врачей задуматься об этом, все шире практикуется учет затрат на обследование и ле чение. Есть ли основания считать, что это сделает врача более экономным? Интересное исследование провели С. Шредер и соавт. (S. Schroeder et al. Use of laboratory tests and pharmaceuticals:

variation among physicians and effect of cost audit on subsequent use. JAMA, 225:969—973, 1973). В течение трех месяцев они регистрировали расходы на обследование и лечение амбулатор ных больных, которых наблюдали врачи из клиники Вашингтонского университета. Данные собирали по больным со сходными заболеваниями. Рассчитав для каждого врача сред негодовые расходы на обследование и лечение одного больно го, составили общий список, который раздали врачам. Каждый врач знал свой номер в списке, но не знал номеров своих коллег, НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ таким образом он мог сравнить свои расходы с расходами дру гих, но не знал, кого именно. Через некоторое время исследова тели проверили, какие изменения произошли в расходовании средств у тех же врачей. Результаты представлены в таблице на предыдущей странице.

Произошли ли изменения в расходах на обследование и ле чение? Есть ли связь между расходами на обследование и лече ние? Как можно объяснить полученные результаты?

10.2. При заболеваниях сетчатки повышается проницаемость ее сосудов. Дж. Фишмен и соавт. (G. Fishman et al. Blood-retinal barrier function in patients with cone or cone-rod dystrophy. Arch.

Ophthalmol., 104:545—548, 1986) измерили проницаемость сосу дов сетчатки у здоровых и у больных с ее поражением. Полу ченные результаты приведены в таблице.

Проницаемость сосудов сетчатки Здоровые Больные 0,5 1, 0,7 1, 0,7 1, 1,0 1, 1,0 1, 1,2 1, 1,4 2, 1,4 2, 1,6 2, 1,6 6, 1,7 19, 2,2 23, С помощью непараметрического метода проверьте, подтвер ждают ли эти данные гипотезу о различии в проницаемости со судов сетчатки? После этого воспользуйтесь соответствующим параметрическим методом. Если выводы окажутся иными, объясните, в чем причина различия.

10.3. Данные задачи 10.2 — часть более широкого исследо вания проницаемости сетчатки. Сравните данные, относящие ся к разным видам поражений.

368 ГЛАВА Проницаемость сосудов сетчатки Нормальная Поражение только в Аномалии в области сетчатка области центральной центральной ямки ямки и на перефирии 0,5 1,2 6, 0,7 1,4 12, 0,7 1,6 12, 1,0 1,7 13, 1,0 1,7 14, 1,2 1,8 15, 1,4 2,2 20, 1,4 2,3 22, 1,6 2,4 27, 1,6 6, 1,7 19, 2,2 23, 10.4. Решите задачи 9.5 и 9.6, используя непараметрические методы.

10.5. В гл. 3 на примере больных пиелонефритом была рас смотрена зависимость продолжительности госпитализации от правильности лечения. Д. Кнапп и соавт. решили выяснить, на блюдается ли такая зависимость при лечении пневмонии. Изу чив 28 историй болезни, исследователи обнаружили следующее.

Продолжительность госпитализации, сут При правильном лечении При неправильном лечении 3,7 3,8 1,7 4,8 8, 2,5 6,8 2,5 5,3 9, 2,8 7,9 2,9 5,5 10, 3,0 8,8 3,0 5,8 11, 5,5 9,0 3,4 7, 6,4 9,3 3,7 6, Есть ли разница в продолжительности госпитализации?

10.6. Предсердный натрийуретический гормон усиливает вы ведение натрия и воды почками. В. Хименес и соавт. (W. Jimenez НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ et al. Atrial natriuretic factor: reduced cardiac content in cirrhotic rats with ascites. Am. J. Physiol., 250:F749—F752, 1986) исследо вали его роль в задержке натрия и воды при циррозе печени.

Крысам вводили экстракт предсердия: одной группе — экст ракт, полученный от здоровых крыс, другой — от крыс с цирро зом печени. Регистрировали изменение выделения натрия с мо чой (в процентах от исходного). Результаты представлены в таб лице. Какой вывод можно сделать по результатам опыта?

Экстракт от здоровых крыс Экстракт от крыс с циррозом 760 1000 1370 1680 1970 2420 3260 5000 5400 7370 10.7. Введя изотоп внутривенно и наблюдая за его распростра нением с помощью гамма-камеры, можно определить кровена полнение различных органов, в том числе легких. Р. Окада и со авт. (R. Okada et al. Radionuclide-determined change in pulmonary blood volume with exercise: improved sensitivity ofmultigated blood pool scanning in detecting coronary-artery disease. N. Engl. J. Med., 301:569—576, 1979) решили использовать этот метод для локали зации поражения коронарных артерий при ишемической болез ни сердца. Правая коронарная артерия снабжает кровью главным образом правый желудочек, левая — главным образом левый. Ле вый желудочек перекачивает кровь, которая поступает в него из легких, по всему телу. При поражении левой коронарной артерии кровоснабжение левого желудочка ухудшается. В покое, когда 370 ГЛАВА объем перекачиваемой крови невелик, это никак не проявляет ся, однако при физической нагрузке это приводит к накопле нию крови в легких. При поражении правой коронарной арте рии этого не происходит. Примерно так рассуждали авторы, приступая к работе. Было обследовано 33 человека: 9 здоровых (1-я группа) и 24 больных ишемической болезнью сердца, из них 5 с поражением только правой коронарной артерии (2-я груп па) и 19 с поражением обеих коронарных артерий или только левой (3-я группа). Рассчитывали отношение кровенаполнения легких при физической нагрузке к кровенаполнению в покое:

по мысли авторов, в 3-й группе этот показатель должен быть выше, чем в первых двух. Результаты представлены в таблице.

Группа 12 0,83 0,86 0, 0,89 0,92 1, 0,91 1,00 1, 0,93 1,02 1, 0,94 1,20 1, 0,97 1, 0,97 1, 0,98 1, 1,02 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, Различаются ли группы межцу собой? Если да, то как имен но и достаточно ли велико различие, чтобы исследуемый показа НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ тель можно было использовать для определения пораженной ко ронарной артерии?

Pages:     | 1 |   ...   | 2 | 3 || 5 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.