Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Статистика в биомедицине, фармации и фармацевтике

Покупка
Артикул: 781047.01.99
Доступ онлайн
502 ₽
В корзину
В издании рассмотрены основные процедуры сбора, обработки и анализа статистических данных, возможности их реализации на персональных компьютерах. Настоящее издание дает представление о теоретических основах статистических методов обработки данных, методиках и границах их применения. Для желающих более глубоко изучить соответствующие разделы теории вероятностей и математической статистики приведен список рекомендуемой литературы и глоссарий понятий этих учебных дисциплин. Изложение теории проиллюстрировано примерами из разнообразных областей медицинской и фармацевтической практики, которые должны убедить читателя в реальной возможности применения методов статистического анализа данных для решения как научных, так и практических задач. Издание рекомендовано Экспертным советом УМО в системе ВО и СПО в качестве учебного пособия для обучающихся по основным образовательным программам высшего образования — программам подготовки научно-педагогических кадров в магистратуре, ординатуре, аспирантуре по области образования «Здравоохранение и медицинские науки».
Зубов, Н. Н. Статистика в биомедицине, фармации и фармацевтике : учебное пособие / Н. Н. Зубов, В. И. Кувакин, С. З. Умаров ; под общ. ред. И. А. Наркевича. - Москва ; Берлин : Директ-Медиа, 2019. - 385 с. - ISBN 978-5-4499-1173-5. - Текст : электронный. - URL: https://znanium.com/catalog/product/1873517 (дата обращения: 27.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Н. Н. Зубов, В. И. Кувакин, 
С. З. Умаров 

СТАТИСТИКА 
В БИОМЕДИЦИНЕ, 
ФАРМАЦИИ 
И ФАРМАЦЕВТИКЕ 

Учебное пособие 

Под общей редакцией 
профессора И. А. Наркевича 

Москва 
Берлин 
2019 

УДК 615.036.2(075) 
ББК 51.1(2Рос),02я73 
З-91 

Зубов, Н. Н. 

З-91  
Статистика в биомедицине, фармации и фармацевтике : 
учебное пособие / Н. Н. Зубов, В. И. Кувакин, С. З. Умаров ; 
под общ. ред. И. А. Наркевича — Москва ; Берлин : ДиректМедиа, 2019. — 385 с. 

ISBN 978-5-4499-1173-5 

В издании рассмотрены основные процедуры сбора, обработки 
и анализа статистических данных, возможности их реализации на персональных компьютерах. Настоящее издание дает представление о теоретических 
основах статистических методов обработки данных, методиках и границах их 
применения. Для желающих более глубоко изучить соответствующие разделы теории вероятностей и математической статистики приведен список рекомендуемой литературы и глоссарий понятий этих учебных дисциплин. 
Изложение теории проиллюстрировано примерами из разнообразных областей медицинской и фармацевтической практики, которые должны убедить 
читателя в реальной возможности применения методов статистического анализа данных для решения как научных, так и практических задач. 
Издание рекомендовано Экспертным советом УМО в системе ВО и 
СПО в качестве учебного пособия для обучающихся по основным образовательным программам высшего образования — программам подготовки научно-педагогических кадров в магистратуре, ординатуре, аспирантуре по 
области образования «Здравоохранение и медицинские науки». 
Текст приводится в авторской редакции. 

УДК 615.036.2(075) 
ББК 51.1(2Рос),02я73 

ISBN 978-5-4499-1173-5   © Зубов Н. Н., Кувакин В. И., Умаров С. З., текст, 2019 

© Издательство «Директ-Медиа», оформление, 2019 

СОДЕРЖАНИЕ 

Обозначения и сокращения ...................................................................... 7 
Введение .................................................................................................... 11 
1. Современная статистика в биомедицине, фармации
и фармацевтике ......................................................................................... 13 
2. Основные положения теории вероятностей. Случайные
события и случайные величины ............................................................. 16 
2.1. Понятие вероятности случайного события .............................. 17 
2.2. Проверка гипотез о вероятности случайного события ........... 21 
2.3. Определение частостей случайных событий. Оценка 
значимости различия частостей случайных событий 
в независимых выборках с помощью пакетов прикладных 
программ (ППП) MS Excel и Statistica StatSoft. Inc ........................ 22 
2.4. Показатели состояния здоровья как случайные 
величины .............................................................................................. 28 
2.5. Шкалы измерения случайных величин ..................................... 29 
2.6. Закон распределения случайной величины .............................. 32 
2.7. Числовые характеристики случайной величины ..................... 37 
2.8. Моменты случайной величины .................................................. 46 
2.9. Наиболее распространенные законы распределения 
дискретных случайных величин ....................................................... 47 
2.10. Наиболее распространенные законы распределения 
непрерывных случайных величин .................................................... 53 
2.11. Определение числовых характеристик случайных 
величин. Оценка значимости различия показателя 
в независимых и связанных выборках с помощью 
ППП MS Excel и Statistica, StatSoft. Inc ............................................ 64 
3. Элементы математической статистики ............................................. 71

3.1. Выборочный метод исследования ............................................. 72 
3.2. Статистическая оценка неизвестных параметров 
распределения случайных величин .................................................. 76 
3.3. Проверка статистических гипотез ............................................. 82 
4. Выявление и оценка связи между признаками .............................. 101

4.1. Виды связей между признаками .............................................. 101 
4.2. Построение диаграмм................................................................ 103 

4.3. Корреляционный анализ ........................................................... 104 
4.4. Регрессионный анализ. Линейная регрессия ......................... 113 
4.5. Исследование связи между показателями методом 
однофакторного регрессионного анализа с помощью 
ППП MS Excel и Statistica, StatSoft. Inc ......................................... 121 
4.6. Исследование связи между показателями методом 
многомерного корреляционного анализа. Построение 
модели — уравнения регрессии — методом пошагового 
регрессионного анализа с помощью ППП MS Excel 
и Statistica, StatSoft. Inc .................................................................... 129 
4.7. Регрессионный анализ. Нелинейная регрессия ..................... 147 
5. Таблицы сопряжённости ................................................................... 150 
5.1. Критерий χ2 (Хи-квадрат) по Пирсону .................................... 151 
5.2. Критерий χ2 (Хи-квадрат) с поправкой 
на правдоподобие ............................................................................. 152 
5.3. Фи-коэффициент, критерий Фишера ...................................... 152 
5.4. Коэффициент сопряженности признаков ............................... 153 
5.5. Критерий Крамера ..................................................................... 154 
5.6. Критерий Стьюдента................................................................. 154 
6. Дисперсионный анализ ..................................................................... 157 
6.1. Сущность и задачи дисперсионного анализа ........................ 158 
6.2. Анализ однофакторных комплексов ....................................... 161 
6.3. Анализ двухфакторных комплексов ....................................... 167 
6.4. Оценка степени влияния факторов методом 
двухфакторного дисперсионного анализа на основе 
полного факторного эксперимента с помощью 
ППП MS Excel и Statistica, StatSoft. Inc ......................................... 170 
7. Дискриминантный анализ ................................................................ 188 
7.1. Сущность и задачи дискриминантного анализа .................... 188 
7.2. Этапы решения задач дискриминантного анализа ............... 193 
7.3. Формирование решающих правил диагностики. 
Построение линейных классификационных функций 
и канонических линейных дискриминантных функций ............. 198 
7.4. Оценка эффективности решающих правил диагностики .... 202 
7.5. Диагностика заболеваний поступающих больных 
на основании применения выработанных решающих правил ... 204 

7.6. Построение линейных дискриминантных функций 
(ЛДФ) для решения задачи медицинской диагностики 
с помощью ППП MS Excel и Statistica, StatSoft. Inc ..................... 211 
8. Факторный анализ .............................................................................. 228 
8.1. Сущность и задачи факторного анализа ................................. 228 
8.2. Метод главных компонент ....................................................... 230 
8.3. Интерпретация главных факторов. Ротация факторов ......... 232 
8.4. Построение линейных моделей для признаков. 
Классификация объектов по главным факторам .......................... 233 
8.5. Исследование условий развития заболеваемости 
методом факторного анализа с помощью ППП MS Excel 
и Statistica, StatSoft. Inc ..................................................................... 243 
9. Кластерный анализ............................................................................. 249 
9.1. Сущность кластерного анализа и его основные этапы ......... 250 
9.2. Этапы кластерного анализа ...................................................... 251 
9.3. Коэффициент корреляции как мера сходства объектов ....... 252 
9.4. Коэффициенты подобия как мера сходства объектов .......... 252 
9.5. Функции расстояния для непрерывно варьирующих 
признаков ........................................................................................... 254 
9.6. Некоторые виды метрик для непрерывно варьирующих 
признаков ........................................................................................... 255 
9.7. Функции расстояния для качественных признаков .............. 258 
9.8. Решение задачи медицинской диагностики методом 
кластерного анализа с помощью ППП MS Excel и Statistica, 
StatSoft. Inc ......................................................................................... 270 
10. Динамические ряды и методы их анализа .................................... 275 
10.1. Основные показатели, используемые для анализа 
динамических рядов ......................................................................... 277 
10.2. Прогнозы объёма продаж с помощью методов выявления 
тенденции в динамическом ряду .................................................... 282 
11. Непараметрические методы анализа данных ............................... 298 
11.1. Непараметрические критерии различия между 
независимыми выборками ............................................................... 300 
11.2. Непараметрические критерии различия между 
зависимыми выборками ................................................................... 307 
Рекомендуемая литература ................................................................... 326 

 

Глоссарий ................................................................................................ 328 
Указатель ................................................................................................ 345 
Приложения ............................................................................................ 352 
Приложение А. Функция Лапласа .................................................. 352 
Приложение Б. Функция, обратная функции Лапласа ................ 354 
Приложение В. Функция распределения биномиального 
закона ................................................................................................. 355 
Приложение Г. Закон распределения Пуассона ........................... 356 
Приложение Д. Вероятность появления события  
хотя бы один раз в серии из n независимых опытов .................... 357 
Приложение Е. Формула расчёта наряда средств ........................ 360 
Приложение Ё. Критические значения Хи-квадрат 
распределения ................................................................................... 361 
Приложение Ж. Критические значения t-критерия 
Стьюдента .......................................................................................... 365 
Приложение З. Критические значения для наибольшего 
отклонения эмпирического распределения от теоретического 
(критерий Колмогорова — Смирнова) .......................................... 367 
Приложение И. Критические значения коэффициента 
ранговой корреляции Спирмена ..................................................... 368 
Приложение К. Значения критерия Фишера (F-критерия) ......... 369 
Приложение Л. Критические значения Z-критерия серий 
Вальда — Вольфовица ..................................................................... 372 
Приложение М. Критические значения U-критерия 
Манна — Уитни для уровня значимости p = 0,05 ........................ 374 
Приложение Н. Критические значения критерия 
Лиллиефорса ..................................................................................... 375 
Приложение О. Значения коэффициентов для критерия 
Шапиро — Уилка ............................................................................. 376 
Приложение П. Критические значения G-критерия знаков ....... 378 
Приложение Р. Критические значения Т-критерия 
Уилкоксона ........................................................................................ 379 
Приложение С. Критические значения критерия Фридмана ..... 380 
Приложение Т. Критические значения L-критерия Пейджа ...... 382 
Приложение У. Критические значения критерия 
Краскела — Уоллиса ........................................................................ 383 
 
 

ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ 

p*
выборочная вероятность (частость) случайного события

φ
величина центрального угла при преобразовании Фишера 

[
]
M X  
математическое ожидание случайной величины X

x
m
выборочная средняя, оценка математического ожидания 
случайной величины X 

σ[X]
среднее квадратическое отклонение случайной величины X 

k
ν  
начальный момент случайной величины k-го порядка

k
µ  
центральный момент случайной величины k-го порядка

sA  
коэффициент асимметрии

k
E  
эксцесс

( )
Ф x  
функция Лапласа

( )
1
Ф
x
−
  
обратная функция Лапласа

(
)
1
2
φ X X
 функция расстояния или метрика

E
D
расстояние по Евклиду

2
M
D
 
расстояние по Махалонобису

2
χ
D  
расстояние по Сангви

2
St
D
расстояние Стейнберга

OH
D
расстояние Оливье — Хауэллса

p
выборочная вероятность случайного события

k
ν  
начальный момент случайной величины k-го порядка

k
µ  
центральный момент случайной величины k-го порядка

τ
коэффициент ранговой корреляции Кендалла

1p
σ
 
средняя квадратическая ошибка выборочной вероятности случайного события 

k′   
средний темп прироста (снижения)

Y
∆
средний прирост 

A, B, C
факторы в дисперсионном анализе

a0, a1
параметры линейной функции

ai
параметры 
(коэффициенты) 
уравнения 
регрессии, 

i = 1, n 

Ass
асимметрия

[
]
D X
дисперсия случайной величины X

DQ
расстояние по Евклиду по величине

Dr
мера расстояния в кластерном анализе

(
)
r
D
X  
каноническая линейная дискриминантная функция

DS
расстояние Спулера

DZ
расстояние по Евклиду по форме

F
критерий Фишера

F(х)
функция распределения случайной величины X

H0
нулевая гипотеза

k
число степеней свободы

k
темп роста (прироста, снижения)

Lj(X)
линейная классификационная функция

mr
средняя квадратическая ошибка коэффициента корреляции 

n
объём выборки

N(mx, σx)
двумерное нормальное распределение с параметрами 
mx, σx 

Ǫ
коэффициент ассоциации (коэффициент Юла)

r
коэффициент корреляции

RM = R2
коэффициент детерминации

So
среднее квадратическое отклонение наблюдавшихся 
значений случайной величины от рассчитанных по 
уравнению регрессии 

V
критерий Крамера 

Vx
коэффициент вариации распределения случайной величины Х 

W(λ, k)
двухпараметрическое распределение Вейбулла — Гнеденко с параметрами λ, k 

X, Y, Z,
учитываемые признаки в дисперсионном анализе

ŷ
прогнозируемое значение функции

β
доверительная вероятность 

ΔY
абсолютный прирост

ε
ширина доверительного интервала 

η
корреляционное отношение

ρ
коэффициент ранговой корреляции Спирмена

σ2

0
дисперсия, обусловленная неучтёнными факторами

σ2

r
дисперсия, обусловленная регрессией

χ2
критерий Хи-квадрат (по Пирсону)

ДСВ
дискретная случайная величина

Ме[X]
медиана случайной величины X

Мо[X]
мода случайной величины X

 

НСВ
непрерывная случайная величина

ОВЧ
относительная величина частоты 

ППП
пакет прикладных программ

Р(А)
вероятность случайного события А

ОРВИ
острая респираторная вирусная инфекция

РВ
радиоактивные вещества

С
коэффициент сопряженности признаков

СВ Y
случайная величина Y

СКО
среднее квадратическое отклонение CB X

Ф
коэффициент контингенции

х1, х2, ... , 
хn 

возможные значения случайной величины X

 

 
 

«Современная наука нашла как 
будто более надёжное средство против 
предубеждения в практической медицине, — это медицинская статистика, 
основанная на цифрах». 

Н. И. Пирогов1 

ВВЕДЕНИЕ 

Математическая статистика — раздел математики, посвящённый математическим методам систематизации, обработки и использования статистических данных для научных и практических 
выводов. 
Методы математической статистики (мета-анализ) дают возможность объективно оценивать количественные результаты исследований, позволяют обрабатывать данные небольшого числа 
наблюдений, увеличивают достоверность заключений по материалам исследований. Математическая обработка результатов позволяет 
также в сжатой и четкой форме публиковать цифровые данные исследований вместо громоздких таблиц, занимающих много места и 
трудных для восприятия. 
Обработка числовой информации в наши дни немыслима без 
применения средств вычислительной техники. Современный исследователь (врач, провизор) обязан обладать навыками компьютерной 
обработки данных и иметь представление о программном обеспечении, с помощью которого ее можно выполнять. Сегодня существует 
большое количество специализированных приложений для статистического анализа. Среди лидеров таких продуктов признана программа STATISTICA фирмы Tibco США. Помимо мощного набора 
процедур статистического и графического анализа, эта программа 
обладает весьма дружественным интерфейсом, что делает ее достаточно легкой для освоения и удобной в работе. 
В последнее время особое внимание уделяется разработке вопросов доказательной медицины, основанной на применении современных информационных технологий. Приведенные в настоящем 
                                                      

1 Пирогов Н. Н. Вопросы жизни. Дневник старого врача / Н. И. Пирогов. — СПб.: ВМедА, 2008. — С. 343. 

 

издании методы статистической оценки результатов клинических 
испытаний соответствуют требованиям GCP (Good Clinical Practice). 
Предлагаемые подходы позволяют решать практически все задачи 
статистической оценки клинических экспериментальных исследований. Кроме того, методы статистического анализа используются в 
процессе производства лекарственных препаратов, что позволяет 
проектировать создание по ряду оптимальных критериев технологических процессов, контролировать качество исходных ингредиентов 
и многое другое. 
Важную роль статистические методы выполняют и в исследованиях маркетингового характера, включая определение потребности в тех или иных медицинских изделиях, тенденции замены одних 
поколений лекарственных препаратов другими, оптимальную тактику их продвижения на рынок. 
В связи с ограниченным объемом пособие содержит примеры 
и пошаговые описания решений лишь типовых задач, возникающих 
в медицинских исследованиях (описательная статистика, сравнение 
двух и более выборок, корреляционный и регрессионный, дисперсионный и дискриминантный, факторный и кластерный анализы …). 
Авторы будут благодарны всем, пожелавшим изложить свои 
оценки, пожелания и советы по данной книге по адресу: statpharm@yandex.ru. 
 
 

1. СОВРЕМЕННАЯ СТАТИСТИКА 
В БИОМЕДИЦИНЕ, ФАРМАЦИИ 
И ФАРМАЦЕВТИКЕ 

Современный руководитель фармацевтического бизнеса любого ранга вынужден принимать решения в условиях постоянного 
прессинга, при этом, как правило, испытывая дефицит достоверной 
информации. Однако существуют методы, позволяющие максимально полно использовать любую доступную информацию. Речь 
идет о бизнес-статистике (от лат. status — состояние дел), науке, 
сочетающей учет и анализ, фиксирующей, систематизирующей и 
изучающей показатели наиболее типичных, массовых экономических процессов и их изменение во времени. 
Благодаря статистическим методам руководитель фармацевтического бизнеса имеет возможность извлекать ценную информацию из совокупности данных и на ее основе определить возможные 
риски и ожидаемые результаты. Такой подход является полной противоположностью той категории топ-менеджмента, которая считает, 
что принятие решения в бизнесе должно быть основано исключительно на интуиции и практическом опыте, что исключает использование какой либо количественной информации. Но даже и такие 
руководители не могут действовать в информационном вакууме и 
вынуждены принимать во внимание всю имеющуюся ценную информацию. 
Таким образом, статистические методы следует рассматривать 
как важную часть процесса принятия решений, позволяющую выработать обоснованные стратегические решения, сочетающие интуицию специалиста с тщательным анализом имеющейся информации. 
Примерами такой информации полезной как для фармацевтического 
ритейла, так и для других отраслей фармацевтического бизнеса могут быть: динамика товарооборота; количество посещений аптеки, 
количество заказов у дистрибьютора, показатель стоимости одного 
чека и др. 
Практическая ценность бизнес статистики заключается, прежде всего, в том, что она позволяет получать в концентрированном 
виде объективную характеристику определенной сферы бизнеса. 
Предположим, что в некоторой аптечной сети трудится несколько 
сотен работников первого стола. Соответственно каждый из них 

трудится с различной интенсивностью, однако информация о том, 
что величина средней выручки в расчете на одного сотрудника за 
смену составляет 82350 руб. дает определенное, хотя далеко не полное представление об интенсивности труда фармацевтического персонала данной аптечной сети. 
Фармацевтический бизнес во всех его областях отличается 
исключительной сложностью, изменчивостью, индивидуальным 
многообразием явлений и процессов. В большинстве случаев фармацевтические бизнес-процессы протекают неоднозначно. По этой 
причине попытки применить в каждом конкретном случае ранее 
наработанные эмпирические подходы, технологии или методы могут 
дать далеко не самые лучшие результаты. 
Причиной этого является наличие и воздействие субъективных факторов, обстоятельств, которые нельзя контролировать, но 
которые, тем не менее, влияют на результативность конкретного 
бизнес-процесса. Следовательно, неоднозначность протекания того 
или иного бизнес-процесса порождается наличием присущих ему 
случайных факторов. Однако это вовсе не означает отсутствие общих закономерностей, присущих бизнес-процессам. Например, приобретение препарата Актовегин в аптеке является случайным 
событием, но для пациентов с сосудистыми нарушениями головного 
мозга такие покупки являются уже не случайностью, а закономерностью. Выявлением и описанием случайных событий и явлений в 
контексте бизнес-процесса и занимается статистика. 
Возможности бизнес-статистики достаточно широки, а ее результаты могут быть использованы как для информационных целей 
(количественная характеристика), так и для целей прогнозирования 
(кратко-, средне- и долгосрочные прогнозы), а также для решения 
целого комплекса аналитических задач. 
С информационной точки зрения бизнес-статистика интересна 
тем, что представляет широкие возможности для сбора, обобщения 
и представления объективной информации о конкретном бизнеспроцессе. В связи с тем, что для получения объективных результатов в ходе статистического исследования необходимо изучить тысячи событий (явлений), то в этом случае необходимым является 
переход от сплошного исследования к выборочному по нескольким 
показателям. В этом случае значение приобретает технология сбора, обработки и анализа данных, которая позволяет использовать 

Доступ онлайн
502 ₽
В корзину