Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Организационно-экономическое моделирование. Часть 3. Статистические методы анализа данных

Покупка
Артикул: 433160.02.99
Доступ онлайн
1 100 ₽
В корзину
Изложены современные методы анализа статистических данных. Рассмотрены начала выборочных исследований и основные задачи описания данных, оценивания и проверки гипотез, статистические методы анализа числовых данных, многомерный статистический анализ и статистические методы анализа динамики. Приведены основные понятия теории статистического моделирования на примерах моделей экономики и управления, медицины, социологии, демографии, истории, электротехники. Материал учебника соответствует курсам лекций, которые автор читает в МГТУ им. Н.Э. Баумана. Для студентов и преподавателей вузов, слушателей институтов повышения квалификации, структур второго образования и программ МВА, инженеров различных специальностей, менеджеров, экономистов, социологов, научных и практических работников, чья деятельность связана с анализом данных.
Орлов, А. И. Организационно-экономическое моделирование : учебник : в 3 частях. Часть 3. Статистические методы анализа данных / А. И. Орлов. - Москва : МГТУ им. Баумана, 2012. - 624 с. - ISBN 978-5-7038-3566-1. - Текст : электронный. - URL: https://znanium.com/catalog/product/2023187 (дата обращения: 19.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
 

УДК 519.2:338 (075.8) 
ББК 60.6я73 
        О-66 
Р е ц е н з е н т ы: 
заместитель директора Института проблем управления РАН 
д-р техн. наук, проф., чл.-кор. РАН Д.А. Новиков; 
заведующий кафедрой  
«Системы управления экономическими объектами»  
Московского авиационного института  
(Государственного технического университета) 
д-р экон. наук, проф. В.Д. Калачанов 
 
Орлов А. И. 
Организационно-экономическое 
моделирование : 
учебник : в 3 ч. / А. И. Орлов. — М. : Изд-во МГТУ 
им. Н. Э. Баумана, 2012.  
ISBN 978-5-7038-3276-9 
Ч. 3 : Статистические методы анализа данных. — 
623, [1] с. : ил. 
ISBN 978-5-7038-3566-1 
Изложены современные методы анализа статистических дан-
ных. Рассмотрены начала выборочных исследований и основные 
задачи описания данных, оценивания и проверки гипотез, стати-
стические методы анализа числовых данных, многомерный стати-
стический анализ и статистические методы анализа динамики. 
Приведены основные понятия теории статистического моделирова-
ния на примерах моделей экономики и управления, медицины, со-
циологии, демографии, истории, электротехники. 
Материал учебника соответствует курсам лекций, которые 
автор читает в МГТУ им. Н.Э. Баумана. 
Для студентов и преподавателей вузов, слушателей институ-
тов повышения квалификации, структур второго образования и 
программ МВА, инженеров различных специальностей, менедже-
ров, экономистов, социологов, научных и практических работни-
ков, чья деятельность связана с анализом данных. 
 
 
 
 
 
 
ISBN 978-5-7038-3566-1 (ч. 3) 
ISBN 978-5-7038-3276-9 

© Орлов А. И., 2012 
© Оформление. Издательство 
    МГТУ им. Н. Э. Баумана, 2012 

УДК 519.2:338 (075.8) 
ББК 60.6я73 

 
О-66 

Оглавление 

Предисловие .................................................................................  
7 
Введение ........................................................................................  
9 
Часть I. Основные постановки задач анализа данных 
Глава 1. Выборочные исследования ........................................  37 
1.1. Организация выборочных исследований.........................  37 
1.2. Модели случайных выборок  ............................................  48 
1.3. Доверительное оценивание вероятности .........................  52 
1.4. Примеры прикладных выборочных  исследований ........  57 
1.5. Проверка однородности двух биномиальных выборок  ...  64 
Контрольные вопросы и задачи...............................................  70 
Темы докладов, рефератов, исследовательских работ  .........  71 
Литература ................................................................................  72 
Глава 2. Описание данных  .......................................................  73 
2.1. Модели порождения данных  ...........................................  73 
2.2. Таблицы и диаграммы  ......................................................  84 
2.3. Выборочные характеристики распределения  .................  87 
2.4. Эмпирическая функция распределения  ..........................  91 
2.5. Непараметрические оценки плотности  ...........................  94 
Контрольные вопросы и задачи ..............................................  100 
Темы докладов, рефератов,  исследовательских работ  ........  101 
Литература ................................................................................  101 
Глава 3. Оценивание ...................................................................  103 
3.1. Методы оценивания параметров  .....................................  103 
3.2. Одношаговые оценки  .......................................................  118 
3.3. Асимптотика решений экстремальных статистических  
            задач ...................................................................................  128 
3.4. Робастность статистических процедур  ...........................  138 
3.5. Оценивание для сгруппированных данных  ....................  142 
Контрольные вопросы и задачи ..............................................  157 
Темы докладов, рефератов, исследовательских работ ..........  158 
Литература ................................................................................  158 
Глава 4. Проверка гипотез  .......................................................  160 
4.1. Метод моментов проверки гипотез  .................................  160 
4.2. Неустойчивость параметрических  методов отбраковки 
            выбросов  ...........................................................................  166 
4.3. Проблема множественных проверок  статистических  
            гипотез  ...............................................................................  173 

Контрольные вопросы и задачи ............................................... 180 
Темы докладов, рефератов, исследовательских работ .......... 180 
Литература ................................................................................. 181 
Часть II. Конкретные статистические методы 
Глава 5. Статистические методы анализа числовых  
                 выборок ........................................................................ 183 
5.1. Оценивание основных характеристик распределения.... 183 
5.2. Методы проверки однородности  характеристик двух 
            независимых выборок ....................................................... 195 
5.3. Двухвыборочный критерий Вилкоксона ......................... 207 
5.4. Состоятельные критерии проверки однородности неза- 
            висимых выборок .............................................................. 221 
5.5. Методы проверки однородности связанных выборок ... 224 
5.6. Проверка гипотезы симметрии ......................................... 229 
5.7. Реальные и номинальные уровни значимости в задачах 
            проверки статистических гипотез .................................... 234 
Контрольные вопросы и задачи................................................ 241 
Темы докладов, рефератов, исследовательских работ .......... 244 
Литература ................................................................................. 244 
Глава 6. Многомерный статистический анализ ................... 246 
6.1. Коэффициенты корреляции .............................................. 246 
6.2. Восстановление линейной зависимости  между двумя 
            переменными ...................................................................... 250 
6.3. Основы линейного регрессионного анализа ................... 262 
6.4. Индексы и их применение ................................................ 283 
Контрольные вопросы и задачи ............................................... 291 
Темы докладов, рефератов,  исследовательских работ ......... 293 
Литература ................................................................................. 294 
Глава 7. Статистические методы анализа динамики ............ 295 
7.1. Методы анализа и прогнозирования временных рядов .... 295 
7.2. Системы эконометрических уравнений ........................... 298 
7.3. Оценивание периода и периодической составляющей .... 301 
Контрольные вопросы .............................................................. 315 
Темы докладов, рефератов,  исследовательских работ ......... 316 
Литература ................................................................................. 316 
Часть III. Вероятностно-статистическое  
моделирование 

Глава 8. Основы вероятностно-статистического модели- 
                 рования .......................................................................... 319 
8.1. Основные понятия теории вероятностно-статистичес- 
            кого моделирования .......................................................... 319 
8.2. Устойчивость статистических выводов  и принцип  
            уравнивания погрешностей .............................................. 328 

8.3. Демографические модели ................................................. 345 
8.4. Статистические модели движения товарных потоков ... 363 
8.5. Статистические методы в истории ................................... 402 
8.6. Вероятностно-статистическое моделирование в технике 
            на примере помех, создаваемых электровозом .............. 412 
Контрольные вопросы и задачи ............................................... 422 
Темы докладов, рефератов, исследовательских работ .......... 423 
Литература ................................................................................. 424 
Глава 9. Статистические модели динамики .......................... 426 
9.1. Метод компьютерно-статистического моделирования 
           результатов взаимовлияний  факторов ............................. 426 
9.2. Система моделей налогообложения ................................. 430 
9.3. Моделирование и анализ многомерных временных  
            рядов ................................................................................... 452 
9.4. Балансовые соотношения метода ЖОК ........................... 462 
Контрольные вопросы и задачи ............................................... 474 
Темы докладов, рефератов, исследовательских работ .......... 474 
Литература ................................................................................. 475 
Глава 10. Статистические модели управления качеством ... 477 
10.1. Основы статистического контроля  качества ................ 477 
10.2. Асимптотическая теория одноступенчатых планов ..... 487 
10.3. Практическое применение статистического контроля ... 491 
10.4. Статистические методы управления качеством про- 
              дукции ............................................................................... 506 
10.5. Обнаружение разладки с помощью контрольных  
              карт .................................................................................... 513 
Контрольные вопросы и задачи ............................................... 523 
Темы докладов, рефератов, исследовательских работ .......... 524 
Литература ................................................................................. 524 
Глава 11. Статистические модели в медицине ...................... 526 
11.1. Клинико-статистические исследования ......................... 526 
11.2. Применение статистических моделей и методов в на- 
              учных медицинских исследованиях .............................. 537 
11.3. Высокие статистические технологии в научных меди- 
              цинских исследованиях ................................................... 548 
Контрольные вопросы и задачи ............................................... 560 
Темы докладов, рефератов,  исследовательских работ ......... 561 
Литература ................................................................................. 561 
Глава 12. Статистические методы в социологии .................. 563 
12.1. Развитие статистического инструментария социо- 
             логов .................................................................................. 563 
12.2. Перспективы применения теории люсианов в социо- 
              логии .................................................................................. 565 
12.3. Асимптотика квантования  и выбор числа градаций 
              в социологических анкетах ............................................. 576 

12.4. Социометрическое исследование — инструмент ме- 
              неджера.............................................................................. 600 
12.5. Статистические методы в выборочных исследованиях   
             научных организаций ....................................................... 604 
12.6. Статистические методы изучения социально-психо- 
              логических характеристик способных к математике  
              школьников ...................................................................... 611 
Контрольные вопросы и задачи ............................................... 620 
Темы докладов, рефератов, исследовательских работ .......... 621 
Литература ................................................................................. 622 
 

Предисловие  

Статистические методы анализа данных активно при-
меняются в технических исследованиях, экономике, теории 
и практике управления (менеджменте), социологии, меди-
цине, геологии, истории и т. д. С результатами наблюдений 
(измерений, испытаний, опытов), а также с их анализом 
имеют дело специалисты всех отраслей практической дея-
тельности во многих областях теоретических исследований.  
Учебник позволяет овладеть современными статистиче-
скими методами на уровне, достаточном для использования 
этих методов в научной и практической деятельности. Он 
входит в серию книг по организационно-экономическому 
моделированию и высоким статистическим технологиям. В 
нем рассмотрены современные методы анализа данных, 
соответствующие последним научным достижениям отече-
ственной вероятностно-статистической школы. Издание 
подготовлено в рамках инновационной образовательной 
программы «Менеджмент высоких технологий» МГТУ 
им. Н.Э. Баумана. Следует отметить, что нет оснований 
противопоставлять субъективные экспертные данные объ-
ективным результатам измерений (наблюдений, испытаний, 
анализов, опытов), поскольку для их описания и анализа 
используют одни и те же вероятностно-статистические ме-
тоды и модели.  
Книга предназначена для студентов и аспирантов раз-
личных специальностей, прежде всего технических, управ-
ленческих и экономических («Менеджмент высоких техно-
логий», «Менеджмент организации»), слушателей институ-
тов повышения квалификации, структур послевузовского 
(в том числе второго) образования, в частности программ 
МВА (Master of Business Administration — мастер делового 
администрирования), преподавателей вузов, сотрудников 

научно-исследовательских организаций и подразделений. 
Учебник может быть полезен при изучении следующих дисци-
плин: «Организационно-экономическое моделирование», «Ста-
тистические методы», «Прикладная статистика», «Экономет-
рика», «Методы анализа данных», «Многомерный статистиче-
ский анализ», «Общая теория статистики», «Планирование 
эксперимента», «Биометрика», «Теория принятия решений», 
«Управленческие решения», «Экономико-математическое мо-
делирование», «Математические методы прогнозирования», 
«Прогнозирование и технико-экономическое планирование», 
«Хемометрия», «Математические методы в экономике», «Мар-
кетинговые исследования», «Математические методы оценки», 
«Математические методы в социологии», «Математические 
методы в геологии» и т. п. 

Введение 

Статистические методы анализа данных применяют во 
многих областях деятельности человека. Целесообразно 
выделить три вида научной и прикладной деятельности в 
области применения статистических методов анализа дан-
ных (по степени специфичности методов, сопряженной с 
погруженностью в конкретные проблемы):  
1) разработка и исследование методов общего назначе-
ния без учета специфики области применения; 
2) разработка и исследование статистических моделей 
реальных явлений и процессов в соответствии с потребно-
стями той или иной конкретной области применения; 
3) использование статистических методов и моделей 
для статистического анализа конкретных данных.  
По мере движения от первого вида к третьему область 
применения конкретного статистического метода сужается, 
при этом возрастает его роль для анализа определенной си-
туации. Если первому виду деятельности соответствуют 
научные результаты, значимость которых оценивается по 
общенаучным критериям, то для третьего вида деятельно-
сти основным является успешное решение конкретных за-
дач той или иной области применения (техники и техноло-
гии, экономики, социологии, медицины и др.). Второй вид 
деятельности занимает промежуточное положение. Это 
связано с тем, что, с одной стороны, теоретическое изуче-
ние свойств статистических методов и моделей, предназна-
ченных для определенной области применения, может быть 
весьма сложным и математизированным, а с другой — ре-
зультаты представляют интерес лишь для некоторой груп-
пы специалистов. Можно утверждать, что второй вид дея-
тельности нацелен на решение типовых задач конкретной 
области применения. 

Прикладная статистика. Статистические методы ана-
лиза данных, относящиеся к первому виду деятельности, 
обычно называют методами прикладной статистики. Таким 
образом, прикладная статистика — наука о том, как обра-
батывать данные произвольной природы, без учета специ-
фики конкретной области применения [1].  
Математические основы прикладной статистики и ста-
тистических методов анализа данных — теория вероятно-
стей и математическая статистика. Курс математической 
статистики состоит в основном из доказательств теорем, 
тогда как курс прикладной статистики представляет собой 
методологию анализа данных и алгоритмы расчетов, тео-
ремы приводятся только для обоснования этих алгоритмов, 
доказательства, как правило, опускаются. 
Прикладная статистика — одна из статистических наук, 
не относящаяся к математике, это методическая дисципли-
на, являющаяся центром, идейным ядром статистики. К 
прикладной статистике относятся задачи описания данных, 
оценивания и проверки гипотез. 
Описание вида данных и при необходимости механизма 
их порождения — начало любого статистического исследо-
вания. Для описания данных применяют детерминирован-
ные и вероятностно-статистические методы. С помощью де-
терминированных методов можно проанализировать только 
данные, находящиеся в распоряжении исследователя. На-
пример, получены таблицы, рассчитанные органами офици-
альной государственной статистики, на основе представлен-
ных предприятиями и организациями статистических отче-
тов. Применить имеющиеся результаты к более широкой 
(генеральной) совокупности, использовать их для прогнози-
рования и управления можно лишь на основе вероятностно-
статистического моделирования. В связи с этим в приклад-
ную статистику часто входят методы, опирающиеся на тео-
рию вероятностей.  
Нецелесообразно противопоставлять детерминирован-
ные и вероятностно-статистические методы. Их можно 

рассматривать как последовательные этапы статистиче-
ского анализа. На первом этапе необходимо проанализи-
ровать имеющиеся данные, представить их в удобном для 
восприятия виде с помощью таблиц и диаграмм. Второй 
этап — изучение статистических данных на основе тех 
или иных вероятностно-статистических моделей. Возмож-
ность более глубокого изучения реального явления или 
процесса обеспечивается разработкой адекватной матема-
тической модели. 
В простейшем случае статистические данные — это зна-
чения некоторого признака, свойственного изучаемым объ-
ектам. Значения признака могут быть количественными или 
качественными (представляют собой указание на категорию, 
к которой может принадлежать объект). При измерении по 
нескольким количественным или качественным признакам в 
качестве статистических данных об объекте получают век-
тор, который можно рассматривать как новый вид данных. В 
таком случае выборка состоит из набора векторов. Если 
часть координат вектора — числа, а часть — качественные 
(категоризованные) данные, то речь идет о векторе разно-
типных данных.  
Одним элементом выборки, т. е. одним измерением, 
может быть функция в целом (электрокардиограмма боль-
ного, амплитуда биений вала двигателя, временной ряд, 
описывающий динамику показателей хозяйственной дея-
тельности определенной фирмы) и другие математические 
объекты (бинарные отношения). Так, при опросах экспер-
тов часто используют упорядочения (ранжировки) объектов 
экспертизы — образцов продукции, инвестиционных проектов, 
вариантов управленческих решений. 
Итак, математическая природа элементов выборки в 
разных задачах прикладной статистики может быть различной. 
Однако можно выделить два класса статистических 
данных — числовые и нечисловые данные. Соответственно 
прикладную статистику подразделяют на числовую и нечисловую 
статистику.  

Числовые статистические данные — числа, векторы, 
функции. Их можно складывать, умножать на коэффициенты, 
поэтому в числовой статистике большое значение имеют 
разнообразные суммы. В качестве математического аппарата 
анализа сумм случайных элементов выборки используют 
классические законы больших чисел и центральные предельные 
теоремы. 
Нечисловые статистические данные — категоризован-
ные данные, векторы разнотипных признаков, бинарные отношения, 
множества, нечеткие множества и др. Их нельзя 
складывать и умножать на коэффициенты. Эти данные 
представляют собой элементы нечисловых математических 
пространств (множеств). Математический аппарат анализа 
нечисловых статистических данных основан на использовании 
расстояний между элементами (мер близости, показателей 
различия, псевдометрик) в таких пространствах. 
С помощью расстояний определяют эмпирические и теоретические 
средние величины, доказывают законы больших 
чисел, строят непараметрические оценки плотности распределения 
вероятностей, решают задачи диагностики и 
кластерного анализа и т. д. [2]. 
В прикладных исследованиях используют различные 
виды статистических данных, что связано, в частности, со 
способами их получения. Например, если испытания некоторых 
технических устройств продолжают до определенного 
момента времени, то получают так называемые цензу-
рированные данные, состоящие из набора чисел — продолжительности 
работы ряда устройств до отказа — и 
информации о том, что остальные устройства продолжали 
работать в момент окончания испытания. Цензурированные 
данные часто применяют при оценке и контроле надежности 
технических устройств. 
Основные области применения прикладной статистики 
в зависимости от вида статистических данных приведены 
далее (модели порождения цензурированных данных входят 
в состав каждой из рассматриваемых областей): 

Статистические данные 
Область применения  
прикладной статистики 

Числа 
Статистика (случайных) величин
Конечномерные векторы
Многомерный статистический анализ

Функции 
Статистика случайных процессов и
временных рядов
Объекты нечисловой природы 

Статистика 
нечисловых 
данных
(статистика объектов нечисловой
природы) 
 
Вероятностно-статистическое моделирование. При 
применении статистических методов в конкретных областях 
знаний и отраслях народного хозяйства получаем 
научно-практические дисциплины «Статистические методы 
в промышленности», «Статистические методы в медицине» 
и др. С этой точки зрения эконометрика представляет собой 
дисциплину «Статистические методы в экономике» [3]. Перечисленные 
дисциплины обычно основаны на вероятностно-
статистических моделях, сформированных в соответствии 
с особенностями области применения.  
Основная часть настоящей книги посвящена статистическим 
методам и вероятностно-статистическому моделированию 
в технико-экономических исследованиях (логистике, 
управлении качеством, электротехнике), в экономике 
и управлении (налогообложении, маркетинге), в демогра-
фии, истории, медицине и социологии.  
При выборе вероятностно-статистических моделей ав-
тор во многом исходил из имеющегося у него опыта реше-
ния конкретных прикладных задач, а также старался не по-
вторять уже известный в литературе материал. В связи с 
этим в издании не рассмотрены вопросы надежности и без-
опасности технических устройств и технологий, теории 
массового обслуживания, сложные системы эконометриче-
ских уравнений.  
Статистический анализ конкретных данных. Приме-
нение статистических методов и моделей для статистиче-

ского анализа конкретных данных тесно связано с пробле-
мами соответствующей области применения. Результаты 
третьего вида научной и прикладной деятельности нахо-
дятся на стыке дисциплин (являются междисциплинарны-
ми). Эти результаты можно рассматривать как примеры 
практического применения статистических методов, что и 
сделано в настоящем учебнике. Но не меньше оснований 
относить их к конкретной области применения.  
Примеры практического применения статистических 
методов включены во все главы книги. При выборе приме-
ров предпочтение отдавалось исследованиям, в которых 
автор принимал непосредственное участие. Однако описа-
ние примеров было адаптировано для использования в 
учебном процессе. Заказчики прикладных исследований 
получают отчеты, в которых проблемы соответствующих 
областей применения рассмотрены подробнее [4]. 
Высокие статистические технологии. Термин «высо-
кие технологии», популярный в современной научно-
технической литературе, используют для обозначения наи-
более передовых технологий, основанных на последних дос-
тижениях научно-технического прогресса [5]. Такие техно-
логии, существующие и в технологиях статистического ана-
лиза данных, подробно изучены в настоящем учебнике.  
Слово «высокие» означает, что статистическая техноло-
гия опирается на современные достижения статистической 
теории и практики. Другими словами, математическая ос-
нова технологии получена сравнительно недавно в рамках 
научной дисциплины; алгоритмы расчетов разработаны и 
обоснованы в соответствии с нею. 
Слово «статистические» подробно объясняется в дан-
ной работе. С точки зрения автора, статистические данные 
представляют собой результаты измерений (наблюдений, 
испытаний, анализов, опытов), а статистические техноло-
гии — технологии анализа статистических данных. 
Наконец, сравнительно редко используемый примени-
тельно к статистике термин «технологии». Статистический 
анализ данных включает в себя процедуры и алгоритмы, 

Доступ онлайн
1 100 ₽
В корзину