Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Информационные технологии статистического анализа данных

Покупка
Артикул: 787443.01.99
Доступ онлайн
500 ₽
В корзину
Рассмотрены теоретические основы и пошаговые алгоритмы проведения анализа данных в статистических системах. Каждая тема наряду с теоретическим материалом содержит подробные методические рекомендации по выполнению лабораторной работы. Предназначено для студентов, обучающихся по направлениям «Экономика», «Статистика». Подготовлено на кафедре бизнес-статистики и математических методов в экономике.
Александровская, Ю. П. Информационные технологии статистического анализа данных : учебно-методическое пособие / Ю. П. Александровская. - Казань : КНИТУ, 2019. - 152 с. - ISBN 978-5-7882-2636-1. - Текст : электронный. - URL: https://znanium.com/catalog/product/1895933 (дата обращения: 19.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Министерство науки и высшего образования Российской Федерации 

Федеральное государственное бюджетное 

образовательное учреждение высшего образования 

«Казанский национальный исследовательский 

технологический университет» 

 
 
 
 
 
 
 

Ю. П. Александровская 

 
 
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ 

СТАТИСТИЧЕСКОГО АНАЛИЗА 

ДАННЫХ 

 

Учебно-методическое пособие 

 
 
 
 

 

 
 
 
 
 

 

 

Казань 

Издательство КНИТУ 

2019 

УДК 311:004 (075) 
ББК 60.6с51я7 

А46

 

Печатается по решению редакционно-издательского совета 

Казанского национального исследовательского технологического университета 

 

Рецензенты: 

канд. эконом. наук, доц. С. С. Кудрявцева 

д-р пед. наук, доц. Ю. В. Торкунова 

 
 

 
 
 
 
А46 

Александровская Ю. П. 
Информационные технологии статистического анализа дан-
ных : учебно-методическое пособие / Ю. П. Александровская; 
Минобрнауки России, Казан. нац. исслед. технол. ун-т. – Ка-
зань : Изд-во КНИТУ, 2019. – 152 с. 
 
ISBN 978-5-7882-2636-1

 
Рассмотрены теоретические основы и пошаговые алгоритмы проведе-

ния анализа данных в статистических системах. Каждая тема наряду с тео-
ретическим материалом содержит подробные методические рекомендации 
по выполнению лабораторной работы. 

Предназначено для студентов, обучающихся по направлениям «Эконо-

мика», «Статистика». 

Подготовлено на кафедре бизнес-статистики и математических методов 

в экономике. 

 

 
 
 

ISBN 978-5-7882-2636-1
© Александровская Ю. П., 2019
© Казанский национальный исследовательский 

технологический университет, 2019

УДК 311:004 (075) 
ББК 60.6с51я7

ВВЕДЕНИЕ 

В современном мире принятие управленческих, производ-

ственных, финансовых, кадровых и других решений все чаще ос-
новывается на всестороннем анализе данных, что позволяет делать 
обоснованные выводы и прогнозы, давать оценки вероятности их 
выполнения и зачастую предотвращать принятие необоснованных 
и непродуманных решений. 

Владение основами статистических методов анализа данных 

необходимо не только специалистам, работающим в естественно-
научных и инженерных областях, но также представителям гума-
нитарных профессий: экономистам, менеджерам, социологам, пси-
хологам. Современные организации стремятся полнее использо-
вать статистические данные для решения своих задач. Навыки об-
работки и анализа данных в настоящее время является частью профессиональной 
культуры многих специалистов. 

Возможность использования компьютеров и современных 

информационных технологий анализа данных сделала доступными 
для пользователей широкий набор самых современных методов 
статистического анализа.  

Высокая потребность в средствах статистического анализа 

данных в различных областях деятельности обусловила развитие 
рынка компьютерных программ для статистической обработки 
данных. В настоящее время на рынке представлено около тысячи 
статистических пакетов, разнообразие которых определено многоплановостью 
задач обработки данных с применением различных 
типов статистических процедур анализа для поиска ответов на вопросы 
из различных областей деятельности человека. 

В пособии рассмотрен инструментарий анализа данных в средах 
универсальных статистических систем IBM SPSS STATISTICS 
и STATISTICA. Выбор систем обусловили: 

• степень входящей подготовки студентов; 
• требования ФГОС ВО 3++ к формированию компетенций 

бакалавров; 

• ориентированность потенциальных работодателей на работу 
с пакетом (широта распространения пакета); 

• унифицированность программного интерфейса пакета. 

ОБЗОР СИСТЕМ СТАТИСТИЧЕСКОГО 

АНАЛИЗА ДАННЫХ  

Статистические системы по своим функциональным возмож-

ностям могут быть разделены на три основные группы: универсаль-
ные, или системы общего назначения, профессиональные и специ-
ализированные системы. 

Универсальные системы  

(системы общего назначения) 

Наиболее 
известными 
из 
них 
являются 
IBM 
SPSS 

STATISTICS, STATISTICA, S-PLUS, STADIA, STATGRAPHICS 
PLUS, SYSTAT, MINITAB. 

Эти пакеты не ориентированы на специфическую область де-

ятельности и могут решать задачи разных предметных областей, та-
ких, например как финансово-экономическая сфера (анализ рисков, 
прогнозирование финансовых и экономических показателей, 
микро- и макроэкономическое моделирование, анализ операций по 
вкладам, страхование); государственное управление (Проведение 
социально-экономических мониторингов и обследований, оценка 
эффективности работы государственных институтов, анализ обра-
щений граждан, разработка отчетов); торговля (сравнительный ана-
лиз поставщиков, прогнозирование потребления и оптимизация за-
пасов, ценообразование); маркетинг (ранжирование товаров, сег-
ментация рынка, анализ спроса); производство (анализ качества 
продукции, прогнозирование потребления ресурсов, оптимизацион-
ные эксперименты); социология (анализ результатов опросов, ана-
лиз качества услуг информационных провайдеров в Интернет); об-
разование (обучение методам статистического анализа данных) и др.  

Как правило, они предлагают широкий диапазон статистиче-

ских методов и имеют относительно простой интерфейс. С такими 
пакетами рекомендуется работать начинающим пользователям, 

владеющим лишь базовыми знаниями в области статистики, 
а также опытным пользователям на начальных этапах работы с 
данными, когда еще четко не определены статистические методы, 
которые будут применяться для решения того или иного вопроса. 
Многопрофильность универсального пакета позволяет провести 
пробный анализ различных типов данных с использованием широ-
кого диапазона статистических методов. Большинство существую-
щих универсальных пакетов имеют много пересечений по составу 
встроенных статистических процедур. 

Для того чтобы статистический пакет считался универсаль-

ным, он должен удовлетворять ряду требований: 

• содержать достаточно широкий набор стандартных стати-

стических методов; 

• быть достаточно простым для быстрого освоения и ис-

пользования непрофессиональным пользователем; 

• работать с достаточно большими базами данных и отве-

чать высоким требованиям к вводу, преобразованию и ор-
ганизации хранения данных; 

• осуществлять обмен данными с широко распространен-

ными пакетами и базами данных; 

• иметь обширный набор средств графического представле-

ния данных и результатов их анализа; 

• иметь подробное документационное сопровождение и 

справочную систему, позволяющую начинающему поль-
зователю с легкостью находить ответы на вопросы, связан-
ные с работой программы и возможностями применения 
средств анализа данных. 

Большинство представленных на рынке статистических паке-

тов обладают гибкой модульной структурой, которая может рас-
ширяться за счет пользовательских модулей, дополнительно заку-
паемых или находящихся в свободном доступе в Интернете. По-
добная гибкость позволяет адаптировать большинство пакетов 
к потребностям конкретного пользователя. 

По мнению профессионалов, статистический пакет должен 

удовлетворять следующему минимальному набору требований: 

• модульность; 

• ассистирование при выборе способа обработки данных; 
• использование простого проблемно-ориентированного 

языка для формулировки задания пользователя; 

• автоматическая организация процесса обработки данных; 
• ведение банка данных пользователя и составление отчета 

о результатах проделанного анализа; 

• диалоговый режим работы пользователя с пакетом; 
• совместимость с другим программным обеспечением. 
IBM SPSS Statistics. В настоящее время одним из лидеров 

среди универсальных статистических пакетов является IBM SPSS 
Statistics (Statistical Package for the Social Science). IBM SPSS Statis-
tics – это полнофункциональная статистическая система, предна-
значенная для решения исследовательских и бизнес-задач при по-
мощи анализа данных. Первая версия пакета была выпущена в 
1968 г. компанией SPSS Inc. В 2009 г. компания IBM поглотила 
SPSS Inc. В России существует представительство компании SPSS, 
которое распространяет русифицированную версию пакета. 
На русском языке создан электронный учебник по применению па-
кета, издано множество работ по обучению работе. 

Интуитивно понятный интерфейс IBM SPSS Statistics вклю-

чает в себя все функции управления данными, статистические про-
цедуры и средства создания отчетов для проведения анализа любой 
степени сложности. 

SРSS является модульной программой. Ее основу составляет 

базовый модуль (SPSS Base), позволяющий осуществлять управле-
ние данными и содержащий наиболее распространенные методы 
статистического анализа данных: проведение описательной ста-
тистики; построение линейных и нелинейных моделей; осуществ-
ление преобразования данных; проведение факторного, кластер-
ного, дисперсионного анализов; вычисление корреляций; построе-
ние графиков; подготовка отчетов; визуализация данных и ре-
зультатов анализа и пр. Около 80% пользователей в разных отрас-
лях находят в составе базового модуля весь необходимый стати-
стический функционал. 

Для проведения расширенного и углубленного анализа дан-

ных могут быть установлены дополнительные модули пакета. 

Для пакета IBM SPSS Statistics 21 разработаны 16 различных моду-
лей. К достоинствам SPSS можно отнести: 

развитый аппарат статистического анализа; 
• универсальность (может быть использован для решения 

широкого круга вопросов из различных предметных обла-
стей, требующих проведения статистического анализа 
данных); 

• широкий набор статистических и графических процедур 

(более 50 типов диаграмм) анализа данных, а также проце-
дур создания отчетов; 

• удобная загрузка данных различных форматов (в том 

числе, созданных в Excel); 

• высокая скорость вычислений, простой и удобный интер-

фейс; 

• детальная контекстно-ориентированная справочная си-

стема, позволяющая неопытному пользователю с большей 
легкостью ориентироваться в программе; 

• возможность свободного скачивания демонстрационной 

версии продукта на официальном сайте компании, нали-
чие версий продукта на различных языках; 

• совместимость с операционными системами Windows, 

Mac, Linux; 

• наличие значительного количества литературы по работе 

с пакетом. 

Недостатками SPSS являются: 
• высокие требования к системе компьютера (требуется 

1 GB оперативной памяти, 800 MB памяти на жестком 
диске и процессор с частотой 1 GHz и выше); 

• высокая цена по сравнению со статистическими пакетами 

аналогичного уровня (стоимость покупки для индивиду-
ального пользования сроком на год составляет около 
1000 долл.). 

STATISTICA. Среди универсальных систем статистического 

анализа данных широкое распространение получил также пакет 
STATISTICA. На российском рынке он пользуется популярностью 
благодаря высокой активности фирмы-разработчика Statsoft и 

дилера в России – Softline, способствующих популяризации пакета. 
На сайте российского представительства фирмы-разработчика па-
кета (www.statsoft.ru) размещен электронный учебник по статистике, 
а также доступная студенческая версия программы. STATISTICA от-
носится к числу базовых пакетов вузов России. Первая версия пакета 
(STATISTICA for DOS) была выпущена в 1991 г. На сегодняшний 
день разработана 9-я версия пакета (STATISTICA 9). Русифициро-
вана только 6-я версия (STATISTICA 6).  

Пакет STATISTICA по своим средствам и возможностям гра-

фического отображения информации конкурирует с универсаль-
ным математическим пакетом MATHEMATICA. 

Стандартную комплектацию пакета STATISTICA составляют 

три модуля, которые могут приобретаться как единым пакетом, так 
и отдельно. 

1. Базовый пакет STATISTICA Base предоставляет обширные 

возможности выбора основных типов статистического анализа. 
Для эффективной работы базового пакета требуется как минимум 
256 MB оперативной памяти. Минимальные требования к скорости 
процессора – 500 MHz. 

2. Модуль Линейные и Нелинейные Модели (Advanced 

Linear/NonLinearModels) содержит большой набор инструментов 
для моделирования и прогнозирования, включая возможности ав-
томатического выбора модели и расширенные интерактивные 
средства визуализации. 

3. Модуль Многомерные разведочные технологии анализа 

(Multivariate Exploratory Techniques) служит для применения раз-
ведочного анализа различных типов данных в сочетании с интер-
активными средствами визуализации. 

Помимо общих статистических и графических средств в си-

стеме имеются специализированные модули, например, для прове-
дения социологических или биомедицинских исследований, реше-
ния технических и промышленных задач, – карты контроля каче-
ства, модули анализа процессов и планирования эксперимента. 

Пакет предоставляет пользователям следующие возможности 

статистического анализа данных: 

• исследование корреляций между переменными; 
• диаграмма рассеяния, матричная диаграмма рассеяния; 

• быстрые основные статистики и блоковые статистики (ин-

терактивные средства, позволяющие одним щелчком 
мыши вычислять основные статистики и строить графики 
в любой момент в течение сеанса работы); 

• интерактивный калькулятор вероятностных распределе-

ний (позволяет интерактивно исследовать структуру рас-
пределений, например, зависимость вероятности от пара-
метров); 

• анализ многомерных откликов, многомерное шкалирова-

ние; 

• анализ при помощи временных рядов и прогнозирование 

временных зависимостей, в том числе анализ сезонных ко-
лебаний. 

Достоинства системы STATISTICA: 
• реализован обмен данными между STATISTICA и 

Windows-приложениями; 

• результаты анализа в виде графиков, таблиц и текста могут 

быть сохранены в файле с форматом RTF, который откры-
вается и редактируется в MS Word; 

• возможность расширения системы при помощи создания 

программ на встроенном в STATISTICA языке программи-
рования; 

• исходные данные из MS Excel можно легко импортировать 

в STATISTICA; 

• возможность записи макросов для автоматизации выпол-

нения однотипных задач; 

• программа способна обрабатывать большие массивы дан-

ных – базы данных с числом переменных до 32 000 и прак-
тически неограниченным числом наблюдений. 

В пакете представлены несколько сотен типов графиков 2D, 

3D и 4D, матрицы и пиктограммы; предоставляется возможность 
разработки собственного дизайна графика. Средства управления 
графиками позволяют работать одновременно с несколькими гра-
фиками, изменять размеры сложных объектов, добавлять художе-
ственную перспективу и ряд специальных эффектов, разбивку 

страниц и быструю перерисовку. Например, 3D-графики можно 
вращать, накладывать друг на друга, сжимать или увеличивать. 

STATISTICA обладает огромными возможностями для по-

строения графиков непосредственно из таблиц исходных данных и 
таблиц результатов. Построение графических объектов и анализ 
данных в пакете тесно интегрированы. После получения результа-
тов статистического анализа их можно с легкостью представить 
графически посредством команды Быстрые статистические гра-
фики. В разных модулях системы имеются свои специальные гра-
фики, учитывающие особенности получаемых в них результатов. 

Начинающие пользователи могут начать работу со специальной 
версии, разработанной для обучения основам статистических 
методов – Studеnt Еditiоn оf STATISTICA. Эта версия представляет 
собой урезанный вариант пакета и позволяет анализировать файлы 
данных, включающих не более 400 наблюдений. 

STATGRAPHICS PLUS. К числу достаточно мощных универсальных 
пакетов относится также STATGRAPHICS PLUS. Пакет 
STATGRAPHICS (STATistical GRAPHICs System) – универсальный 
статистический пакет компании Manugistics Inc. Первая версия 
пакета была выпущена в середине 80-х годов. На сегодняшний 
день разработана 5-я версия пакета Statgraphics Plus 5.1. 

Достоинства STATGRAPHICS: 
• сочетание научных методов обработки разнотипных данных 
с возможностью создания современной высококачественной 
интерактивной графики; 

• широкие возможности взаимодействия с другими программными 
продуктами (электронными таблицами, базами 
данных); 

• высококачественная двумерная и трехмерная графика, 
• интегрированная графика, предполагающая, что все элементы 
графических представлений результатов анализа 
могут быть преобразованы. После завершения процедуры 
статистического анализа данных можно выбрать графические 
отображения результатов, релевантные используемой 
процедуре анализа. 

Доступ онлайн
500 ₽
В корзину