Математические методы и компьютерные технологии в науке и образовании
Покупка
Издательство:
НИЦ Логос
Автор:
Ефремкова Татьяна Ивановна
Год издания: 2020
Кол-во страниц: 300
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Магистратура
ISBN: 978-5-907258-65-5
Артикул: 779465.01.99
Доступ онлайн
В корзину
Приведены теоретические основы моделирования временных рядов и исследования данных методами кластерного анализа, изучаемые обучающимися экономических направлений уровня магистратуры в рамках дисциплины «Математические методы и компьютерные технологии в науке и образовании». Пособие содержит большое количество примеров, основанных на современном фактическом материале, контрольные вопросы, тесты и задания для самостоятельной работы. Рассмотрены технологии анализа данных с помощью программного пакета Statistica.
Содержание учебного пособия соответствует актуальным требованиям федерального государственного образовательного стандарта высшего образования.
Для студентов магистратуры, обучающихся по экономическим и управленческим направлениям подготовки.
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов.
Для полноценной работы с документом, пожалуйста, перейдите в
ридер.
/ / / / / / / / / / / / / / УЧЕБНОЕ ПОСОБИЕ Ставрополь 2020 МАТЕМАТИЧЕСКИЕ МЕТОДЫ И КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ В НАУКЕ И ОБРАЗОВАНИИ Т. И. Ефремкова
УДК 330.43:519.237.8:004.9 ББК 65.05 Е922 Автор: Ефремкова Татьяна Ивановна — кандидат экономических наук, доцент кафедры менеджмента и отраслевой экономики Сибирского государственного индустриального университета. Рецензенты: Гумеров Анвар Вазыхович, доктор экономических наук, заведующий кафедрой, профессор кафедры Экономики и менеджмента Лениногорского филиала ФГБОУ ВО «Казанский национальный исследовательский технический университет им. А. Н. Туполева — КАИ»; Черкесова Эльвира Юрьевна, доктор экономических наук, профессор, заведующая кафедрой «Экономика и менеджмент» Института сферы обслуживания и предпринимательства (филиал) ФГБОУ ВПО «Донской государственный технический университет». Е922 Ефремкова Т. И. Математические методы и компьютерные технологии в науке и образовании : учебное пособие / Т. И. Ефремкова. – Ставрополь: Логос, 2020. – 300 с. : ил. ISBN 978-5-907258-65-5 Приведены теоретические основы моделирования временных рядов и исследования данных методами кластерного анализа, изучаемые обучающимися экономических направлений уровня магистратуры в рамках дисциплины «Математические методы и компьютерные технологии в на уке и образовании». Пособие содержит большое количество примеров, основанных на современ ном фактическом материале, контрольные вопросы, тесты и задания для самостоятельной работы. Рассмотрены технологии анализа данных с помощью программного пакета Statistica. Содержание учебного пособия соответствует актуальным требованиям федерального госу дарственного образовательного стандарта высшего образования. Для студентов магистратуры, обучающихся по экономическим и управленческим направле ниям подготовки. УДК 330.43: 519.237.8: 004.9 ББК 65.05 ISBN 978-5-907258-65-5 © Ефремкова Т.И., 2020 © Издательство «Логос», 2020
Математические методы и компьютерные технологии в науке и образовании ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– 3 Содержание Введение ....................................................................................................................... 6 1. Модели временных рядов…………………………………….. .............................. 8 1.1. Временные ряды данных: основные понятия и характеристики ............. 8 1.2. Структура временного ряда ....................................................................... 10 1.2.1. Автокорреляция уровней временного ряда и выявление его структуры ............................................................................................. 10 1.2.2. Моделирование тенденции временного ряда ................................ 19 Контрольные вопросы ............................................................................... 21 Задания для самостоятельной работы ..................................................... 21 Тесты ........................................................................................................... 21 1.3. Аддитивная и мультипликативная модели временных рядов ................ 26 1.3.1. Общие положения ............................................................................ 26 1.3.2. Аддитивная модель временного ряда ........................................... 27 1.3.3. Мультипликативная модель временного ряда ............................... 36 Контрольные вопросы ............................................................................... 45 Задания для самостоятельной работы ..................................................... 45 Тесты ........................................................................................................... 46 1.4. Моделирование стационарных и нестационарных временных рядов ... 49 1.4.1. Стационарные стохастические процессы ...................................... 49 1.4.2. Процессы ARMA .............................................................................. 58 Контрольные вопросы ............................................................................... 76 Задания для самостоятельной работы ..................................................... 76 Тесты ........................................................................................................... 77 1.5 Компьютерные технологии моделирования временных рядов ............... 86 1.5.1. Построение аддитивной и мультипликативной моделей временного ряда с использованием программы Statistica ...................... 86 1.5.2. Построение моделей ARMA с использованием программы Statistica ..................................................................................................... 104 Контрольные вопросы ............................................................................. 140
Т. И. Ефремкова 4 –––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– Задания для самостоятельной работы ................................................... 140 2. Многомерные статистические методы. Кластерный анализ ........................... 141 2.1. Классификация многомерных статистических методов ....................... 141 Контрольные вопросы ............................................................................. 144 2.2. Понятие кластерного анализа .................................................................. 145 2.2.1. Общая постановка задачи классификации .................................. 145 2.2.2. Этапы кластерного анализа .......................................................... 146 2.2.3. Подходы к проблеме кластерного анализа .................................. 146 2.2.4. Типы переменных .......................................................................... 147 Контрольные вопросы ............................................................................. 153 Тесты ......................................................................................................... 153 2.3. Меры близости объектов .......................................................................... 157 2.3.1. Виды мер близости объектов ........................................................ 157 2.3.2. Коэффициенты подобия ................................................................ 157 2.3.3. Коэффициенты связи ..................................................................... 161 2.3.4. Показатели расстояния .................................................................. 164 Контрольные вопросы ............................................................................. 170 Тесты ......................................................................................................... 170 2.4. Меры близости кластеров ........................................................................ 173 Контрольные вопросы ............................................................................. 180 2.5. Процедуры классификации данных ........................................................ 181 2.5.1. Виды процедур классификации данных ...................................... 181 2.5.2. Иерархический кластерный анализ ............................................. 181 2.5.3. Метод k-средних ............................................................................ 184 Контрольные вопросы ............................................................................. 190 Задания для самостоятельной работы ................................................... 190 Тесты ......................................................................................................... 191 2.6. Критерии качества классификации ......................................................... 193 2.6.1. Критерии качества классификации при заданном числе классов ..193 2.6.2. Критерии качества классификации при неизвестном числе классов ...................................................................................................... 194
Математические методы и компьютерные технологии в науке и образовании ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– 5 Контрольные вопросы ............................................................................. 196 Тесты ......................................................................................................... 196 2.7. Компьютерные технологии классификации данных ............................. 198 Контрольные вопросы ............................................................................. 228 Задания для самостоятельной работы ................................................... 228 Список рекомендуемой литературы ....................................................................... 230 Приложение А. Исходные данные для построения аддитивной и мультипликативной моделей временных рядов ................................................. 232 Приложение Б. Исходные данные для построения моделей стационарных временных рядов ...................................................................................................... 234 Приложение В. Исходные данные для построения моделей нестационарных временных рядов ...................................................................................................... 239 Приложение Г. Исходные данные для построения аддитивной и мультипликативной моделей временных рядов по теме «Компьютерные технологии моделирования временных рядов» .................................................... 244 Приложение Д. Исходные данные для самостоятельной работы по теме «Модели временных рядов» ................................................................................... 245 Приложение Е. Исходные данные для самостоятельной работы по теме «Многомерные статистические методы. Кластерный анализ» ........................... 253 Приложение Ж. Исходные данные для проведения практического занятия по теме «Компьютерные технологии классификации данных» .......................... 257 Приложение И. Фрагмент матрицы расстояний классификации стран мира по демографическим и социальным признакам ................................................... 275 Приложение К. Результаты классификации стран мира по демографическим и социальным показателям: состав кластеров ...................................................... 282 Приложение Л. Статистическая характеристика классификации стран мира по демографическим и социальным показателям ................................................ 288 Приложение М. Социально-экономические показатели регионов России ........ 292
Т. И. Ефремкова 6 –––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– Введение Характерной особенностью развития общества на современном этапе явля ется усиление роли науки в области обоснования новых технологических и орга низационных решений. Наличие высокотехнологичного инструментария предо ставляет широкие возможности для применения математических методов различ ной природы и сложности. Особую актуальность приобретают методы, позволяю щие исследовать структуру и закономерности сложных социально-экономических процессов, характеризующихся многомерностью, динамичностью, воздействием множества случайных факторов. В настоящем учебном пособии рассмотрены основные теоретические поло жения по двум группам методов, служащим для обработки многомерных стати стических данных: методам моделирования временных рядов и методам кластер ного анализа. Теоретические положения проиллюстрированы примерами. Содержание учебного пособия соответствует требованиям федерального госу дарственного образовательного стандарта высшего образования, а также основным образовательным программам по экономическим и управленческим направлениям подготовки (уровень магистратуры) и раскрывает содержание учебной дисципли ны «Математические методы и компьютерные технологии в науке и образовании». Учебное пособие содержит положения, которые являются теоретической базой для выполнения обучающимися практических заданий и самостоятельной работы по дисциплине. Изложенный теоретический аппарат может быть исполь зован в целях моделирования и прогнозирования развития разнообразных соци ально-экономических процессов. Содержание каждой главы пособия дополняют контрольные вопросы, тесто вые задания, задания для выполнения самостоятельной работы. Задания построе ны на современном фактическом материале, что призвано способствовать форми рованию у обучающихся устойчивого интереса к анализу реальных социально экономических процессов. Так как эффективное применение статистических методов невозможно без ис пользования прикладных программных средств, то в данном пособии особенное
Математические методы и компьютерные технологии в науке и образовании ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– 7 внимание уделено компьютерным технологиям построения моделей временных рядов и проведения классификации данных средствами программы Statistica. В результате освоения данного учебного пособия студент должен: знать: — виды моделей временных рядов, процедуру их построения; — классификацию многомерных статистических методов; — этапы и методы классификации данных; уметь: — применять математические методы для выявления закономерностей про текания экономических процессов и прогнозирования тенденций изменения эко номических показателей моделируемой системы; — выбирать оптимальные модели прогнозирования значений показателей; — анализировать результаты экономико-математического моделирования, давать их экономическую интерпретацию; — адаптировать классические экономические, финансовые и организацион но-управленческие модели к решению конкретных задач управления. владеть: — терминологией экономико-математического моделирования; — методами сбора и первичной обработки данных; — навыками применения MS Excel и специальных прикладных программ для количественного анализа информации; — навыками наглядного отображения результатов исследования.
Т. И. Ефремкова 8 –––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– 1. Модели временных рядов 1.1. Временные ряды данных: основные понятия и характеристики Модели временных рядов — это вид эконометрических моделей, постро енных на основании данных, характеризующих объект за ряд последовательных моментов (периодов) времени. Временной ряд — это совокупность значений какого-либо показателя за не сколько последовательных моментов (периодов) времени [16]. Каждый уровень (значение) временного ряда формируется под воздействием большого количества факторов, которые в зависимости от характера проявления можно подразделить на три группы: 1) факторы, формирующие тенденцию ряда; 2) факторы, формирующие циклические колебания; 3) случайные факторы. При различных сочетаниях этих факторов зависимость уровней ряда от вре мени может принимать разные формы. Большинство временных рядов экономических показателей имеют тенден цию, характеризующую совокупное долговременное воздействие множества факторов на динамику показателя. Эти факторы, взятые по отдельности, могут оказывать разнонаправленное воздействие на исследуемый показатель. Однако в совокупности они формируют его возрастающую или убывающую тенденцию. На рисунке 1.1 показаны временные ряды, содержащие возрастающую и убываю щую тенденцию (тренд). Таким образом, тенденция — это устойчивое медленное изменение значений показателя во времени. Кроме устойчивого изменения значений во времени, изучаемый показатель может быть подвержен циклическим колебаниям. Эти колебания могут носить сезонный характер, так как экономическая деятельность ряда отраслей и регионов зависит от времени года (например, цены на сельскохозяйственную продукцию, рас ход электроэнергии на бытовые нужды, уровень безработицы в курортных городах
Математические методы и компьютерные технологии в науке и образовании ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– 9 в зимний период выше, чем в летний, и, наоборот, уровень спроса на прохлади тельные напитки выше в летний период, чем в зимний). На рисунке 1.2 представ лен условный временной ряд, содержащий только сезонную компоненту. Рисунок 1.1 – Временные ряды, содержащие тренд Рисунок 1.2 – Временные ряды, содержащие сезонную и случайную компоненты Рисунок 1.1 – Временные ряды, содержащие тренд Рисунок 1.2 – Временные ряды, содержащие сезонную и случайную компоненты 60 61 62 63 64 65 66 67 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Значение показателя Момент времени - убывающий тренд; - возрастающий тренд 4 Рисунок 1.1 – Временные ряды, содержащие тренд Рисунок 1.2 – Временные ряды, содержащие сезонную и случайную компоненты 60 61 62 63 64 65 66 67 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Значение показателя Момент времени - убывающий тренд; - возрастающий тренд 0 50 100 150 200 250 300 350 400 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Значение показателя Период времени - сезонное колебание; - случайное колебание
Т. И. Ефремкова 10 ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– Некоторые временные ряды не содержат тенденции и циклической компоненты, а каждый следующий их уровень образуется как сумма среднего уровня ряда и не которого значения (положительного или отрицательного) случайной компоненты. Пример ряда, содержащего только случайную компоненту, приведен на рисунке 1.2. Реальные данные не соответствуют полностью ни одной из описанных выше моделей. Как правило, они содержат все три компоненты. Каждый их уровень форми руется под воздействием тенденции, сезонных колебаний и случайной компоненты. В большинстве случаев фактический уровень временного ряда можно пред ставить как сумму или произведение трендовой, циклической и случайной ком понент. Модель, в которой временной ряд представлен как сумма перечисленных компонент, называется аддитивной моделью временного ряда и имеет следую щий общий вид: = + + . Модель, в которой временной ряд представлен как произведение перечислен ных компонент, называется мультипликативной моделью временного ряда. = ∙ ∙ . Основная задача эконометрического исследования отдельного временного ряда — выявление и оценка количественного значения каждой из перечисленных выше компонент в целях использования полученной информации для прогнози рования будущих значений ряда или при построении моделей взаимосвязи двух и более временных рядов. 1.2. Структура временного ряда 1.2.1. Автокорреляция уровней временного ряда и выявление его структуры При наличии тенденции и циклических колебаний значения каждого по следующего уровня ряда зависят от предыдущих значений. Корреляционную зависимость между последовательными уровнями временного ряда называют
Математические методы и компьютерные технологии в науке и образовании –––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– 11 автокорреляцией уровней ряда. Количественно эту зависимость можно изме рить с помощью коэффициента корреляции между уровнями исходного времен ного ряда и уровнями этого ряда, смещенными на несколько шагов во времени. Напомним, что парный коэффициент корреляции может быть определен по формуле: (1.1) Тогда коэффициент автокорреляции уровней ряда первого порядка перемен ной Y, характеризующий степень линейной зависимости между последовательны ми уровнями временного ряда и, смещенными относительно друг друга на один временной период (момент) (называемый лагом), определится по формуле: (1.2) где , — средние значения уровней ряда, рассчитанные по последо вательностям уровней, начиная, соответственно, со второго и до n-го и с первого и до (n-1)-го. (1.3) (1.4) Аналогично можно определить коэффициенты автокорреляции второго и бо лее высоких порядков. Так, коэффициент автокорреляции второго порядка, ха рактеризующий степень линейной зависимости между уровнями временного ряда и , определится по формуле:
Т. И. Ефремкова 12 ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– (1.5) (1.6) (1.7) По мере увеличения лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Считается, что для обеспечения ста тистической достоверности коэффициентов автокорреляции максимальный лаг должен быть не больше n / 4 [16]. Коэффициент автокорреляции имеет два важных свойства. Во-первых, так как он рассчитывается по аналогии с линейным коэффициентом корреляции, то характеризует тесноту только линейной связи текущего и предыдущего уров ней ряда. Следовательно, по значению коэффициента автокорреляции можно су дить о наличии линейной (или близкой к линейной) тенденции. Для некоторых временных рядов, имеющих сильную нелинейную тенденцию (например, пара болическую или экспоненциальную), коэффициент автокорреляции уровней ис ходного ряда может приближаться к нулю. Во-вторых, по знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство вре менных рядов экономических данных содержит положительную автокорреляцию уровней, однако при этом они могут иметь убывающую тенденцию. Последовательность коэффициентов автокорреляции уровней первого, второ го и т. д. порядков называют автокорреляционной функцией временного ряда. График зависимости значений автокорреляционной функции временного ряда от ве личины лага (порядка коэффициента автокорреляции) называют коррелограммой. Если наиболее высоким оказался коэффициент автокорреляции первого по рядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким является коэффициент автокорреляции порядка τ, то ряд содержит циклические колебания с периодичностью в τ моментов времени. Если ни один из коэффи циентов автокорреляции не является значимым, то либо этот ряд не содержит
Математические методы и компьютерные технологии в науке и образовании –––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– 13 ни тенденции, ни циклических колебаний и имеет структуру, сходную со структу рой ряда, представленного на рисунке 1.2, либо ряд содержит сильную нелиней ную тенденцию, для выявления которой необходимо провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компоненты T и циклической (сезонной) компоненты S. Пример 1.1. По данным о потреблении электроэнергии на бытовые нужды, рассчитанным на основании приложения А и представленным в таблице 1.1, определить коэффи циенты автокорреляции первого и второго порядков. Сделать выводы о структуре временного ряда энергопотребления. Таблица 1.1 Потребление электроэнергии жителями региона Номер квартала, t Потребление электроэнергии жителями региона на бытовые нужды, млн кВт×ч, 𝑦𝑡 𝑦𝑡−1, млн кВт×ч 𝑦𝑡−2, млн кВт×ч 𝑦𝑡−3, млн кВт×ч 𝑦𝑡−4, млн кВт×ч 1 347,72 2 262,79 347,72 3 243,24 262,79 347,72 4 328,11 243,24 262,79 347,725 5 332,88 328,11 243,24 262,793 347,72 6 252,27 332,88 328,11 243,237 262,79 7 241,18 252,27 332,88 328,112 243,24 8 307,36 241,18 252,27 332,879 328,11 9 324,45 307,36 241,18 252,275 332,88 10 252,13 324,45 307,36 241,176 252,27 11 244,05 252,13 324,45 307,359 241,18 12 316,18 244,05 252,13 324,446 307,36
Доступ онлайн
В корзину