Математическое моделирование в экономике и менеджменте на языке R
Покупка
Тематика:
Математическое моделирование
Издательство:
Научный консультант
Год издания: 2016
Кол-во страниц: 59
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Магистратура
ISBN: 978-5-9909261-2-7
Артикул: 709979.01.99
Доступ онлайн
В корзину
В учебном пособии рассматриваются возможности применения языка R при изучении математического моделирования и количественных методов исследования в экономике и менеджменте. Издание предназначено для магистрантов, обучающихся по направлениям 38.04.01 «Экономика», 38.04.02 «Менеджмент».
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов.
Для полноценной работы с документом, пожалуйста, перейдите в
ридер.
Федеральное государственное образовательное бюджетное учреждение высшего образования «Финансовый университет при Правительстве Российской Федерации» (Владимирский филиал Финуниверситета) Математическое моделирование в экономике и менеджменте на языке R Учебное пособие Москва 2016
УДК 330 ББК 65в6 Х93 Рецензенты: Шаркова А.В. д.э.н., профессор, ФГОБУ ВО «Финансовый университет при Правительстве Российской Федерации» Хорошева Е.Р. д.т.н, профессор, ФГБОУ ВО «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых» Хрипунова Балджы А.С., Хрипунова М.Б., Шмелева Л.А. Владимирский филиал ФГОБУВО «Финансовый университет при Правительстве Российской Федерации». Х93 Математическое моделирование в экономике и менеджменте на языке R. Учебное пособие / Хрипунова Балджы А.С., Хрипунова М.Б., Шмелева Л.А. / – М.: Издательство «Научный консультант», 2016 – 59 с. ISBN: 978-5-9909261-2-7 В учебном пособии рассматриваются возможности применения языка R при изучении математического моделирования и количественных методов исследования в экономике и менеджменте. Издание предназначено для магистрантов, обучающихся по направлениям 38.04.01 «Экономика», 38.04.02 «Менеджмент». УДК 330 ББК 65в6 ISBN: 978-5-9909261-2-7 © Хрипунова Балджы А.С., Хрипунова М.Б., Шмелева Л.А., 2016 © Оформление. Издательство «Научный консультант, 2016
СОДЕРЖАНИЕ Введение .............................................................................................. 4 Тема 1. Построение модели парной линейной регрессии ............... 5 1.1 Основные понятия и определения ............................................... 5 1.2 Решение типовых задач в среде RStudio ..................................... 8 1.3 Контрольные вопросы и задания ............................................... 20 Тема 2. Многомерная линейная регрессия ..................................... 21 2.1 Основные понятия и определения ............................................. 21 2.2 Решение типовых задач в среде RStudio ................................... 25 2.3 Контрольные вопросы и задания ............................................ 38 Тема 3. Анализ временных рядов ................................................... 41 3.1Основные понятия и определения .............................................. 41 3.2 Решение типовых задач в среде RStudio ................................... 47 3.3 Контрольные вопросы и задания ............................................... 57 Библиографический список .......................................................... 58
Введение Освоение современных методов анализа количественных статистических данных является необходимым условием достижения целей, стоящих перед современным менеджером. Для решения классических эконометрических задач могут быть использованы различные современные средства обработки данных – специальные статические программы и пакеты. Язык R — это высокоуровневый язык программирования, ориентированный на статистику. В последнее время он составляет существенную конкуренцию таким классическим средствам как SAS Analytics, StatSoft STATISTICA, Minitab. Многие профессиональные статистики и методисты в правительственных организациях, крупных коммерческих компаниях, финансовой и банковской сфере используют инструменты языка R для решения задач математического моделирования и количественных исследований в экономике и менеджменте. Особенностью настоящего пособия является то, что помимо классических теоретических фактов из курса эконометрики, оно содержит ряд практических примеров использования языка R для построения математических моделей. Каждая тема содержит краткую теоретическую справку, примеры решения типовых задач, задачи для самостоятельного решения и контрольные вопросы. Учебное пособие содержит материалы по дисциплинам «Математическое моделирование и количественные методы исследований в менеджменте» и «Эконометрические исследования», а также может быть использовано студентами и аспирантами, обучающимися по экономическим направлениям.
Тема 1. Построение модели парной линейной регрессии 1.1 Основные понятия и определения Модель регрессии – это уравнение, связывающее одну переменную (зависимая переменная) с другими независимыми переменными (регрессорами), через которые она определяется. Если в модели присутствует только один регрессор, то такая модель называется моделью парной регрессии.1 Выполнение точного соотношения между какими-либо экономическими показателями достигается крайне редко, только в тех случаях, когда она задано по определению. В статистическом анализе принято включать в модель случайный (остаточный) член, который описывает неточность модели: , где — значение зависимой переменной в наблюдении i; – неслучайная составляющая, , – константы, называемые параметрами уравнения, – значение регрессора в наблюдении ; -- случайный член. Причины возникновения случайного члена могут быть различны: не включение объясняющих переменных, агрегирование переменных, неправильная оценка структуры модели, неправильная функциональная спецификация, ошибки измерения. Задача регрессионного анализа состоит в получении оценок , . Пусть имеется 4 наблюдения , , , , они представлены точками на рис.1. Построена прямая, наилучшим образом приближающая эти четыре точки. Оценка коэффициента – это величина , которую прямая отсекает от оси , оценка коэффициента – это величина – тангенс угла наклона к оси . Оцениваемая модель – это прямая , где знак означает, что это оцененное значение в зависимости от . 1 Кремер, Н. Ш. Эконометрика: учебник / Б. А. Путко, Н. Ш. Кремер .— 3-е изд., перераб. и доп. — М. : ЮНИТИ-ДАНА, 2012 .— 329 с. — (Золотой фонд российских учебников) .— Под ред. Н.Ш. Кремера
Рисунок 1 Остаток наблюдения – это разность между действительной величиной и расчетным значение по уравнению регрессии : . Пусть имеется наблюдений. В эконометрике используется метод минимизации остатков – метод наименьших квадратов, состоящий в подборе значений и таким образом, чтобы эти сумма квадратов остатков была минимальной → МНК дает несмещенные и эффективные оценки коэффициентов и , если дополнительно выполнен ряд условий. Сумма квадратов остатков принимает минимальное значение при следующих значениях коэффициентов регрессии ∑ ∑ , , где , – средние значения величин , . Экономический смысл уравнения регрессии: увеличение на одну единицу измерения приведет к увеличению на единиц измерения. Свободный коэффициент определяет прогнозное значение , если 0. Как правило, это не имеет экономического смысла. Имеет место разложение , где ∑ – общая сумма квадратов; ∑ – объясненная сумма квадратов; – необъясненная сумма квадратов.
Коэффициент детерминации - это часть общей суммы квадратов, объясненной уравнением регрессии: . 0 1 – это число, которое служит мерой качества оценивания. Если значение близко к нулю, это значит, что что в выборке отсутствует связь между переменными и . При прочих равных предпочтительно, чтобы был как можно больше, максимальное значение 1 , это соответствует идеальному уравнению. F-критерий Фишера служит для оценивания качества уравнения регрессии. Этот тест состоит в проверке гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического факт и критического кр значений -критерия Фишера. факт ∑ /∑ /1, где – число единиц совокупности,-- число параметров для переменных при . кр – это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости . Уровень значимости – это вероятность отвергнуть правильную гипотезу при условии, что она верна. Если кр факт, то Н– гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если кр факт , то гипотеза не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии. Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывают - критерий Стьюдента и доверительные интервалы для каждого из показателей. Выдвигается гипотеза о случайной природе показателей. Сопоставляется величина случайной ошибки и величина коэффициентов:
, . Сравнивается фактическое и критическое значения статистики и принимается или отвергается гипотеза . Для расчета доверительного интервала определяется предельная ошибка для каждого показателя Δкр, Δ кр. Формулы для расчета доверительных интервалов Δ, Δ. Если в границы доверительного интервала попадает ноль, то есть нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, так как он не может принимать и положительное и отрицательное значение одновременно. 1.2 Решение типовых задач в среде RStudio Установка R и RStudio, загрузка пакетов Язык R широко используется как статистическое программное обеспечение для анализа данных и фактически стал стандартом для статистических программ. RStudio — свободная среда разработки программного обеспечения с открытым исходным кодом для языка программирования R, который предназначен для статистической обработки данных и работы с графикой. Установка R и RStudio. Установите классический R. (http://cran.rstudio.com/bin/windows/base/) Установите RStudio. https://www.rstudio.com/products/rstudio/download/ Настройка кириллицы в RStudio. В меню TOOLS выбираем GLOBAL OPTIONS->CODE-> Saving->default text encoding выбрать кодировку UTF-8
Рисунок 2 Для установки пакетов выбираем TOOLS-> Install Packages и копируем следующую строку в Packages memisc, dplyr, psych, library,lmtest,sjPlot,sgof,GGally,ggplot2,foreign,car,hexbin,rlms,forecas t,quantmod Нажимаем клавишу Install и ждем Рисунок 3 Чтобы создать новый файл в режиме набора и редактирования кода в меню перейдите File-New File-RScript
1. Подключите необходимые для работы пакеты, как указано на рисунке. 2. После каждой введенной строки нажимайте Ctrl+Enter для выполнения этой строки. В нижнем левом окошке вы увидите результаты работы программы, так при установке пакетов вы будете видеть процесс извлечения файлов. Знак # означает, что следующие за ним символы не являются исполняемыми, а являются комментариями. Рисунок 4 3. Сохраните файл из папки набор данных по номеру варианта в ту же папку. Предварительно нажмите меню Session -Set Working Directory -To SOurce File Location Рисунок 5 Введите следующий код, где в качестве имени файла(в примере eaef21.csv) укажите файл с номером вашего варианта
Рисунок 6 Переведите курсор на строчку, начинающуюся mydata…и нажмите сочетание клавиш crtl+enter. В результате выполнения этой команды создается новая переменная mydata, в которую записывается содержимое файла eaef21.csv. Чтобы прочитать информацию, содержащуюся в файле используется функция read.csv, аргументы которой перечисляются в круглых скобках и включают в себя: имя файла в кавычках “eaef.csv”, параметр sep указывает тип знака, которым разделены данные в файле формата csv; параметр dec указывает тип символа, которым разделены целая и дробная часть в числе(в нашем случае точка ) параметр header принимает значение TRUE, если в первой строчке csv-файла содержаться названия столбцов таблицы, по умолчанию принимает значение FALSE. CSV (от англ. Comma-Separated Values — значения, разделённые запятыми) — текстовый формат, предназначенный для представления табличных данных. Спецификация: Каждая строка файла — это одна строка таблицы. Разделителем (англ. delimiter) значений колонок является символ запятой (,). Однако на практике часто используются другие разделители. Команда glimpse(mydata) # функция из пакета dplyr служит для просмотра набора данных, в результате чего будут перечислены все переменные и типы данных: mydata.
Доступ онлайн
В корзину