Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Анализ сетей (графов) в среде R

Покупка
Артикул: 645899.02.99
Доступ онлайн
899 ₽
В корзину
Данная книга представляет собой практическое руководство по решению основных задач, связанных с анализом сетей, включая управление сетевыми данными, визуализацию сетей, их описание и моделирование. Все примеры, используемые в книге, сопровождаются программным кодом на языке R. Издание служит отличным справочным ресурсом для изучения науки о сетях.
Дуглас А., Л. Люк, Д.А. Анализ сетей (графов) в среде R. Руководство пользователя / Д.А. Люк ; пер. с анг. А.В. Груздева. - Москва : ДМК Пресс, 2017. - 250 с. - ISBN 978-5-97060-428-1. - Текст : электронный. - URL: https://znanium.com/catalog/product/1028090 (дата обращения: 09.05.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Дуглас Люк

Интернет-магазин: 
www.dmkpress.com

Книга - почтой: 
orders@alians-kniga.ru

Оптовая продажа: 
“Альянс-книга”. 
Тел.: (499)782-3889
books@alians-kniga.ru

Анализ сетей (графов) в среде R

www.дмк.рф

До недавнего времени для проведения анализа сетей требовалось специализированное программное обеспечение. Однако недавно инструменты 
для этого появились в среде статистического программирования R. Помимо того, что методы анализа сетей стали доступны более широкому кругу 
специалистов по статистике, пакет R предоставил исследователям обширные возможности по управлению данными, графической визуализации и 
статистическому моделированию. 

Книга является руководством пользователя по анализу сетей в среде R. 
Она концентрируется на четырех основных задачах, с которыми обычно 
сталкивается специалист в этой области: управление сетевыми данными, 
визуализация сети, описание сети и моделирование сети. Все примеры сопровождаются программным кодом на языке R.

Издание служит отличным справочным ресурсом для изучения науки о сетях.

9 785970 604281

ISBN 978-5-97060-428-1

Анализ сетей 
(графов)
в среде R

Руководство пользователя

Дуглас Люк

Анализ сетей (графов) в среде R. 
Руководство пользователя

Douglas A. Luke

A User’s Guide to Network 
Analysis in R

Дуглас Люк

Анализ сетей (графов)  
в среде R.  
Руководство пользователя

Москва, 2017

УДК 004.73:004.438R
ББК 32.971.35
Л94

Люк Д. А.

Л94 
Анализ сетей (графов) в среде R. Руководство пользователя / пер. с анг. А. В. Груздева. – М.: ДМК Пресс, 2017. – 250 с.: ил.

ISBN 978-5-97060-428-1

Данная книга представляет собой практическое руководство по решению основ
ных задач, связанных с анализом сетей, включая управление сетевыми данными,
визуализацию сетей, их описание и моделирование. Все примеры, используемые в
книге, сопровождаются программным кодом на языке R.

Издание служит отличным справочным ресурсом для изучения науки о сетях.

УДК 004.73:004.438R
ББК 32.971.35

Translation from the English language edition:

A User’s Guide to Network Analysis in R

by Douglas A. Luke

Copyright © Springer International Publishing Switzerland 2015

This Springer imprint is published by Springer Nature

The registered company is Springer International Publishing AG

All Rights Reserved

Все права защищены. Любая часть этой книги не может быть воспроизведена в какой

бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав.

Материал, изложенный в данной книге, многократно проверен. Но поскольку вероятность

технических ошибок все равно существует, издательство не может гарантировать абсолютную
точность и правильность приводимых сведений. В связи с этим издательство не несет ответственности за возможные ошибки, связанные с использованием книги.

ISBN 978-3-319-23882-1 Copyright © Springer International Publishing Switzerland, 2015
ISBN 978-5-97060-428-1
© Перевод, издание, оформление, ДМК Пресс, 2017

Моей самой важной социальной сети –  
Сью, Алине и Эндрю – посвящается

Содержание

Предисловие......................................................................................................................9

Глава 1. Введение в анализ сетей в R...................................................................11
1.1..Что.такое.сети?..............................................................................................................12
1.2..Что.такое.анализ.сетей?.................................................................................................14
1.3..Пять.серьезных.причин.проводить.анализ.сетей.в.R.......................................................15
1.3.1..Широта.возможностей.R...................................................................................15
1.3.2..Свободно.распространяемая.и.открытая.природа.R..........................................16
1.3.3..Возможности.работы.с.данными.и.проектами.в.R..............................................16
1.3.4..Широкий.выбор.пакетов.для.анализа.сетей.в.R.................................................17
1.3.5..Возможности.моделирования.сетей.в.R............................................................17
1.4..Область.применения.книги.и.ресурсы............................................................................17
1.4.1..Область.применения.........................................................................................17
1.4.2..«Дорожная.карта».книги....................................................................................18
1.4.3..Ресурсы............................................................................................................19

Часть I. ОСНОВЫ АНАЛИЗА СЕТЕЙ.........................................................................20

Глава 2. «Пятичисловая сводка» для анализа сетей......................................21
2.1..Анализ.в.R:.с.чего.начать................................................................................................22
2.2..Подготовка.....................................................................................................................22
2.3..Простая.визуализация....................................................................................................23
2.4..Базовое.описание..........................................................................................................23
2.4.1..Размер..............................................................................................................23
2.4.2..Плотность.........................................................................................................25
2.4.3..Компоненты......................................................................................................26
2.4.4..Диаметр............................................................................................................26
2.5..Коэффициент.кластеризации.........................................................................................27

Глава 3. Управление сетевыми данными в R.....................................................28
3.1..Основные.понятия.сетевых.данных.................................................................................29
3.1.1..Структуры.сетевых.данных................................................................................29
3.1.2..Информация,.хранимая.в.объектах-сетях..........................................................32
3.2..Создание.объектов-сетей.и.работа.с.ними.в.R...............................................................32
3.2.1..Создание.объекта-сети.в.statnet......................................................................33
3.2.2..Работа.с.атрибутами.узлов.и.связей..................................................................36
3.2.3.Создание.объекта-сети.в.igraph.......................................................................39
3.2.4..Переключение.между.statnet.и.igraph..............................................................41
3.3..Импорт.сетевых.данных.................................................................................................41
3.4..Общераспространенные.задачи.при.работе.с.сетевыми.данными..................................43
3.4.1..Фильтрация.сетевых.данных.на.основе.значений.атрибутов.вершин..
или.ребер...................................................................................................................43
3.4.2..Преобразование.направленной.сети.в.ненаправленную....................................50

Часть II. ВИЗУАЛИЗАЦИЯ............................................................................................53

Глава 4. Графическое представление и укладка сети..................................54
4.1..Проблема.визуализации.сети.........................................................................................55
4.2..Эстетический.вид.укладок.сетей....................................................................................57
4.3..Основные.алгоритмы.и.методы.графического.представления........................................59

Содержание
7

4.3.1..Более.точная.настройка.укладки.сети...............................................................60
4.3.2..Укладки.сетей,.построенные.с.помощью.igraph.................................................62

Глава 5. Эффективный графический дизайн сетей.......................................64
5.1..Основные.принципы.......................................................................................................65
5.2..Элементы.дизайна.........................................................................................................65
5.2.1..Цвет.узла..........................................................................................................66
5.2.2..Форма.узла.......................................................................................................71
5.2.3..Размер.узла......................................................................................................72
5.2.4..Метка.узла........................................................................................................77
5.2.5..Ширина.ребра...................................................................................................78
5.2.6..Цвет.ребра........................................................................................................79
5.2.7..Тип.ребра..........................................................................................................80
5.2.8..Легенды............................................................................................................81

Глава 6. Сложные графики сетей............................................................................83
6.1..Интерактивные.графики.сетей.......................................................................................84
6.1.1..Простые.интерактивные.сети.в.igraph...............................................................84
6.1.2..Публикация.интерактивных.веб-диаграмм.сетей...............................................85
6.1.3..Statnet.Web:.интерактивный.statnet.c.помощью.shiny.......................................87
6.2..Специализированные.диаграммы.сетей.........................................................................88
6.2.1..Дуговые.диаграммы..........................................................................................88
6.2.2..Хордовые.диаграммы........................................................................................90
6.2.3..Теплокарты.для.сетевых.данных........................................................................93
6.3..Создание.диаграмм.сетей.с.помощью.других.пакетов.R.................................................95
6.3.1..Построение.диаграмм.сетей.с.помощью.ggplot2...............................................95

Часть III. ОПИСАНИЕ И АНАЛИЗ...............................................................................99
Глава 7. Важность актора......................................................................................... 100
7.1..Введение..................................................................................................................... 101
7.2..Центральность.–.показатель.важности.для.ненаправленных.сетей............................... 101
7.2.1..Три.популярные.меры.центральности............................................................. 103
7.2.2..Меры.центральности.в.R................................................................................. 105
7.2.3..Централизация:.вычисление.индексов.центральности.для.сети.в.целом......... 106
7.2.4..Создание.отчетов.по.центральности............................................................... 107
7.3..Точки.сочленения.и.мосты............................................................................................ 111

Глава 8. Подгруппы...................................................................................................... 114
8.1..Введение..................................................................................................................... 115
8.2..Социальная.сплоченность............................................................................................ 116
8.2.1..Клики.............................................................................................................. 116
8.2.2..k-ядра............................................................................................................. 120
8.3..Обнаружение.сообществ.............................................................................................. 123
8.3.1..Модулярность................................................................................................. 125
8.3.2..Алгоритмы.обнаружения.сообществ............................................................... 127

Глава 9. Сети аффилированности........................................................................ 134
9.1..Определение.сетей.аффилированности....................................................................... 135
9.1.1..Аффилированность.в.виде.бимодальных.сетей............................................... 135
9.1.2..Двудольные.графы.(биграфы)......................................................................... 136
9.2..Основы.сетей.аффилированности................................................................................ 137
9.2.1..Создание.сетей.аффилированности.из.матриц.инцидентности....................... 137
9.2.2..Создание.сетей.аффилированности.из.списков.ребер.................................... 138

Содержание
8

9.2.3..Графическое.представление.сетей.аффилированности.................................. 140
9.2.4..Проекции........................................................................................................ 140
9.3..Пример:.актеры.Голливуда.как.пример.сети.аффилированности.................................. 143
9.3.1..Анализ.полной.сети.аффилированности.актеров.Голливуда............................ 143
9.3.2..Анализ.проекций.актеров.и.фильмов............................................................... 149

Часть IV. МОДЕЛИРОВАНИЕ.................................................................................... 155
Глава 10. Модели случайных сетей..................................................................... 156
10.1..Предназначение.моделей.сетей................................................................................. 157
10.2..Модели.формирования.и.структуры.сети................................................................... 158
10.2.1..Модель.случайного.графа.Эрдеша–Реньи..................................................... 158
10.2.2..Модель.малого.мира..................................................................................... 162
10.2.3..Свободно.масштабируемые.модели.............................................................. 165
10.3..Сравнение.моделей.случайных.графов.с.наблюдаемыми.сетями............................... 170

Глава 11. Статистические модели сетей.......................................................... 173
11.1..Введение.................................................................................................................... 174
11.2..Построение.экспоненциальных.моделей.случайных.графов....................................... 177
11.2.1..Построение.нулевой.модели......................................................................... 179
11.2.2..Включение.предикторов.узлов...................................................................... 181
11.2.3..Включение.предикторов.диад....................................................................... 183
11.2.4..Включение.предикторов.ребер...................................................................... 187
11.2.5..Включение.предикторов.локальных.структур.(зависимых.диадных.связей)..... 189
11.3..Анализ.экспоненциальных.моделей.случайных.графов............................................... 191
11.3.1..Интерпретация.модели................................................................................. 191
11.3.2..Подгонка.модели........................................................................................... 192
11.3.3..Диагностика.модели..................................................................................... 195
11.3.4..Имитационное.моделирование.сетей.на.основе.оцененной.модели.............. 195

Глава 12. Модели динамических сетей............................................................. 199
12.1..Введение.................................................................................................................... 200
12.1.1..Динамические.сети....................................................................................... 200
12.1.2..RSiena........................................................................................................... 202
12.2..Подготовка.данных..................................................................................................... 203
12.3..Спецификация.и.оценивание.модели......................................................................... 210
12.3.1..Спецификация.модели.................................................................................. 210
12.3.2..Оценивание.модели...................................................................................... 214
12.4..Анализ.модели........................................................................................................... 215
12.4.1..Интерпретация.модели................................................................................. 215
12.4.2..Качество.подгонки........................................................................................ 220
12.4.3..Имитационное.моделирование..................................................................... 224

Глава 13. Имитационные модели......................................................................... 228
13.1..Имитационные.модели.cетевой.динамики.................................................................. 229
13.1.1..Имитационное.моделирование.социальной.селекции................................... 229
13.1.2..Имитационное.моделирование.социального.влияния................................... 240

Библиография................................................................................................................ 247

Предисловие

В начале 2000 года Стивен Хокинг сказал, что «следующий век будет веком сложности». Если его прогноз верен, то выходит, что нам потребуются новые научные 
теории, методы сбора данных и аналитические подходы, которые будут использоваться для исследования сложных систем и поведения. Наука о сетях – это подход, 
рассматривающий мир через призму сетей, в котором физические и социальные 
системы образованы разнородными акторами, соединенными друг с другом с помощью различных типов связей. Анализ сетей – это набор аналитических инструментов, используемых для изучения таких систем. В течение последних нескольких десятилетий анализ сетей приобретает все большее значение в арсенале 
аналитических средств, используемых социологами, врачами и физиками.
До недавнего времени для проведения анализа сетей требовалось специализированное программное обеспечение (как для управления сетевыми данными, так 
и для последующего анализа). Однако начиная примерно с 2000 года инструменты для анализа сетей появились в среде статистического программирования R. 
Помимо того что благодаря этому методы анализа сетей стали доступны более широкому кругу специалистов по статистике, пакет R предоставил исследователям, 
занимающимся анализом сетей, обширные возможности по управлению данными, 
графической визуализации и статистическому моделированию. 
Как и предполагает название, эта книга является руководством пользователя 
по анализу сетей в R. В этой книге приводятся ключевые задачи в области анализа 
сетей, которые теперь можно выполнить в R. Книга концентрируется на четырех 
основных задачах, с которыми обычно сталкивается специалист в области анализа сетей: управление сетевыми данными, визуализация сети, описание сети и моделирование сети. Книга включает программный код R, который используется 
в конкретных примерах анализа сетей. Кроме того, к книге прилагается комплект 
наборов сетевых данных, использующихся в ней. (См. главу 1 для получения более подробной информации о структуре книги, а также инструкции по поводу 
того, как получить сетевые данные.) Книга написана для тех, кого интересует проведение анализа сетей в R. Она может использоваться в качестве вспомогательного пособия по анализу сетей или руководства по методам анализа сетей в R.
Появление этой книги было бы невозможным без консультаций, поддержки, 
рекомендаций и советов, которые я получил за последние 30 лет благодаря своим собственным социальным сетям (личной и профессиональной). В середине 
1980-х годов я закончил класс по анализу сетей у Стена Вассермана в Иллинойском университете в Урбане-Шампейне. Я помню, в каком я был восторге от этого 
нового метода анализа данных, но тогда думал, что вряд ли буду когда-либо использовать его в своей работе. Однако мои коллеги в области психологии и здравоохранения посоветовали мне в моей первоначальной работе рассмотреть тему 
использования анализа сетей для изучения и оценки данных. Среди них – Джулиан Раппапорт (Julian Rappaport), Эд Сейдман (Ed Seidman), Брюс Рапкин (Bruce 
Rapkin), Курт Рибисл (Kurt Ribisl), Шерон Хоман (Sharon Homan), Росс Браун
Предисловие
10

сон (Ross Brownson) и Мэтт Кройтор (Matt Kreuter). Независимо от того, знают они это или нет, я был вдохновлен замечательным коллективом специалистов 
в области сетей и систем, в их числе Том Валенте (Tom Valente), Стив Боргатти 
(Steve Borgatti), Мартина Моррис (Martina Morris), Том Снайдерс (Tom Snijders), 
Скотт Лейшоу (Scott Leischow), Пэтти Мейбри (Patty Mabry), Стивен Маркус 
(Stephen Marcus) и Росс Хаммонд (Ross Hammond). Свои главные идеи, связанные с анализом сетей, я почерпнул от моих друзей и коллег в Научном центре общественного здравоохранения, в частности от Бобби Карозерса (Bobbi Carothers), 
Амара Дхенда (Amar Dhand), Криса Робишо (Chris Robichaux) и Нэнси Мюллер 
(Nancy Mueller). Особенно я благодарен моим студентам, посещавшим мои занятия и семинары на протяжении этих лет. Они не только улучшили эту книгу, но 
и расширили мои взгляды касательно анализа сетей. Отдельное большое спасибо 
Дженин Харрис (Jenine Harris). Дженин была моим первым докторантом, и в данный момент я восхищен строгостью и элегантностью ее работы, посвященной анализу сетей. Я также хотел бы поблагодарить Центры по контролю и профилактике заболеваний США, Национальные институты здравоохранения США и Фонд 
здоровья в Миссури за поддержку в проведении исследований, что позволило мне 
разработать и усовершенствовать подход к анализу сетей. Наконец, выражаю глубочайшую признательность членам моей семьи. Они дали мне определенные советы касательно содержания, предоставили место и время для напряженной работы 
над этой книгой (включая знаменательный подарок на День отца) и поддерживали меня в те моменты, когда я больше всего в этом нуждался. Спасибо вам, Сью, 
Али и Эндрю.

Сент-Луис, Миссури, США 
Дуглас Люк
Июль 2015

Введение  
в анализ сетей в R

Глава 1

1.1..Что.такое.сети?..........................12
1.2..Что.такое.анализ.сетей?............14
1.3...Пять.серьезных.причин..
проводить.анализ.сетей.в.R.......15
1.4...Область.применения.книги.
и.ресурсы..................................17

Введение в анализ сетей в R 
12

– Начните сначала, – серьезно сказал Король, – 
и читайте, пока не дойдете до конца: тогда 
и остановитесь. 

Льюис Кэрролл. «Алиса в Стране чудес»

1.1. Что такое сети?

Эта книга является руководством пользователя для проведения анализа сетей 
в среде статистического программирования R. Сети – это все, что окружает нас. 
Люди естественным образом организуются в сетевые системы. Наши близкие 
и друзья формируют персональные социальные сети вокруг каждого из нас. 
Соседские общины организуются в сетевые объединения для выдвижения тех 
или иных требований. Компании сотрудничают (или конкурируют) друг с другом в рамках сложных, взаимосвязанных отношений торгового и финансового партнерства. Развитие здравоохранения осуществляется путем партнерства 
правительственных и неправительственных организаций [Luke, Harris, 2007]. 
Страны связаны друг с другом системами миграции, торговли и договорных 
обязательств.
Кроме того, практически везде встречаются сети, не связанные с человеческими коммуникациями. Наши гены и белки взаимодействуют друг с другом посредством сложных биологических сетей. Человеческий мозг теперь рассматривается 
как сложная сеть, или «коннектом» («connectome») [Sporns, 2012]. Аналогично 
человеческие болезни и их базовые генетические корни можно представить в виде 
«карты болезни» («diseasome») [Barabasi, 2007]. Виды животных взаимодействуют друг с другом различными сложными способами, один из которых – пищевая 
сеть, в которой взаимодействия можно описать отношениями «кто кого съедает». 
Информация уже сама по себе объединена в сеть. Наша правовая система представляет собой взаимосвязанную сеть ранее принятых юридических решений 
и прецедентов. Социальный и научный прогресс стимулируется процессом распространения инноваций, в ходе которого информация разносится по взаимосвязанным социальным системам, будь то фермеры Айовы [Rogers, 2003] или специалисты в области общественного здравоохранения [Harris, Luke, 2009]. Похоже, что 
сети являются одним из способов, с помощью которого устроена вселенная.
Так что же такое сеть? На рис. 1.1 и 1.2 показаны две важные и интересные 
социальные сети. Рисунок 1.1 представляет собой сеть контактов 19 налетчиков, 
совершивших террористическую атаку на США 11 сентября 2001 года. Она взята 
из работы [Valdis Krebs, 2002]. Социальная сеть состоит из множества акторов 
(также называемых узлами), которые соединены друг с другом определенным типом социальных отношений (также называемых связью).
 На рисунке узлы показаны кружками, а связи – это линии, соединяющие некоторые узлы. Сеть показывает нам, что налетчики контактировали друг с другом, 
прежде чем совершить теракт 11 сентября, но количество связей в сети небольшое 
и, кажется, нет никакого доминирующего участника сети, который был бы связан 
со всеми налетчиками или с большинством из них.  

Доступ онлайн
899 ₽
В корзину