Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Анализ данных в социологии

Покупка
Артикул: 787239.01.99
Доступ онлайн
500 ₽
В корзину
Рассматриваются вопросы, связанные с использованием математических методов как средства познания социальных явлений и изучением связен различного типа между номинальными признаками. Также содержатся материалы для проведения занятий, проверки уровня освоения дисциплины и сформированности необходимых компетенций. Предназначено для бакалавров направления подготовки 39.03.01 «Социология», изучающих дисциплину «Анализ данных в социологии». Подготовлено на кафедре государственного, муниципального управления и социологии КНИТУ.
Алексеев, С. А. Анализ данных в социологии : учебно-методическое пособие / С. А. Алексеев. - Казань : КНИТУ, 2019. - 92 с. - ISBN 978-5-7882-2617-0. - Текст : электронный. - URL: https://znanium.com/catalog/product/1895536 (дата обращения: 26.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
 

Министерство науки и высшего образования Российской Федерации

Федеральное государственное бюджетное

образовательное учреждение высшего образования

«Казанский национальный исследовательский

технологический университет»

С. А. Алексеев

АНАЛИЗ ДАННЫХ В СОЦИОЛОГИИ

Учебно-методическое пособие

Казань

Издательство КНИТУ

2019

 

УДК 303(075)
ББК 60.50я7

А47

Печатается по решению редакционно-издательского совета 

Казанского национального исследовательского технологического университета

Рецензенты:

канд. социол. наук Р. Р. Гарипова 
канд. социол. наук Р. Р. Хизбуллина

А47

Алексеев С. А.
Анализ данных в социологии : учебно-методическое пособие /
С. А. Алексеев; Минобрнауки России, Казан. нац. исслед. технол. ун-т. –
Казань : Изд-во КНИТУ, 2019. – 92 с.

ISBN 978-5-7882-2617-0

Рассматриваются вопросы, связанные с использованием математических методов 
как средства познания социальных явлений и изучением связей различного 
типа между номинальными признаками. Также содержатся материалы для проведения 
занятий, проверки уровня освоения дисциплины и сформированности необходимых 
компетенций.

Предназначено для бакалавров направления подготовки 39.03.01 «Социология», 
изучающих дисциплину «Анализ данных в социологии».

Подготовлено на кафедре государственного, муниципального управления и 

социологии КНИТУ.

ISBN 978-5-7882-2617-0
© Алексеев С. А., 2019
© Казанский национальный исследовательский технологический 
университет, 2019

Редактор Л. Г. Шевчук

Подписано в печать 09.07.2019
Формат 6084 1/16

Бумага офсетная
Печать ризографическая
 5,35 усл. печ. л. 

5,75 уч.-изд. л. 
Тираж 100 экз.
Заказ

Издательство Казанского национального исследовательского 

технологического университета

Отпечатано в офсетной лаборатории Казанского национального

исследовательского технологического университета

420015, Казань, К. Маркса,  68

УДК 303(075)
ББК 60.50я7

Оглавление 

ВВЕДЕНИЕ.................................................................................................4

РОЛЬ АНАЛИЗА ДАННЫХ В ПОИСКЕ СТАТИСТИЧЕСКИХ 

ЗАКОНОМЕРНОСТЕЙ .............................................................................6

МАТЕМАТИЧЕСКИЕ МЕТОДЫ КАК СРЕДСТВО ПОЗНАНИЯ 

СОЦИАЛЬНЫХ ДАННЫХ ....................................................................11

ОДНОМЕРНЫЕ ЧАСТОТНЫЕ РАСПРЕДЕЛЕНИЯ ..........................17

МЕРЫ СРЕДНЕЙ ТЕНДЕНЦИИ И МЕРЫ РАЗБРОСА .....................21

ИЗУЧЕНИЕ СВЯЗЕЙ МЕЖДУ НОМИНАЛЬНЫМИ 

ПРИЗНАКАМИ .......................................................................................33

АНАЛИЗ СВЯЗЕЙ ТИПА ПРИЗНАК – ПРИЗНАК..............................39

АНАЛИЗ СВЯЗЕЙ ТИПА АЛЬТЕРНАТИВА – АЛЬТЕРНАТИВА ...48

АНАЛИЗ СВЯЗЕЙ ТИПА ГРУППА АЛЬТЕРНАТИВ – ГРУППА 

АЛЬТЕРНАТИВ ......................................................................................53

АНАЛИЗ СВЯЗЕЙ ТИПА ПРИЗНАК – ГРУППА ПРИЗНАКОВ ......59

ВОПРОСЫ ДЛЯ ДИСКУССИЙ .............................................................68

ВАРИАНТЫ ТЕСТОВЫХ ЗАДАНИЙ ..................................................71

ЗАДАНИЯ ДЛЯ РАСЧЕТНОЙ РАБОТЫ .............................................81

ЗАДАНИЯ ДЛЯ КОНТРОЛЬНОЙ РАБОТЫ ........................................87

РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА ..................................................... 91 

Введение 

Данное учебное пособие предназначено для студентов баклаври-

ата, обучающихся по направлению 39.03.01 «Социология». 

Целями освоения дисциплины «Анализ данных в социологии» 

являются:

a) знакомство с методологическим аспектом анализа данных;
б) углубленное знакомство с традиционными методами дескриптивной 
статистики и методами анализа связей между номинальными 
признаками; 

в) формирование представлений о логике интерпретации результатов 
анализа социологических данных.

В результате освоения дисциплины у обучающегося должны 

быть сформированы следующие компетенции (в соответствии с ГОС 
ВО): 

– способность самостоятельно формулировать цели, ставить кон-

кретные задачи научных исследований в различных областях социоло-
гии и решать их с помощью современных исследовательских методов с 
использованием новейшего отечественного и зарубежного опыта и с 
применением современной аппаратуры, оборудования, информацион-
ных технологий; 

– способность использовать базовые теоретические знания, прак-

тические навыки и умения для участия в научных и научно-прикладных 
исследованиях, аналитической и консалтинговой деятельности.

После изучения курса, обучающийся должен:
1) Знать: 
а) основные направления анализа данных;
б) специфику использования методов анализа данных в социоло-

гии.

2) Уметь: 
a) применять ключевые методы статистики для решения социо-

логических исследовательских задач;

б) применять на практике адекватные методы анализа и интер-

претации социологических данных;

в) квалифицированно анализировать эмпирические данные, по-

лученные в процессе социологических исследований.

3) Владеть:
а) навыками постановки задач анализа социологических данных; 
б) основными методами анализа данных социологических иссле-

дований.

Данное учебное пособие содержит теоретический материал, во-

просы для организации дискуссий, тестовые задания, задания для рас-
четных работ, варианты контрольных работ.

На наш взгляд данное издание поможет студенту в освоении ма-

териала, при прохождении учебной, производственных и преддиплом-
ной практик, при выполнении выпускных квалификационных работ.

Роль анализа данных в поиске статистических  

закономерностей 

В процессе проведения социологических исследований социо-

логи получают эмпирические данные разных типов. К таким типам от-
носятся1: 

– совокупности чисел, характеризующих определенные объекты 

(возраст респондентов, заработная плата и т.д.);

– множества индикаторов тех или иных отношений между объек-

тами (например, данные социометрических исследований);

– результаты попарных сравнений объектов, произведенных ре-

спондентами (данные получаемые при применении метода парных 
сравнений);

– сведения о способах построения шкал, отражающих усреднен-

ное отношение респондентов к определенным объектам;

– совокупности 
высказываний, 
сделанные 
респондентами

(например, материалы глубинных интервью и фокус-групп);

– тексты различных документов;
– результаты наблюдений. 
Принципиально важным при организации социологических ис-

следований является процесс абстрагирования, в рамках которого про-
исходит выделение понятий и последующий процесс их операционали-
зации, состоящий в выборе признаков (общих для всех изучаемых объ-
ектов качеств, конкретные проявления которых у каждого из объектов 
могут варьироваться), являющихся индикаторами понятий, и набора 
значений выделенных признаков. 

Так, например, изучая жизненные стратегии студентов бака-

лавриата, мы можем в качестве признаков выбрать возраст студентов, 
выступающих в качестве респондентов, и их успеваемость. Значение 
признака «возраст», выделенного нами, может быть «непрерывным» и 
указываться целым числом лет – 18 лет, 19 лет, 20 лет, 21 год и т.д. 
Другим вариантом может быть выделение возрастных групп, соответ-
ствующих студентам  младших и старших курсов бакалавриата: 18–
19 лет и 20–21 год с последующим приписыванием данным возрастным 
группам определенных чисел (принадлежность к возрастной группе 
18–19 лет может быть обозначена числом 1, а к возрастной группе 20–

1 Толстова, Ю. Н. Анализ социологических данных. Методология, дескриптивная 
статистика, изучение связей между номинальными признаками. М.: Научный 
мир, 2000. С. 21.

21 год – числом 2). Аналогично можно поступить и с признаком «успе-
ваемость», используя в качестве значения средний балл, полученный за 
семестр, или выделив группы на основе этого балла и присвоив им со-
ответствующие числовые значения.  

Эмпирические данные, полученные в социологических исследо-

ваниях, чаще всего представляют собой выраженную в виде числовых 
значений совокупность значений признаков какого-либо изучаемого 
объекта. Удобной формой представления данных в этом случае явля-
ются таблицы (матрицы) «объект–признак». В таких таблицах строки 
соотвествуют объектам, а столбцы – признакам (табл. 1). Другим видом 
представления такой информации являются графические изображения 
признакового пространства. При их построении по осям графика откла-
дываются рассматриваемые признаки, а каждый объект представляется
в виде точки, координатами которой служат значения признаков, отве-
чающих осям (рис. 1)

Подобные представления значений признаков позволяют социо-

логам выявить статистические закономерности, возникающие в резуль-
тате взаимодействия большого числа элементов, составляющих сово-
купность и характеризующих скорее всю совокупность в целом, а не 
только поведение отдельных элементов ее составляющих. Другими

Таблица 1

Таблица «Объект–признак»

Номер объекта
Наименование признака

Возраст
Средний балл за семестр

1
18
4,3

2
19
4,1

3
18
3,6

4
20
4,5

5
20
4,6

6
21
4,2

7
18
3,9

8
20
4,1

9
21
4,9

10
19
4,3

Рис. 1. Графическое изображение признакового пространства

словами, выявление статистических закономерностей в социологии –
это выявление тенденций, имеющих место «в среднем» для всех ре-
спондентов изучаемой совокупности. На основании выявленных стати-
стических закономерностей формулируются традиционные для отчетов 
о проведенных социологических исследованиях утверждения: напри-
мер, «качество досуга прямо пропорционально зависит от уровня жизни
респондентов», «университет имеет самый высокий рейтинг у абитури-
ентов» и т.д. И эти утверждения в той или иной степени описывают со-
циальную реальность. Однако следует отметить, что математический 
аппарат используется для работы не с реальностью непосредственно, а 
с моделью реальности, для которой в силу ее сущности характерны эле-
менты формализации. 

Каковы же принципы построения модели реальности? Исходные 

данные, с которыми работает социолог, имеют два уровня, которые 
можно расценивать как содержательный и формальный аспекты дан-
ных. Содержательный аспект данных состоит в том, что приходится 
иметь дело со множеством реальных уникальных и неповторимых объ-
ектов, скрывающихся за данными. Формальный же аспект данных 
определяется тем, что используется совокупность отражающих эти 
объекты формальных конструктов, получающаяся в результате сбора 

3

3,2
3,4
3,6
3,8

4

4,2
4,4
4,6
4,8

5

16
17
18
19
20
21
22

Средний балл за семестр 

Возраст

1

3

7

10

2

8

4

5
9

6

данных. Важнейшей задачей является грамотное соотнесение формаль-
ного аспекта данных с содержательным, что достигается в процессе 
формирования и операционализации понятий2.

На основе совокупности априорных представлений социолога об 

объекте и предмете исследования, выделения основных понятий и свя-
зывающих их закономерностей формируется априорная содержатель-
ная модель. Далее осуществляется переход к концептуальной модели 
реальности. Для этого выделяются понятия и устанавливаются при-
чинно-следственные отношения между ними, в завершение построения 
модели производится операционализация путем выражения выбранных 
понятий через наблюдаемые признаки и выбирается способ измерения 
связи между признаками. Далее реализация процедуры измерения и ис-
пользование методов анализа данных позволяют перейти к формальной 
модели, а интерпретация применения данных метода – к апостериорной 
модели реальности3. Пример построения моделей определеннного ас-
пекта социальной реальности (воздействия экономического состояния 
региона на формирование здоровьесберегающего поведения населе-
ния) приведен на рис. 2.

Ю. Н. Толстова отмечает важность поиска таких алгоритмов ана-

лиза данных, которые позволили бы так эффективно «сжать» (преобра-
зовать) имеющиеся в распоряжении социолога эмпирические данные, 
чтобы успешно выявить имеющиеся статистические закономерности. 
Ю. Н. Толстова указывает на два аспекта указанной проблемы4. Первый 
аспект касается формальной сути алгоритмов сжатия, позволяющих пе-
реходить от множества значений к минимуму, чаще всего к одному 
числу. Так, например, в процессе социологического исследования ис-
следователи получают столько значений исследуемого признака, 
сколько респондентов составляют выборочную совокупность. Получен-
ные числовые значения исследуемого признака составляют вариацион-
ный ряд. Вся эта совокупность значений признака может быть «сжата» 
до одного числа – значения среднего арифметического вариционного 
ряда. Если имеется два множества значений каких-либо признаков, то 
и в этом случае существует возможность «сжатия» данных до значения 
коэффициента парной корреляции между этими признаками. В случае, 
если число множеств значений признаков равно N, то возможно

2 Толстова, Ю. Н. Указ. соч. С. 39–40.
3 Там же. С. 39–40.
4 Там же. С. 51–53.

Социальная реальность

Стадия 1. Абстрагирование

Априорная содержательная модель

Экономическое состоя-

ние региона

→

влияние

Формирование здоро-

вьесберегающего поведения 

у населения

Стадия 2. Концептуализация

Концептуальная модель

Вычисление изучаемых объектов и характеризующих их показателей

Финансирование развития 

сферы физической

культуры и спорта (ФКС)

→

причинно-след-
ственная связь

Эффективность вовлечения 
населения в занятия физиче-

ской культурой и спортом 

(ФКС)





Выбор индикаторов и принципов их интерпретации

Объем финансирования на 
одного занимающегося ФКС 
в муниципальных образова-

ниях

→

статистическая 

связь, выбор кон-
кретного метода

Доля занимающихся ФКС в му-

ниципальных образованиях





Стадия 3. Определение измеряемых объектов, реализация процедуры изме-

рения

Формальная модель

Результаты измерения

Числа (характеристики объ-
ема финансирования ФКС в 
МО) и их интерпретация

Коэффициент 
корреляции

r

Числа (характеристики доли 
занимающихся ФКС в МО) и их 
интерпретация



Статистические показатели

Стадия 4. Интерпретация результатов применения метода

Апостериорная содержательная модель

Рис. 2. Пример построения моделей отдельного аспекта

социальной реальности

осуществление сжатия до N-1 чисел – коэффициентов регрессионного 
уравнения, связывающих один из рассматриваемых признаков с дру-
гими. Второй аспект связан с трактовкой роли сжатия исходной инфор-
мации в выявлении особенностей социальной реальности. Здесь нужно 

иметь в виду, что при выявлении закономерностей происходит потеря 
исходной информации об изучаемых объектах, и возникает необходи-
мость контролировать допустимость такой потери. Такой контроль до-
вольно сложен, так как охватывает результаты принятых ранее реше-
ний (адекватность выбора признаков для описания исследуемых про-
цессов, точность выбора типов шкал, адекватность смысла числовых 
значений, получающихся в результате реализации алгоритма анализа 
данных и т.д.). Также возникает вопрос о степени сжатия исходной ин-
формации. С такой проблемой приходится сталкиваться, например, при 
использовании кластерного анализа, в основе которого лежат агломе-
ративные алгоритмы классификации. Суть таких алгоритмов состоит в 
пошаговом объединении классов во все большие по размеру совокупности, 
начиная с ситуации, когда каждый исходный объект рассматривается 
в качестве отдельного класса, и завершаясь ситуацией, когда все 
объекты объединяются в один класс. При реализации таких алгоритмов 
от исследователя требуется принятие решения о том, на сколько классов 
должна быть разбита рассматриваемая совокупность объектов, 
чтобы адекватное описание реальности не было нарушено. В целом 
считается, что сжатие должно осуществляться до тех пор, пока исследователь 
способен охватить разумом полученный результат.

Математические методы как средство познания  

социальных данных 

Процесс анализа данных требует применения математического 

аппарата. Действительно, в процессе постановки исследовательской задачи 
исследователь формулирует определенные представления о характере 
изучаемого явления путем абстрагирования от конкретных черт 
изучаемых объектов и производя определенную адекватную поставленной 
задачи формализацию явления. Совокупность таких представлений 
является априорной моделью явления, о которой упоминалось ранее, и 
этих представлений должно быть достаточно для определения того, какие 
методы сбора данных будут использоваться при проведении исследования, 
какие подходы будут использованы при интерпретации эмпирических 
данных, какой формальный аппарат анализа данных будет использован 
и как будут интерпретироваться результаты применения 
этого аппарата. 

Доступ онлайн
500 ₽
В корзину