Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Работа с данными в любой сфере: как выйти на новый уровень, используя аналитику

Покупка
Основная коллекция
Артикул: 720144.02.99
Доступ онлайн
190 ₽
В корзину
Что общего у аналитика данных и Шерлока Холмса? Как у Netflix получилось создать 100%-ный хит — сериал "Карточный домик"? Ответ кроется в правильном использовании данных. Эта книга — практическое руководство и увлекательное путешествие в науку о данных, независимо от того, хотите ли вы использовать анализ данных в своей профессии, собираетесь ли стать аналитиком данных, или уже работаете в этой области. Ее автор, основатель образовательного онлайн-портала и консультант, Кирилл Еременко просто и понятно рассказывает об основных методах, алгоритмах и приемах, которые вам помогут на любом этапе: от сбора данных и их анализа до визуализации полученных результатов. Благодаря "Работе с данными в любой сфере" вы не только узнаете, как данные влияют на нашу жизнь (и как защитить свои данные), но и сможете расширить свои карьерные возможности.
Еременко, К. Работа с данными в любой сфере: как выйти на новый уровень, используя аналитику / Кирилл Еременко ; пер. с англ. - Москва : Альпина Паблишер, 2019. - 303 с. - ISBN 978-5-96142-652-6. - Текст : электронный. - URL: https://znanium.com/catalog/product/1078503 (дата обращения: 23.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Моим родителям, 
Александру и Елене Еременко, 
которые научили меня самому важному 
в жизни — быть хорошим человеком

CONFIDENT DATA SKILLS

M      
    

K E

KoganPage

Кирилл Еременко

Работа 
с данными 
в любой 
сфере

Как выйти 
на новый уровень, 
используя аналитику

Москва
2019

ISBN 978-5-9614-2582-6 (рус.)
ISBN 978-0-7494-8154-4 (англ.)

Все права защищены. Никакая часть этой книги не может быть воспроизведена в какой бы то ни было форме 
и какими бы то ни было средствами, включая размещение в сети интернет и в корпоративных сетях, а также 
запись в память ЭВМ для частного или пуб личного использования, без письменного разрешения владельца 
авторских прав. По вопросу организации доступа 
к электронной библиотеке издательства обращайтесь 
по адресу mylib@alpina.ru

© Kirill Eremenko, 2018 
 
This translation of Confi dent Data Skills is 
published by arrangement with Kogan Page.
© Издание на русском языке, перевод, 
оформление.
 
ООО «Альпина Паблишер», 2019

УДК 004.6
ББК 65.291.213
 
Е70

Переводчик Д. Шалаева
Научный редактор З. Мамедьяров
Редактор Л. Любавина

Еременко К.
Е70  
Работа с данными в любой сфере: Как выйти на новый уровень, используя аналитику / Кирилл Еременко ; Пер. с англ. — М. : Альпина Паблишер, 
2019. — 303 с.

ISBN 978-5-9614-2582-6

Что общего у аналитика данных и Шерлока Холмса? Как у Netfl ix получилось 
создать 100%-ный хит — сериал «Карточный домик»? Ответ кроется в правильном 
использовании данных. Эта книга — практическое руководство и увлекательное 
путешествие в науку о данных, независимо от того, хотите ли вы использовать 
анализ данных в своей профессии, собираетесь ли стать аналитиком данных, или 
уже работаете в этой области. Ее автор, основатель образовательного онлайн-портала и консультант, Кирилл Еременко просто и понятно рассказывает об основных 
методах, алгоритмах и приемах, которые вам помогут на любом этапе: от сбора 
данных и их анализа до визуализации полученных результатов. Благодаря «Работе 
с данными в любой сфере» вы не только узнаете, как данные влияют на нашу 
жизнь (и как защитить свои данные), но и сможете расширить свои карьерные 
возможности.

УДК 004.6
ББК 65.291.213

Содержание

Бонус для читателей ............................................................................................. 

Введение ..................................................................................................................... 

ЧАСТЬ ПЕРВАЯ
«Что это?» 
Ключевые принципы

01

 
Определение 
данных .................................................................................................. 

02

 
Как данные 
удовлетворяют нашипотребности  ............................................. 

03

 
Мышление, необходимое дляэффективного 
анализа данных ................................................................................. 

ЧАСТЬ ВТОРАЯ
«Когда игде ямогуполучить их?»
Сбор ианализ данных

04

 
Сформулируйте 
вопрос ................................................................................................... 

05

 
Подготовка 
данных ................................................................................................

06

 
Анализ данных 
(часть I) ................................................................................................

07

 
Анализ данных 
(часть II) ...............................................................................................

ЧАСТЬ ТРЕТЬЯ
«Как ямогу это показать?»
Представление данных

08

 
Визуализация 
данных ................................................................................................ 

09

 
Презентация 
данных ................................................................................................ 

10

 
Ваша карь ера 
внаукеоданных ............................................................................. 

Благодарности ..................................................................................................... 

Литература ............................................................................................................. 

Бонус для читателей

Спасибо, что выбрали эту книгу. Вы сделали огромный шаг на пути 
в науку о данных.
Получите бесплатный доступ к моему курсу A-Z Data Science. Просто зайдите на сайт www.superdatascience.com / bookbonus и используйте пароль datarockstar.
Удачи в анализе данных!

Введение

«Наверное, вы всегда хотели стать аналитиком данных — с самого 
детства?»
Мне приятно, что меня об этом спрашивают. Да, я люблю свою 
работу. Я с большим удовольствием обучаю студентов основам науки 
о данных. И здорово, что люди, похоже, думают, что энтузиазм по отношению к данному предмету возник во мне еще в молодом возрасте. 
Но это абсолютно не соответствует действительности. Скажем честно, 
ни один ребенок не мечтает о том, чтобы стать ученым — аналитиком данных. Дети хотят быть космонавтами. Танцорами. Врачами. Пожарными. И если вы грезите о спасении жизней или о полетах в космическом пространстве, вы вряд ли остановите свой выбор на столь 
приземленном занятии.
Когда люди спрашивают меня, всегда ли я хотел построить карьеру в области науки о данных, я возвращаюсь к своему детству и вижу 
маленького русского мальчика, выросшего в Зимбабве. Запах тлеющих углей, брачные вопли африканских красных жаб, незабываемый 
уют зимнего вечера, кончики пальцев, переворачивающие страницу 
за страницей сборника историй для детей, — это фрагменты воспоминаний о множестве прекрасных вечеров, когда я слушал русские 
сказки, которые читала мне мама.
Моя мать хотела, чтобы я, мои братья и сестры любили Зимбабве, 
но она также заботилась о том, чтобы мы знали свои культурные 
корни. Она подумала, как наилучшим образом передать нам эту информацию, и решила, что самый действенный способ — сказки. Когда 
я в конце концов вернулся в Москву — в город, который едва помнил, — то почувствовал, что возвращаюсь домой, благодаря крупицам 
информации о России, вплетенным в затейливые сюжеты.
Такова сила повествования. И все множество услышанных сказок 
я хотел разбить на составляющие их компоненты. Мне нужно было 

Введение
9

увидеть большую картину, но я хотел видеть ее сквозь призму маленьких деталей. Я был очарован каждой частью механизма, создающего 
что-то настолько прекрасное. Я интуитивно знал: для того чтобы самому рассказать хорошую историю, сначала нужно собрать эти маленькие единицы информации. Именно так сформировалось мое отношение к данным.
В сегодняшнюю цифровую эпоху данные используются для создания историй о том, кто мы такие, как мы себя представляем, что нам 
нравится и когда мы хотим чего-то. Для того, чтобы проложить тропинку с уникальными виртуальными следами. Машины теперь знают 
о нас больше, чем мы сами, благодаря всем доступным им данным. 
Они читают наши личные данные как сборник рассказов о нас. И в науке о данных замечательно то, что любая дисциплина сегодня записывает свои данные, а это значит, что, освоив профессию аналитика 
данных, мы также можем стать космонавтами, танцорами и врачами, 
о чем так сильно мечтали.
Мало кто знает, что работать с данными в конечном итоге означает быть рассказчиком, передающим информацию. Так же, как 
и структурные компоненты историй, проекты по анализу и обработке данных тоже организованы логически. В книге «Работа с данными в любой сфере» четко выделяются пять этапов, которые составляют то, что я называю процессом обработки и анализа данных. 
Это не единственный подход, который можно использовать, но он 
обеспечит нашему проекту связь с практикой и продвижение к логическому завершению. И он четко и ясно структурирован, что мне 
так нравилось в детстве.
И вот я решил рассказать историю данных…

Нояабсолютный новичок

Наука о данных фактически является одной из тех областей, которые 
извлекают выгоду из опыта других сфер. Я надеюсь, что многие мои 
читатели уже весьма преуспели в той или иной профессии. Хорошо. 
Вы ничего не потеряете, если обратитесь к науке о данных, работая 
в другой области. Отнюдь не вредно для начала разбираться в чем-то 

Работа с данными в любой сфере
10

еще. Это своего рода фундамент, который вам пригодится, чтобы стать 
хорошим аналитиком данных.
Начав работать в транснацио нальной консалтинговой компании 
Deloitte, я не знал ни одного из алгоритмов, которые мы рассмотрим 
в этой книге. Да никто от меня этого и не ожидал. Совсем немногие 
начали свою карь еру с науки о данных. Прочитав книгу, вы обнаружите, что те, кто добился успеха в этой сфере, даже не думали о ней, 
пока находились в начале своей карь еры. Итак, отбросьте страх перед 
цифровой неграмотностью — взяв эту книгу, вы сделали первый шаг 
на пути в мир науки о данных.

Эй, агде код?

Если вы, как и я, пролистываете книгу, прежде чем приступить к чтению, то, возможно, заметили, что вам не встретилось ни одной строки 
кода. Я слышу, как вы говорите: «Но это ведь книга о науке о данных, 
так что же происходит?» Наука о данных — чрезвычайно широкий 
предмет. «Работа с данными в любой сфере» погружает вас в тему 
и вдохновляет на размышления о том, как эта дисциплина может 
быть включена в вашу текущую или будущую деловую практику. Вы 
узнаете методы науки о данных — потому что ее «ингредиенты» (код) 
легко доступны онлайн. Если воспользоваться аналогией с приготовлением пищи, перед вами в меньшей степени просто книга рецептов 
и в большей — подробная информация об основных методах, используемых в науке о данных. Изучите их тщательно, и вы начнете интуитивно понимать, почему вам нужно применять определенные коды 
и методы, — гораздо более эффективный подход к обучению, чем 
просто предоставление строк кода для подключения к вашему проекту.

Как пользоваться этой книгой

Я написал эту книгу специально для того, чтобы вы могли обратиться 
к ней, где бы вы ни находились — в поезде, в ванне, в ожидании человека своей мечты. Читайте ее по частям или в один присест, по главам, 

Введение
11

выбирая самое лучшее, выделяя нужное желтым маркером, наклейками. В начале каждой части вы найдете краткое введение, помогающее быстро определить, какая глава окажется для вас наиболее интересной. Часть первая более объемна, она дает общее представление 
о науке о данных. Вторая и третья части сосредоточены на процессах 
анализа и обработки данных, интуиции, стоящей за некоторыми из самых мощных на сегодняшний день аналитических моделей, и на том, 
как повысить ваши шансы на успех, совершая первые шаги в направлении цели.
Если вы новичок, то получите максимальную отдачу от книги, 
прочитав ее от корки до корки. Если вы знакомы с наукой о данных 
как с дисциплиной и хотите добраться до сути того, как применять 
ее методы, не стесняйтесь обратиться к главе, которая вам больше 
всего поможет.

Доступ онлайн
190 ₽
В корзину