Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

NGS: высокопроизводительное секвенирование

Покупка
Артикул: 486210.04.99
Рассмотрены различные варианты и особенности современных методов определения структуры нуклеиновых кислот (методов секвенирования второго и третьего поколений). Описаны принципы наиболее популярных технологий высокопроизводительного секвенирования (NGS). Дана классификация высокопроизводительных методов секвенирования по нескольким параметрам. Приведены основные элементы первичного анализа данных масштабного секвенирования. Отдельные главы посвящены применению NGS для решения различных биологических задач: секвенирования прокариотических и эукариотических геномов и транскриптомов, метагеномного секвенирования, а также использованию NGS в медицинской практике. Для сотрудников генно-инженерных и медицинских диагностических лабораторий, а также для преподавателей и студентов, специализирующихся в области молекулярной биологии и биотехнологии.
NGS: высокопроизводительное секвенирование : монография / Д. В. Ребриков, Д. О. Коростин, Е. С. Шубина, В. В. Ильинский ; под общ. ред. Д. В. Ребрикова. - 3-е изд. - Москва : Лаборатория знаний, 2020. - 235 с. - ISBN 978-5-00101-654-0. - Текст : электронный. - URL: https://znanium.com/catalog/product/1200533 (дата обращения: 26.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
УДК 577.21+616
ББК 28.04

Р31

А в т о р ы:
Д. В. Ребриков, Д. О. Коростин, Е. С. Шубина,
В. В. Ильинский
Ребриков Д. В.

Р31
NGS: высокопроизводительное секвенирование /
Д. В. Ребриков,
Д. О. Коростин,
Е. С. Шубина,
В. В. Ильинский ; под общ. ред. Д. В. Ребрикова. —
3-е
изд.,
электрон. — М.
:
Лаборатория
знаний,
2020. — 235 с. — Систем.
требования:
Adobe
Reader XI ; экран 10". — Загл. с титул. экрана. —
Текст : электронный.
ISBN 978-5-00101-654-0

Рассмотрены различные варианты и особенности современных
методов определения структуры нуклеиновых кислот (методов
секвенирования второго и третьего поколений). Описаны принципы наиболее популярных технологий высокопроизводительного
секвенирования (NGS). Дана классификация высокопроизводительных методов секвенирования по нескольким
параметрам.
Приведены
основные
элементы
первичного
анализа
данных
масштабного
секвенирования.
Отдельные
главы
посвящены
применению NGS для решения различных биологических задач:
секвенирования прокариотических и эукариотических геномов
и
транскриптомов,
метагеномного
секвенирования,
а
также
использованию NGS в медицинской практике.
Для сотрудников генно-инженерных и медицинских диагностических лабораторий, а также для преподавателей и студентов,
специализирующихся в области молекулярной биологии и биотехнологии.
УДК 577.21+616
ББК 28.04

Деривативное издание на основе печатного аналога: NGS: высокопроизводительное секвенирование / Д. В. Ребриков, Д. О. Коростин, Е. С. Шубина, В. В. Ильинский ; под общ. ред. Д. В. Ребрикова. — 3-е изд. — М. : Лаборатория знаний, 2020. — 232 с. :
ил. — ISBN 978-5-00101-255-9.

В
соответствии
со
ст. 1299
и
1301
ГК
РФ
при
устранении
ограничений,
установленных
техническими
средствами
защиты
авторских прав, правообладатель вправе требовать от нарушителя
возмещения убытков или выплаты компенсации

ISBN 978-5-00101-654-0
c○ Лаборатория знаний, 2015

2

ОГЛАВЛЕНИЕ

ПРЕДИСЛОВИЕ Е. Д. СВЕРДЛОВА . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7

ПРЕДИСЛОВИЕ М. С. ГЕЛЬФАНДА . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8

ПРЕДИСЛОВИЕ АВТОРОВ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9

ПЕРЕЧЕНЬ КОМПАНИЙ, УПОМЯНУТЫХ В ТЕКСТЕ . . . . . . . . . . . . . . . . . . . . . . . 11

СПИСОК СОКРАЩЕНИЙ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

ГЛАВА 1. Обзор методов определения последовательности 
нуклеиновых кислот . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

 1.1. Методы, основанные на детекции сигнала 
от множества одинаковых молекул ДНК (методы 
с предварительной амплификацией фрагментов ДНК) . . 14

 1.2. Методы, основанные на детекции сигнала  
от одной молекулы ДНК (секвенирование 
одиночных молекул ДНК) . . . . . . . . . . . . . . . . . . . . . . . . . . 34

 1.3. Другие методы секвенирования . . . . . . . . . . . . . . . . . . . . . 40

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

ГЛАВА 2. Технологии создания библиотек фрагментов ДНК 
для NGS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

 2.1. Очистка нуклеиновых кислот для NGS . . . . . . . . . . . . . . . 45
 2.2. Оценка концентрации нуклеиновых кислот 
и полногеномная амплификация (WGA) . . . . . . . . . . . . . . 46

 2.3. Способы разрушения ДНК для приготовления 
библиотеки  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

 2.4. Оценка длин фрагментов ДНК . . . . . . . . . . . . . . . . . . . . . . 51
  2.5. Присоединение адаптеров . . . . . . . . . . . . . . . . . . . . . . . . . . 52
 2.6. Предварительная амплификация библиотеки. . . . . . . . . . 53
 2.7. Отбор фракции фрагментов нужной длины 
(size-select) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

 2.8. Мечение смешиваемых образцов специфичными 
адаптерами («штрих-кодирование») . . . . . . . . . . . . . . . . . . 56

  2.9. Клональная амплификация фрагментов ДНК  . . . . . . . . . 57
2.10. Типы библиотек фрагментов ДНК для NGS . . . . . . . . . . . 60

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

Оглавление

ГЛАВА 3. Коммерческие технологии высокопроизводительного 
секвенирования  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .66

  3.1. Технология 454 Life Sciences компании Roche  
(эмульсионная ПЦР + пиросеквенирование)  . . . . . . . . . . 66

  3.2. Технология SOLiD компании Life Technologies Thermo 
Fisher Scientific (эмульсионная ПЦР +  
секвенирование лигированием) . . . . . . . . . . . . . . . . . . . . . . 69

  3.3. Illumina Genome Analyser компании Illumina  
(мостиковая ПЦР + секвенирование синтезом) . . . . . . . . 71

  3.4. Платформы Ion PGM и Ion Proton компании Life  
Technologies Thermo Fisher Scientific (эмульсионная  
ПЦР + полупроводниковое секвенирование)  . . . . . . . . . . 74

  3.5. Платформа PacBio компании Pacific Biosciences 
(секвенирование синтезом одиночных молекул)  . . . . . . . 78

  3.6. Платформа Heliscope компании Helicos Biosciences 
(секвенирование синтезом одиночных молекул)  . . . . . . . 80
Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

ГЛАВА 4. Общие принципы обработки данных NGS  . . . . . . . . . . . . 85

  4.1. Оценка качества первичных данных . . . . . . . . . . . . . . . . . 85
  4.2. Сборка геномов de novo . . . . . . . . . . . . . . . . . . . . . . . . . . . .89
  4.3. Алгоритмы сборки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
  4.4. Аппаратные и биологические особенности  
данных NGS  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

  4.5. Объединение контигов в скэффолды . . . . . . . . . . . . . . . . . 97
  4.6. Вариации в близкородственных геномах  . . . . . . . . . . . . 100
  4.7. Картирование прочтений при повторном  
секвенировании . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

  4.8. Поиск однонуклеотидного полиморфизма (SNP) . . . . . . 104
  4.9. Поиск структурных вариаций: протяженных вставок, 
делеций, инверсий и транслокаций . . . . . . . . . . . . . . . . . 105

4.10. Аннотация обнаруженных вариаций  
с использованием баз данных . . . . . . . . . . . . . . . . . . . . . . 106

4.11. Предсказание функциональных и клинически  
значимых изменений белка на основе  
обнаруженных мутаций . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

ГЛАВА 5. Оборудование и программные решения  
для обработки данных NGS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

  5.1. Локальные центры обработки данных NGS:  
архитектура и программные решения . . . . . . . . . . . . . . . 112

  5.2. Программное обеспечение для локального центра 
обработки данных NGS . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

Оглавление

  5.3. Сетевые сервисы и простые решения  
для обработки данных NGS  . . . . . . . . . . . . . . . . . . . . . . . 117

  5.4. Специализированные проекты по обработке  
данных NGS  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

ГЛАВА 6. Планирование эксперимента  
с использованием NGS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

  6.1. Общие принципы планирования биологических 
экспериментов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

  6.2. Рандомизация в NGS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
  6.3. Повторности в NGS  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
  6.4. Основные типы ошибок при секвенировании . . . . . . . . . 125
  6.5. Варианты применения NGS  . . . . . . . . . . . . . . . . . . . . . . . 126

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

ГЛАВА 7. Секвенирование индивидуальных геномов  
и транскриптомов прокариот  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

  7.1. Роль NGS в микробиологии  . . . . . . . . . . . . . . . . . . . . . . . 128
  7.2. История секвенирования бактериальных геномов . . . . . 129
  7.3. Определение полной последовательности  
бактериального генома de novo . . . . . . . . . . . . . . . . . . . . .130

  7.4. Пример протокола секвенирования образца  
бактериальной ДНК . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

  7.5. Анализ данных геномного секвенирования  
бактерий  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

  7.6. Секвенирование транскриптома прокариот . . . . . . . . . . . 142

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

ГЛАВА 8. Исследование микробных сообществ  
методами NGS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

  8.1. Очистка ДНК для метагеномных исследований . . . . . . . 147
  8.2. Анализ микробного сообщества секвенированием 
ампликонов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

  8.3. Метагеномное секвенирование  . . . . . . . . . . . . . . . . . . . . . 151
  8.4. Биоинформатический анализ данных метагеномного 
секвенирования . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152

  8.5. Комбинированный алгоритм анализа  
таксономического состава сообщества . . . . . . . . . . . . . . . 154

  8.6. Сравнение метагеномов между собой . . . . . . . . . . . . . . . . 155
  8.7. Метатранскриптом . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

Оглавление

ГЛАВА 9. Секвенирование геномов эукариот . . . . . . . . . . . . . . . . . . . 162

  9.1. Общие аспекты секвенирования сложных геномов . . . . 162
  9.2. Секвенирование эукариотических геномов de novo . . . .164
  9.3. Повторное секвенирование (ресеквенирование)  . . . . . . . 166
  9.4. Фазирование при ресеквенировании диплоидных  
геномов  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

  9.5. Секвенирование генома отдельной клетки . . . . . . . . . . . 171

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

ГЛАВА 10. Секвенирование транскриптомов эукариот . . . . . . . . . . 176

10.1. Применение NGS для исследования РНК . . . . . . . . . . . . 176
10.2. Общие моменты очистки РНК и синтеза кДНК  . . . . . . 178
10.3. Ферменты для обратной транскрипции . . . . . . . . . . . . . . 180
10.4. Подготовка библиотеки кДНК для NGS . . . . . . . . . . . . . 182

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

ГЛАВА 11. Повышение концентрации определенных 
последовательностей в библиотеке для NGS 
(таргетное секвенирование) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

11.1. Параметры методов целевого обогащения . . . . . . . . . . . . 191
11.2. Обогащение библиотеки фрагментов ДНК только  
на основе ПЦР  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

11.3. Обогащение библиотеки фрагментов ДНК  
при помощи гибридизации с пробой . . . . . . . . . . . . . . . . 198

11.4. Обогащение при помощи гибридизации в растворе  
с отбором методом ПЦР (инвертированные  
молекулярные пробы)  . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

11.5. Обогащение библиотеки белок-связывающими 
последовательностями хроматина (ChIP-Seq) . . . . . . . . . 203
Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206

ГЛАВА 12. Применение высокопроизводительного  
секвенирования в медицинской практике  . . . . . . . . . . . . . . . . . . . . 207

12.1. Генетическое тестирование с использованием NGS . . . . 207
12.2. Исследование патогенов и микробиома человека  . . . . . 220

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222

ГЛАВА 13. Перспективы высокопроизводительного  
секвенирования  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

Предметный указатель  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228

ПРЕДИСЛОВИЕ Е. Д. СВЕРДЛОВА

Нельзя не заметить, что методы молекулярной биологии 
со временем становятся все сложнее и дороже, и, вместе с тем, 
теряют в разнообразии. Многие задачи на этапе планирования эксперимента сводятся к типовым методическим шагам, 
выполняемым по принципу «заказа услуг на стороне». Уход 
сложных и дорогостоящих методов в сервисные центры, наряду с очевидными преимуществами такой специализации, имеет и ряд негативных последствий. Поверхностное знание методов исследования, провал между биологическим материалом 
и данными в компьютере приводят к непониманию границы 
возможностей используемых методик.
Стремительное развитие методов секвенирования в последние годы привело к ощущению, что с их помощью можно 
решить любые задачи генетики. Тем не менее высокопроизводительное секвенирование, как и любой другой метод, имеет 
ряд ограничений. Так, вопреки распространенному мнению, 
NGS не является панацеей при исследовании мультифакторных заболеваний и лишь помогает чуть быстрее выполнить 
определенные методические шаги.
Данная книга пытается сдержать растущий провал между 
объектом и анализируемыми данными, подробно и с практическими рекомендациями, перечисляя все этапы технологии 
NGS. 

Е. Д. Свердлов,
академик РАН и РАСХН, советник РАН

ПРЕДИСЛОВИЕ М. С. ГЕЛЬФАНДА

Как говорил один известный политический деятель, это 
«очень своевременная книга». Современные секвенаторы, наконец, начали появляться в российских лабораториях. Некоторые исследователи заранее знали, что они собираются 
изучать при помощи этих приборов, и готовились к их появлению, многие – лишь заполучив чудесную машинку, задумались, к чему же ее применить, третьи – только рассматривают 
возможность закупки в приложении к своим текущим задачам. Книга будет полезна исследователям из всех трех категорий. Первым – как набор ссылок на современные методы анализа данных и подготовки материалов, третьим – как пособие 
по выбору адекватной платформы и сборник практических советов, вторым же (если им вообще что-то может помочь) – как 
намек на то, что интересное можно было бы сделать.
Книга хорошо сбалансирована. В ней есть история методов 
секвенирования, биофизические и биохимические основы современных технологий, сравнение возможностей и недостатков платформ, описаны основы пробоподготовки, сведения о 
методах биоинформатического анализа получаемых данных, 
типичные задачи, решаемые при помощи таких приборов. 
Описания лаконичные, но точные, а обильные ссылки дадут 
возможность заинтересованному читателю глубже изучить 
конкретные проблемы. Книга глубоко погружена в современный российский контекст, и в ней имеются советы, которые не 
встретишь в стандартном обзоре: от необходимости проверить 
надежность энергоснабжения научного учреждения до правильной планировки серий экспериментов с целью экономии 
расходных материалов и организации совместной работы экспериментаторов и биоинформатиков и т. п.
Думаю, что эта книга необходима в каждой молекулярнобиологической лаборатории. В духе авторов добавлю, что желательно в нескольких экземплярах, один из которых будет 
храниться в сейфе завлаба и выдаваться под расписку.

Михаил Гельфанд, д-р биол. наук, 
профессор, член Academia Europaea

ПРЕДИСЛОВИЕ АВТОРОВ

Учителю
Льву Абрамовичу Остерману
посвящается

Развитие науки базируется на методах исследования. Создание новых технологий всегда приводило к прорыву в определенной области знаний. Причем зачастую развитие какогото методического направления неожиданно дает эффект в 
иной (даже не смежной) научной области. Бурное развитие 
цитологии в какой-то момент стало следствием прогресса в 
области изготовления стеклянных линз. Появление методов 
высокопроизводительного секвенирования (next generation 
sequencing, NGS) стало возможно благодаря развитию компьютерной индустрии, технологий изготовления микропроцессоров и цифровых носителей информации. Оказалось, что 
эти же элементы могут быть использованы в совершенно ином 
назначении: для работы с биологическими макромолекулами. 
Так синтез микроэлектроники и биохимии дал новый метод 
исследования живых систем – секвенирование второго поколения. Вместе с тем вовремя подоспели адекватные вычислительные мощности для обработки получаемых данных.
Следует отметить, что кроме использования наработок из 
микроэлектроники технологии NGS включают в себя и ряд 
предшествующих молекулярно-биологических методик, в 
частности полимеразную цепную реакцию (ПЦР) и гибридизацию на микрочипах.
Изобретение и внедрение в практику технологий высокопроизводительного секвенирования вывело на новый уровень 
такие направления науки, как генетика, молекулярная биология, дало стимулы для становления персонализированной медицины. Сегодня область высокопроизводительного секвенирования объединяет широкую гамму различных технологий, 
базирующихся на разных принципах и разработанных более 
или менее независимо. В этой книге коллектив авторов, имеющих собственный опыт работы с технологиями NGS, излагает 
принципы основных современных методов высокопроизводи
Предисловие авторов

тельного секвенирования. Рассмотрены особенности наиболее 
популярных технологий секвенирования, формат типовых задач для NGS, варианты обработки биоинформатических данных, стандартные ошибки каждого из этапов исследования. 
Авторы постарались структурировать и систематизировать 
существующие подходы, сделав акцент на общих принципах 
и существенных отличиях.
Несколько слов о терминах. В 2011 году, в предисловии к 
переводу девятого издания книги Б. Льюина «Гены» редактор 
отечественного издания сказал по этому поводу, что «…по прошествии 3–5 лет в зоне.ру килобазы вытеснят т. п. н., а последовательность нуклеотидов окончательно превратится в сиквенс». Пожалуй, наступил тот момент, когда написать книгу 
об NGS, не используя термин «секвенирование», сложнее, чем 
согласиться с его появлением в русском языке. Однако не все 
позиции сданы авторами без боя, «т. п. н-ы» пока остались, 
а при выборе между «штрих-кодом» и «бар-кодом» предпочтение отдано первому варианту. 
Отдельно следует сказать о термине «NGS». В лабораторной практике строжайше запрещено указывать на емкости с 
реагентом «new», ввиду неинформативности данного обозначения. Авторы сочли некорректным использование термина 
«секвенирование следующего поколения» – буквального перевода с английского (next generation sequencing) – для обозначения современных технологий секвенирования, прямо указывая на поколение методов или обозначая их как высокопроизводительные (что, безусловно, тоже относительно).
Авторы выражают благодарность коллегам, помогавшим 
на разных этапах подготовки рукописи: Дмитрию Алексееву 
(ФГБУН НИИ ФХМ, Москва), Андрею Гаража (ООО «Первый 
онкологический научно-консультационный центр», Москва), 
Игнатию Клесниченко (ООО «Бином», Москва), Николаю 
Равину (Центр «Биоинженерия» РАН, Москва), Владиславу 
Трошину (ООО «Троицкий инженерный центр», Троицк), Сергею Науменко (МГУ имени М.В. Ломоносова, Москва), Петру 
Шаталову (ООО «Генотек», Москва).

ПЕРЕЧЕНЬ КОМПАНИЙ, 
УПОМЯНУТЫХ В ТЕКСТЕ

23andMe
454 Life Sciences
Affymetrix
Agilent Technologies
Amazon
Ambion
Applied Biosystems
Bio-Rad
Celera
Councyl
Covaris
CuraGen Corporation
Digilab
DNA Electronics Ltd.
Dover
Fluidigm Corporation
Helicos Biosciences
Illumina
JewishCare
Life Technologies Thermo Fisher Scientific
Lynx Therapeutics
Nanopore
New England Biolabs
NimbleGen
Pacific Biosciences
Pathway Genomics
Perlegen
Promega
Qiagen
RainDance Technologies
Roche
Sage Science
Solexa
ZS Genetics
Генотек
ДНК-Технология
Евроген

СПИСОК СОКРАЩЕНИЙ

16S рРНК
РНК малой субъединицы бактериальной рибосомы
CGH
сomparative genomic hybridization, сравнительная геномная гибридизация
BAC
bacterial arifichial chromosome, искусственная бактериальная хромосома
cffDNA
сell-free fetal DNA, внеклеточная ДНК плода
ChIP
chromatin immunoprecipitation, иммунопреципитация хроматина
Indel
insertion/deletion, вставка/делеция
MALDITOF
мatrix-assisted 
laser 
desorption/ionization 
time-of-flight, матрично-активированная лазерная десорбция/ионизация с регистрацией 
времени пролета частиц
MIP
molecular inversion probe, инвертированная 
молекулярная проба
NGS
next-generation sequencing, секвенирование 
следующего поколения
OLC
overlap-layout-consensus, перекрытие–расположение–согласованность
P32
изотоп фосфора-32
SBH
sequencing by hybridisation, секвенирование 
путем гибридизации
SNP
single nucleotide polymorphism, однонуклеотидный полиморфизм
SVs
structured variations, большие структурные 
вариации
А (A)
аденин
Г (G)
гуанин
ддНТФ
дидезоксирибонуклеозидтрифосфат
ДНК
дезоксирибонуклеиновая кислота
дНТФ
дезоксирибонуклеозидтрифосфат
кДНК
комплементарная ДНК
НК
нуклеиновая кислота
п. н.
пара нуклеотидов
ПЗС-матрица
считывающая матрица прибора с зарядовой 
связью
ПЦР
полимеразная цепная реакция
РНК
рибонуклеиновая кислота
Т (T)
тимин
т. п. н.
тысяча пар нуклеотидов
Ц (С)
цитозин

ГЛАВА 1

ОБЗОР МЕТОДОВ ОПРЕДЕЛЕНИЯ 
ПОСЛЕДОВАТЕЛЬНОСТИ 
НУКЛЕИНОВЫХ КИСЛОТ

В данной главе приводится краткий обзор различных подходов к определению последовательности нуклеиновых кислот. К настоящему моменту можно выделить три поколения 
технологий секвенирования. К первому поколению относят 
изобретенные в середине 70-х годов ХХ века методы химической деградации (метод Максама–Гилберта) и остановки полимеразы на дидезоксинуклеотидах (метод Сенгера).  Вторым 
поколением принято считать коммерческие технологии высокопроизводительного секвенирования, разработанные в середине 1990-х, хоть и основанные на разных принципах, но 
всегда требующие получения сигнала от множества одинаковых молекул ДНК. В настоящее время на рынок выходят технологии, способные регистрировать сигнал от единственной 
исследуемой молекулы нуклеиновой кислоты. В некоторых 
публикациях такие подходы стали называть секвенированием 
 третьего поколения. Далее мы будем использовать лишь термины « NGS» и « высокопроизводительное секвенирование» 
(как равнозначные), объединяя под ними технологии второго 
и третьего поколений.
Сразу отметим, что методы определения последовательности РНК пока недостаточно эффективны (технологии секвенирования одиночных молекул, позволяющие работать непосредственно с РНК, только начали появляться, см. разд. 3.5 
и 3.6). В то же время превращение РНК в ДНК путем обратной 
транскрипции настолько стандартно, что в настоящее время 
для определения последовательности РНК исследователи почти всегда используют секвенирование кДНК. 
Мы постарались дать максимально широкий спектр подходов к определению последовательности ДНК, несмотря на 
то, что лишь некоторые из них к настоящему моменту нашли 
применение в высокопроизводительном секвенировании (коммерческие технологии NGS более подробно описаны в главе 3).

Глава 1

1.1. МЕТОДЫ, ОСНОВАННЫЕ НА ДЕТЕКЦИИ СИГНАЛА 
ОТ МНОЖЕСТВА ОДИНАКОВЫХ МОЛЕКУЛ ДНК 
(МЕТОДЫ С ПРЕДВАРИТЕЛЬНОЙ 
АМПЛИФИКАЦИЕЙ ФРАГМЕНТОВ ДНК)

Большинство современных методов молекулярной биологии предполагает использование множества идентичных макромолекул для получения детектируемого сигнала. К ним 
относятся различные виды хроматографии, рентгеноструктурный анализ, масс-спектрометрия и т. д. Секвенирование ДНК 
также требует усиления сигнала за счет использования в анализе множества одинаковых молекул ДНК. Ниже рассмотрены подходы с предварительной амплификацией ДНК (путем 
обычного или in vitro клонирования) для получения миллионов 
идентичных фрагментов, забираемых в дальнейший анализ. 

1.1.1. Метод  Максама–Гилберта 
(химическая деградация)

В середине 70-х годов ХХ века исследователями Гарвардского университета (США) Алланом Максамом и Уолтером Гилбертом был разработан метод определения последовательности 
нуклеотидов, основанный на нуклеотид-специфичной химической деградации при обработке ДНК различными химическими агентами [1]. На первом этапе образец ДНК, обычно представляющий собой сравнительно короткий (100–1000 п. н.) 
гомогенный фрагмент (полученный, например, вырезанием 
«полосы» из геля после электрофоретического разделения расщепленной эндонуклеазами плазмиды), с одного из концов метят радиоактивной меткой. Затем образец разделяют на четыре 
части, после чего каждую из частей обрабатывают своим реагентом, приводящим к гидролизу ДНК по конкретным основаниям (или сочетаниям оснований). Параметры каждой реакции 
подбирают таким образом, чтобы гидролиз проходил не полностью, а лишь по некоторым позициям в каждой молекуле ДНК 
(в среднем желательно получить одну модификацию на отдельную молекулу). В результате получают набор «расщепленных» 
фрагментов ДНК, соответствующих по длине местам нахождения нуклеотидов данного типа (рис. 1.1). Например, реакция 
определения положения гуанина выглядит так: при помощи 
диметилсульфата проводят  метилирование  ДНК, в результате 
которого гуанин метилируется по положению 3, а аденин – по 

Методы определения последовательности нуклеиновых кислот

положению 7. Дальнейшая обработка соляной кислотой при 
0С приводит к выпадению из цепи метиладенина (апуринизации по остаткам аденина). Такую ДНК с «пустыми» остатками 
дезоксирибозы в позициях, где был аденин, можно гидролизовать при нагревании в щелочи.  Гидролиз в случае с метилгуанином осуществляют при помощи  пиперидина. Модификации 
по пиримидиновым (Ц и Т) основаниям проводят с гидразином. 
Если реакцию проводить в присутствии NaCl, модификация затронет только Ц. Гидролиз обработанной  гидразином ДНК проводят пиперидином [2].

Рис. 1.1. Принцип метода Максама–Гилберта. Расщепление 
одинаковых, помеченных с одного из концов, фрагментов ДНК 
по разным позициям дает фрагменты разной длины, затем 
фрагменты могут быть разделены при помощи электрофореза в геле