Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Математический анализ генетического кода

Покупка
Артикул: 620405.03.99
В монографии на основе изучения генов установлены новые свойства генетического кода и вычислены важнейшие его интегральные характеристики; выделены две группы таких характеристик. Установлена взаимосвязь полученных характеристик в этих группах. Проанализирован известный к настоящему времени набор генов, в том числе человеческого генома; получен ряд неизвестных ранее эффектов. Для научных работников, преподавателей и студентов, специализирующихся в области математического моделирования в науках о живом.
Козлов, Н. Н. Математический анализ генетического кода : монография / Н. Н. Козлов. - 4-е изд. - Москва : Лаборатория знаний, 2023. - 226 с. - (Математическое моделирование). - ISBN 978-5-93208-617-9. - Текст : электронный. - URL: https://znanium.ru/catalog/product/1981569 (дата обращения: 22.05.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Москва
Лаборатория знаний
2023

МАТЕМАТИЧЕСКИЙ АНАЛИЗ
ГЕНЕТИЧЕСКОГО КОДА

Н.Н. Козлов

4е издание, электронное

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

УДК 575+573+519.8
ББК 28.04+22.18
К59

С е р и я
о с н о в а н а
в
2009 г.
Козлов Н. Н.
К59
Математический
анализ
генетического
кода
/
Н. Н. Козлов. — 
4-е изд., электрон. — М. : Лаборатория знаний, 2023. —
226 с. — (Математическое моделирование). — Систем. требования:
Adobe Reader XI ; экран 10". — Загл. с титул. экрана. — Текст :
электронный.
ISBN 978-5-93208-617-9
В монографии на основе изучения генов установлены новые свойства
генетического кода и вычислены важнейшие его интегральные характеристики; 
выделены две группы таких характеристик. Установлена взаимосвязь
полученных характеристик в этих группах. Проанализирован известный
к настоящему времени набор генов, в том числе человеческого генома;
получен ряд неизвестных ранее эффектов.
Для научных работников, преподавателей и студентов, специализирующихся 
в области математического моделирования в науках о живом.
УДК 575+573+519.8
ББК 28.04+22.18

Деривативное издание на основе печатного аналога: Математический
анализ генетического кода / Н. Н. Козлов. — М. : БИНОМ. Лаборатория
знаний, 2010. — 215 с. : ил., [8] с. цв. вкл. — (Математическое моделирова-
ние). — ISBN 978-5-9963-0119-5.

Первый тираж осуществлен при финансовой поддержке
Российского фонда фундаментальных исследований по проекту № 09-01-07047

В соответствии со ст. 1299 и 1301 ГК РФ при устранении ограничений,
установленных
техническими
средствами
защиты
авторских
прав,
правообладатель вправе требовать от нарушителя возмещения убытков
или выплаты компенсации

ISBN 978-5-93208-617-9
© Лаборатория знаний, 2015

ПРЕДИСЛОВИЕ

Монография Н. Н. Козлова «Математический анализ генетического кода»
посвящена оригинальным исследованиям в области биоматематики. Круг
научных интересов автора чрезвычайно широк. Ранее мы совместно
выполнили ряд работ по анализу космических траекторий и эволюции
структур, начиная с изучения движения ИС Луны и галактик до матема-
тического моделирования процесса структуризации вторичных структур
РНК. Последняя тема относится к биоматематике, автор приступил
к работе над ней после того, как я предложил ему обратиться к задачам
молекулярной биологии.
Задача, о которой идет речь в монографии, была впервые по-
ставлена автором позднее и активно мною поддерживалась. На ос-
нове 15 работ автора в ДАН, которые были опубликованы вплоть
до 2008 г., была написана данная монография. Используя большой
опыт исследования сложных природных дискретных систем различных
типов, автор нашел свой оригинальный подход к решению постав-
ленных задач. Исследование начиналось с анализа перекрывающихся
генов, которые представлялись одним из типов сложных взаимосвя-
занных систем. Однако исследование показало, что такие гены яв-
ляются хорошей площадкой для анализа свойств генетического кода.
Было доказано (теорема для генетического кода), что структура гене-
тического кода содержит феноменальные возможности для построения
генетических перекрытий различных типов. Полученные результаты
привели к постановке задачи о взаимосвязи генетических перекры-
тий и вариабельности кода, а также к исследованию неперекрыва-
ющихся генов. В конечном итоге возник новый подход в изучении
больших геномов, в том числе генома человека. Была изучена также
установленная автором математическая аналогия между генетически-
ми перекрытиями и стеблями вторичной структуры матричных РНК.
Интегральные характеристики генетического кода, введенные автором,
позволяют с новых позиций изучать структуру кода. Открытие но-
вых, неизвестных ранее свойств генетического кода с неожиданной
стороны осветили проблему происхождения кода и его эволюции.
Сказанное свидетельствует о глубине проникновения автора в суть

Предисловие

рассматриваемых фундаментальных проблем. При этом полученные
оригинальные результаты не имеют аналогов в зарубежных исследова-
тельских работах.
В связи со сказанным выше считаю исключительным важной публи-
кацию данной монографии.
Академик Т. М. Энеев,
9 сентября 2009 г.

ПРЕДИСЛОВИЕ АВТОРА

В каждой естественной науке заключено
столько истины, сколько в ней математики.

И. Кант

Автора могут упрекнуть в том, что, как математик, он не вправе
указывать биологам, что же таится в структуре генетического кода.
Однако, оглядываясь назад, на всю историю открытия такого феноме-
на, как генетический код, можно сказать, что именно неспециалисты
внесли решающий вклад в постановку задачи о существовании кода, его
структуре и свойствах. У истоков проблемы стоял Г. Мендель (ученик
Доплера!), который в 1866 г. установил, что передача наследственных
признаков потомству определяется независимыми факторами, которые
позже получили название генов. Практически через 80 лет физик
Э. Шредингер, а позднее астрофизик Г. Гамов и физик Ф. Крик внесли
решающий вклад в постановку задачи и прояснение принципиальных
аспектов, связанных с проблемой генетического кода (см. работы [1–5]).
Было выяснено, что ДНК является носителем генетической информации,
в 1953 г. определена пространственная структура ДНК, доказано суще-
ствование первичной структуры у белка (см. п. 4 из монографии [6],
а также работы [7, 8]), после чего был экспериментально установлен
генетический код. Практически в ходе проведения всех названных
исследований возникала новая наука — молекулярная биология. После
завершения гигантского международного проекта по геному человека
(1990–2003 гг.) в ней наступила постгеномная эпоха. Как известно,
стоимость этого проекта оценивалась в 3 млрд долларов, а его завер-
шение было приурочено к 50-летию классической работы [7]. Впервые
объединенная коллекция статей по человеческому геному была пред-
ставлена в журнале «Nature» в 2006 г.; она составлена по публикациям
2001 г. для отдельных хромосом, с включением последующих коммента-
риев [9].
К настоящему времени расшифровано относительно небольшое чис-
ло других больших геномов. Ситуация существенным образом изменится
в ближайшие годы в связи с внедрением новейших методов расшиф-
ровки. В конце 2006 г. был объявлен конкурс на премию в 10 млн
долларов, которая будет вручена создателям быстрого и дешевого метода
расшифровки (см. статью [10]). Среди условий конкурса — возможность

Предисловие автора

расшифровать 100 любых человеческих геномов за 10 дней. Создание
такого метода приведет к резкому возрастанию числа геномов боль-
ших размеров, которые будут расшифрованы уже в ближайшие годы.
Принципиально важно, что создание такого метода откроет возможность
расшифровать геномы, которые по оценкам генетиков на порядок и более
превосходят человеческий. Математический анализ огромных объемов
подобной информации приобретает особую актуальность. При этом наи-
более значимыми становятся исследования, связанные с поиском новых
постановок, которые ранее не обсуждались. Именно такие постановки
позволят по-новому подойти к изучению громадной по объему и неверо-
ятно таинственной информации, которой мы уже обладаем. Результаты
одного из таких исследований представлены в данной монографии.
Итак, к настоящему времени молекулярная биология уже стала про-
изводителем гигантских по объему экспериментальных данных, осмыс-
ление которых невозможно без математических методов и алгоритмов.
Многолетний опыт математического моделирования с применением ЭВМ
от легендарной «Стрелы» вплоть до самых современных супер-ЭВМ
позволяет сформулировать важный вывод. Принципиально новые резуль-
таты при работе с гигантской генетической информацией могут быть
получены только при использовании новых подходов, которые в своей
основе учитывают сущность генетической информации, ее отличие от су-
губо физической или химической информации. Именно такой подход
оказался с успехом примененным к решению задач, о которых идет речь
в данной монографии. Кратко опишем его.
В основе исследования лежат экспериментальные данные по необычным 
способам записи генетической информации, так называемым перекрывающимся 
генам, когда один и тот же участок ДНК кодирует два
белка. К началу данного цикла исследований уже были экспериментально
установлены все пять случаев парных генетических перекрытий, которые
разрешаются структурой ДНК. Пониманию этого феномена во многом
способствовало то, что уже к 1992 г. объем публикаций по перекрытиям 
генов был значительным и все более и более увеличивался.
Это были публикации в журналах Nature, Cell, J. Mol. Biol., J. Virol.,
Genetics, The J. Biological Chemistry, J. Vol. Evol. и др. Первоначально
в исследовании речь не шла о свойствах генетического кода. Вопрос
был поставлен только о потенциальных позициях молчащих мутаций,
которые могут иметь место в областях, занятыми перекрывающимися
генами. Было установлено значительное (на порядок и более) сужение
спектра подобных позиций по сравнению с генами без перекрытий.
При анализе этого спектра для сотен генетических перекрытий были
обнаружены ряд геномов, в которых перекрытия требовали участия всех
смысловых кодонов. Стало ясно, что из перекрытий можно каким-то

Предисловие автора
7

образом выявить неизвестное свойство структуры генетического кода.
Была поставлена задача изучения потенциала генетического кода, кото-
рый использован природой для всех пяти случаев перекрытий. Главный
результат был представлен теоремой для стандартного (первоначальное
название — универсального) генетического кода (см. работы [11, 12]).
Биологические следствия из нее позволили обратиться к анализу экс-
периментальных данных по всем девиантным генетическим кодам, или
кодам, отклоненным от стандартного. Однако в рамках генетических
перекрытий не удалось объяснить функциональную значимость всех
переосмысленных кодонов, или кодонов, которые изменили свой смысл
по сравнению со стандартным кодом. Путей дальнейших исследований
было несколько. Требуемое решение было найдено при исследовании
областей ДНК, где гены не перекрываются, а подчиняются принципу,
сформулированному как предположение в 1941 г.: один ген отвечает за
один белок (см. работу [13]). Таких генов — подавляющее большинство;
на сегодня это миллиардные нуклеотидные последовательности боль-
ших геномов (в том числе человека).
Как видим, на всех этапах исследования наши математические
утверждения подтверждались или дополнялись разнообразными экспе-
риментальными данными, а именно: многими случаями перекрытий пар
генов, в том числе записанными нестандартными кодами, полным набо-
ром природных нестандартных кодов, полными кодирующим областями
больших геномов, в том числе генома человека. В ходе проведения
данного исследования был использован наш опыт проведения более
ранних работ по изучению эволюции и структуры сложных природных
и технических дискретных систем с большим числом взаимодействую-
щих элементов.
Представим кратко эти исследования, в которых я принимал участие.
Из этого представления станет ясно, что перекрывающиеся гены, с кото-
рых были начаты наши исследования, есть еще одна достаточно сложная
система, состоящая из большого числа взаимозависимых элементов.
Перед представлением первой из таких задач следует отметить, что
именно это исследование в итоге привело нас к биологической проблема-
тике. Речь идет об изучении гравитационного взаимодействия галактик
по компьютерной программе, созданной первоначально для изучения
движения искусственного спутника Луны в поле тяготения, где помимо
центрального тела учитывались масконы — вкрапления некоторого коли-
чества тел, которые были установлены экспериментально в статье [15].
Результаты изложены в работе [14] по космическим исследованиям, в ко-
торых заметное место занимали исследования по оптимизации процесса
траекторных измерений в случае ИС Марса (см. также статьи [16–20]
и рис. В.1).

Предисловие автора

Рис. В.1. Оптимальные сеансы измерений радиальной скорости на одном обороте
ИС Марса [17]. Приводятся решения для наилучшего определения минимального
расстояния до Марса. Сеансы располагаются по времени (спектры) и по истинной
аномалии (на орбитах). Время 1, 2, 4, 12 — допустимое время измерений в часах,
период обращения спутника — 24 часа

Предисловие автора
9

ГРАВИТАЦИОННОЕ ВЗАИМОДЕЙСТВИЕ ГАЛАКТИК

При близком пролете массивного тела мимо галактики, как показали чис-
ленные эксперименты, возникают специфические приливные эффекты,
появляются спиральные ветви, значительные отклонения от плоскости
диска, искажения поля скоростей вещества, падение газа на плоскость
галактик. Качественный анализ и численный эксперимент позволили
выявить основные эффекты, возникающие при характерных вариантах
гиперболического пролета массивного тела относительно галактик: пер-
пендикулярно ее плоскости, над плоскостью и в плоскости по направ-
лению и против направления вращения галактики. Анализировалось
поведение до 2000 невзаимодействующих между собой точек-спутников,
двигавшихся первоначально по круговым кеплеровским орбитам вокруг
центральных областей галактики и возмущаемых при близком пролете
массивного тела (см. статьи [21–26]). На основе расчетов в 1973 г. был
создан компьютерный кинофильм продолжительностью около 15 минут.
Оценка этой работы дана Президентом АН СССР, академиком М. В. Кел-
дышем на торжественном заседании, посвященном двадцатилетию со-
зданного им ИПМ. Приводим выдержку из его доклада[27]. «Ярким
примером успешного применения машинных расчетов к классической
задаче является работа по гравитационному взаимодействию галактик.
Изготовленный вычислительной машиной кинофильм наглядно пока-
зывает образование у галактик спиральной структуры. По-видимому,
именно таким путем возникла спиральная структура нашей собственной
галактики» На рис. В.2 представлены 6 кадров из около 2000 кадров
одного из вариантов такого пролета.
Все 7 эпизодов пролета (по 6 кадров в каждом) представлены в статье [
25]. Создание наиболее полной версии кинофильма было приурочено 
к чрезвычайной сессии МАС, посвященной 500-летию Коперника,
проходившей в 1973 г.. Первоначальным местом проведения этой сессии
бала выбрана Австралия, где в заседала галактическая секция. Однако
затем некоторые секции были перенесены на родину Коперника, где
на секциях небесной механики и астрофизики, и был впервые показан
этот кинофильм. Лишь много лет спустя зарубежным специалистам была
представлена только цифровая копия фильма на конференции Dynamics
of Galaxies. (Санкт-Петербург, 2007 г.)

МОДЕЛЬ АККУМУЛЯЦИОННОГО ПРОЦЕССА
ФОРМИРОВАНИЯ ПЛАНЕТНЫХ СИСТЕМ

Рассматривалась эволюция плоского протопланетного облака, состоящего 
из большого числа гравитационно взаимодействующих и объединяющихся 
при контактах тел (протопланет), движущихся в поле цен-

Предисловие автора

Рис. В.2. Фрагменты кинофильма (ИПМ, 1973 г.) относятся к варианту пролета
тела с массой равной массе галактики, пролетающего вблизи галактического диска (
с параметрами порядка нашей галактики), перпендикулярно его плоскости с
удвоенной параболической скоростью. Время Т дается в миллиардах лет, момент
T = 0 соответствует моменту наибольшего сближения (см. статьи [24, 25])