Би-стабильность пирамидального строения NH2-групп азотистых оснований и ее роль в структурно-функциональной организации геномной ДНК | Известия вузов. Физика. 2020. № 8. DOI: 10.17223/00213411/63/8/24

Би-стабильность пирамидального строения NH2-групп азотистых оснований и ее роль в структурно-функциональной организации геномной ДНК

Рассмотрено влияние устойчивого sp 3-гибридного строения валентных орбиталей аминогрупп азотистых оснований на организацию скрытого полиморфизма водородного связывания уотсон-криковских пар. Используя методы компьютерной химии и сравнительной геномики, показана ключевая роль отличий полиморфизма АТ- и GC-пар в инициировании наблюдаемых структурно-функциональных особенностей геномной ДНК.

Bi-stability of pyramidal structure of NH2-group in nitrous bases and ITS role in structure-function organiza.pdf Введение В истории развития отечественной молекулярной спектроскопии работы В.Г. Плотникова занимают особое место. Как специалист-химик свои исследования в области структурной химии и теории процессов безызлучательной дезактивации возбужденных электронных состояний органических соединений В.Г. Плотников начал еще в 60-е годы прошлого столетия. Это было время активного освоения в нашей стране представлений квантовой химии для решения разнообразных молекулярных задач. Выделяя специфику орбитальной природы нижних электронно-возбуж¬денных состояний у разных типов молекул ему удалось развить здесь оригинальный и единый подход для оценки своеобразия соотношения констант скоростей внутренних и интеркомбинационых конверсий. Развитые им к началу 70-х годов эти представления оказались востребованными обширной статистикой экспериментальных данных, накопленных в лаборатории молекулярной спектроскопии НИФХИ им. Л.Я. Карпова (Москва), по люминесцентным характеристикам разных классов ароматических и ненасыщенных соединений. Объединение в данном направлении усилий двух школ привело к созданию уникальной спектрально-люминес¬центной систематики молекул (систематики Р.Н. Нурмухаметова, В.Г. Плотникова и Д.Н. Шигорина [1-4]), в которой наблюдаемые спектральные особенности многоатомных молекул впервые были увязаны с отличительным характером относительного расположения у них электронных состояний различной орбитальной природы. Одному из авторов нынешней статьи (В.М.К.) в свое время посчастливилось работать вместе с В.Г. Плотниковым над детализацией электронного строения молекул класса ароматических и ненасыщенных аминов. Тогда впервые удалось показать, используя расчетные методы полуэмпирической квантовой химии, что появление NH2-группы, имеющей пирамидальное строение своих валентных связей, в электронной системе молекул с сопряженными связями всегда сопровождается эффективным «σ-π-смешиванием электронов». Учет устойчивого sp3-гибридного характера орбиталей аминогруппы дал весьма заметный вклад одно- и двухцентровых матричных элементов в спин-орбитальную связь нижних электронных S- и Т-состояний в таких замещенных. Полученные значения энергии этой связи оказались лежащими в области 1-3 см-1 и существенно превышали величину в 0.3 см-1, считавшуюся ранее характерной для энергии спин-орбитального взаимодействия чистых π-электронных состояний и определяемой преимущественно вкладом трехцентровых матричных элементов. Была также выявлена важная роль возникающей делокализации неподеленной пары l-электронов («lone»-pare electrons) атома азота в формировании смешанной, πl, π*- природы нижних электронно-возбужденных состояний у этих соединений. Все полученные результаты [5-9] нашли свое подтверждение в наблюдаемых величинах радиационных времен жизни нижних Т-состояний, в поляризации Т → S0-переходов, в характере колебательной структуры электронных спектров поглощения и люминесценции молекул ароматических аминов. Развитые представления закрепились тогда в работах и других авторов [10, 11]. Цель данной работы - показать, как факт стабильности пирамидального строения NH2-группы в структуре гетероароматических молекул азотистых оснований оказывается весьма плодотворным и в решении актуальной биофизической проблемы, а именно проблемы структурно-функциональной организации молекулы геномной ДНК. 1. Геномная ДНК. Введение в проблему Собраны убедительные свидетельства того, что большинство генетических процессов в клетке и прежде всего процессов сохранения генетической информации, компактизации нуклеиновых кислот, инициации транскрипции, репарации, трансляции обуславливаются специфическими ДНК-белковыми взаимодействиями и контролируются конформацией молекулы ДНК. Поэтому установление физических факторов, определяющих специфику зависимости вторичной структуры этой молекулы от нуклеотидной последовательности, все еще остается одной из важнейших задач физико-химической биологии. Как известно, предложенная Д. Уотсоном и Ф. Криком более 60 лет назад пространственная организация молекулы ДНК базируется на модели довольно жесткой структуры двойной спирали [12]. Согласно имевшимся на то время рентгеноструктурным данным, плоские пространственно изоморфные комплементарные аденин-тиминовые и гуанин-тиминовые пары азотистых оснований полагались находящимися в плотной параллельной укладке в молекуле ДНК с некоторым поворотом относительно оси спирали. Считалось и продолжает считаться, что наблюдаемые искажения формы регулярной упаковки нуклеотидных пар обусловлены, в основном, влиянием стэкинговых возмущений (межплоскостными взаимодействиями азотистых оснований), свойственным таким складчато-слоистым образованиям (рис. 1). Рис. 1. Идеальная и наблюдаемая экспериментально структуры ДНК В то же время растущий объем данных полногеномного секвенирования различных видов организмов все больше и больше указывает на нетривиальную природу возникновения уникальной гетерогенности нуклеотидных шагов в молекулах нуклеиновых кислот. Фиксируется высокая лабильность и широкий диапазон конформационного полиморфизма структуры ДНК с реализацией разнообразных форм двойной спирали (A-, A'-, B-, -B'-, -B'-, C-, C'-, C''-, D-, E- и Z-форм) с явным доминированием в них деформаций типа «пропеллера», «ступеньки» и «излома» у водородно-связанных пар [13-15]. Выявляется явное «неравноправие» встречаемости комплементарных АТ- и GC-пар в составе геномной ДНК про- и эукариот [16-22]. Ранее нами еще в конце 80-х и начале 90-х годов ХХ в. [23-25] указывалось, что для адекватного описания структурной организации ДНК крайне важен учет обычно пренебрегаемого исходного пирамидального строения экзоциклических аминогрупп аденина, гуанина и цитозина как в формировании непланарности самих этих молекул, так и в инициировании исходной некопланарности строения АТ- и GC-пар при водородном связывании оснований по неплоским NH2-группам. В качестве аргументов послужили собранные нами литературные данные микроволновой спектроскопии по газофазному строению молекул простейших ароматических и ненасыщенных аминов [26-28], аминозамещенных азотистых оснований [29-31] (рис. 2), а также собственные квантово-химические оценки, выполненные на основе полуэмпирических схем расчета [23-25, 32]. Рис. 2. Особенности структуры простейших аминов (аммиака, метиламина, виниламина, анилина) и аминозамещенных азотистых оснований (аденина, гуанина и цитозина) Было показано, что пирамидальное sp3-гибридное строение валентной структуры аминогруппы, несмотря на всю малость своего энергетического выигрыша порядка 1 ккал/моль, всегда остается характерным для неплоской геометрии основного состояния этого типа соединений. Наиболее простым интегральным параметром непланарности молекул можно выделить величину так называемого «инерционного дефекта» Δ = Ic - (Ia + Ib) [33], где Ic - главный, а Ia, Ib - остальные моменты инерции молекулы. Как показывают эксперименты, для аминозамещенных азотистых оснований спектроскопически определяемое значение инерционного дефекта оказывается не столь малым и лежит в области Δ = -0.2 ÷ -0.5 μA2, обозначая, таким образом, вполне возможную исходную устойчивость неплоского строения этих природных «асимметричных волчков». Квантово-химические расчеты удовлетворительно воспроизводят данную величину [34, 35]. Возможно более важным и содержательным для пространственной организации молекулы ДНК является, по нашему мнению, реализация «скрытой» некопланарности и неоднозначности формы водородного связывания пар. Согласно оценкам [34-37], инверсионная би-стабильность пирамидального строения NH2-группы инициирует в основном электронном состоянии изолированной уотсон-криковской АТ-пары возникновение 2-кратного вырождения по энергии формы водородного спаривания оснований. Здесь реализуются структуры с определенным правым и левым «пропеллеровым» разворотом плоскостей оснований. Для случая уотсон-криковской GC-пары характерным оказывается уже повышенный 4-кратный структурный полиморфизм водородного связывания оснований. У этой пары в основном состоянии из-за наличия двух пирамидальных NH2-групп возникают два «пропеллероподобных» и два «ступенькообразных» варианта комплементарного Н-спаривания оснований (рис. 3). На наш взгляд такая неоднозначность исходной формы уотсон-криковских АТ- и GC-пар с неизбежностью, согласно расчетам, должна обуславливать уникальную пространственную гетерогенность упаковки нуклеотидов как в структуре изолированной двойной спирали ДНК (рис. 4) [37], так и в условиях наличия в ней связанной воды [38]. Обычно указанной некопланарностью уотсон-криковских пар часто пренебрегают из-за малости энергетического эффекта [39, 40]. Прямых экспериментальных подтверждений непланарности геометрии изолированных AT- и GC-пар в настоящее время пока нет по причине слабой химической устойчивости азотистых оснований при возгонке их в газообразное состояние. Однако для синтетического аминопроизводного аналога АТ-пары, 2-aminopyridine∙2-pyridone, такие данные есть [41]. Они действительно фиксируют значительную непланарность водородного связывания в этой одиночной паре с участием неплоской NH2-группы. Поэтому весьма справедливо замечание авторов [41] в преждевременности вывода часто цитируемой работы [40] об исходно плоском строении уотсон-криковских пар. К интересным проявлениям такого возможного скрытого полиморфизма водородного связывания нуклеотидов приводят результаты нашего спектрального анализа встречаемости АТ- и GC-пар в геномной ДНК живых организмов, полученные с применением методов сравнительной геномики. Рис. 3. 2-кратный полиморфизм водородного связывания уотсон-криковской (WC) нуклеотидной пары pdT•pdA и 4-кратный полиморфизм пары pdG•pdC. Результаты квантово-химического расчета [37] полуэмпирическим методом PM3 [42, 43] Рис. 4. PM3 рассчитанная структура тетрамерного ДНК дуплекса d(GpGpGpG)•d(CpCpCpC) [37] Далее ниже будут представлены примеры найденных нетривиальных закономерностей: - общее доминирование последовательностей (треков) из уотсон-криковских АТ-пар в нуклеотидной структуре геномной ДНК различных видов эукариот; - оптимизирование участия GC-треков в структуре белок-кодирующих генов человека в этих наиболее важных областях генома; - специфика состава кодонов, предпочтительно используемых (codon usage bias) в структуре белок-кодирующих генов про- и эукариот. Основной упор в обсуждении результатов будет сделан на важнейшей роли исходно низкого структурного полиморфизма уотсон-криковских АТ-пар в формировании их доминирования над GC-парами в составе геномной ДНК для обеспечения бóльшей надежности протекания в клетке генетических процессов дупликации и транскрипции. 2. Доминирование встречаемости уотсон-криковских АТ-пар в структуре геномов разных видов организмов Считается, что ключевым параметром структурно-функциональной организации геномной ДНК является ее GC-состав. При этом часто акцентируют внимание на широком диапазоне данного вклада, от 16 до 75 %, наблюдаемого у разных организмов, [44-46], а также используют имеющиеся корреляции GC-состава с термостабильностью ДНК [47], с термоадаптацией организмов [48], с устойчивостью организмов к УФ-радиации [49], с размером генома [50], с длиной кодирующей последовательности [51], с активностью мутационного процесса [52], со скоростью транскрипции [53], с воздействиями окружающей среды [54]. В качестве основы такого представления берется известный факт о повышенной термодинамической стабильности уотсон-криковских GC-пар, где в Н-спаривании оснований участвуют три водородные связи, а не две, как это имеет место для случая уотсон-криковских АТ-пар. Эксперименты дают соотношения энтальпий Н-связывания пар как ΔН = 20.95 ккал/моль для GC-пары и ΔН = 12.97 ккал/моль для АТ-пары [55]. По нашему мнению, данный весьма упрощенный подход к определению лимитирующего фактора в структурной организации геномов как про-, так и эукариот представляется весьма ограниченным и достаточно противоречивым. Прежде всего, в приводимых доводах о важной роли GC-состава в организации генома чаще всего основной упор делают на широте диапазона этого вклада, свойственным, однако, лишь простейшим микроорганизмам прокариот [45, 46]. Конечно это впечатляет. Вместе с тем статистика распределения данного вида организмов с охватом результатов по 1700 прокариотическим хромосомам и плазмидам показывает еще и другое. Наиболее распространены все же микроорганизмы, которым свойственен довольно высокий вклад уотсон-криковских пар АТ, а не GC-пар в составе своих хромосом [56]. Далее, для большинства геномов более сложных организмов - организмов эукариот и в особенности геномов высших растений, животных и человека хорошо известно, что равновесие между АТ- и GC-парами сильно смещено, как это ни странно, не в сторону GC-, а в сторону АТ-пар [57, 58]. Найдены представители эукариот [59], у которых наблюдают даже очень высокое содержание АТ-пар, доходящее до 81 %!! Наконец, в связи с быстрым развитием технологии секвенирования все больше появляется фактов, говорящих о необычной специфике нуклеотидного состава часто повторяющихся микро- и минисателлитов, а также других, более длинных последовательностей в структуре геномной ДНК. Хотя функции большинства из этих треков четко пока не определены, тем не менее заметные отличия в частотах появления, например треков смешанного типа W(A/T) (W, «weak tracts») и S(G/C) (S, «strong tracts»), в кодирующих и регуляторных областях геномов уже хорошо просматриваются [17, 22, 60-63]. В данном пункте работы в качестве обобщенной картины неравноправного участия АТ- и GC-пар в формировании геномной ДНК эукариот представлены результаты частотного анализа встречаемости мононуклеотидных треков poly(A)n, poly(T)n, poly(G)n, poly(C)n, а также смешанных W(A/T)n- и S(G/C)n-треков переменной длины в геномах семи разных представителей эукариот с разным GC-составом. Исследованы геномы Dictyostelium discoideum (GC ~ 25.7 %), Caenorhabditis elegans (GC ~ 36.9 %), Arabidopsis thaliana (GC ~ 38 %), Drosophila melanogaster (GC ~ 38.8 %), Homo sapiens (GC ~ 42.0 %), Gallus gallus (GC ~ 50.0 %), Leishmania major (GC ~ 59.1 %) (рис. 5). Здесь и далее используемая спецификация треков означает следующее: poly(A)n - это ДНК-мононуклеотидные последовательности длины n, состоящие только из уотсон-криковских АТ-пар; poly(T)n - ДНК-последовательности длины n, состоящие из уотсон-криковских ТА-пар; poly(G)n и poly(C)n - ДНК-последовательности длины n, состоящие только из уотсон-криковских GC- и CG-пар соответственно; смешанные W(A/T)n-треки - это ДНК-последовательности длины n смешанных комбинаций из комплементарных АТ- и ТА-пар; S(G/C)n - это ДНК-последовательности длины n смешанных комбинаций из комплементарных GC- и CG-пар. Полные аннотации геномов взяты из базы GenBank [64]. Спектральный анализ выполнен на основе разработанной нами собственной компьютерной программы с описанием алгоритма в [65]. Как видно из рис. 5, в рассмотренных геномах эукариот частота встречаемости f мононуклеотидных poly(A)n-, poly(T)n- и смешанных W(A/T)n-треков в структуре геномной ДНК как функция длины трека практически всегда оказывается превалирующей над встречаемостью poly(G)n-, poly(C)n- и смешанных S(G/C)n-треков. В случае треков W-типа в структуре ДНК обнаруживаются повторы длиною в сотню, а то и в несколько сотен пар нуклеотидов (пример геномов D.discoideum и H.sapiens (рис. 5, б1 и б5). Для треков S-типа их предельная длина обычно заканчивается где-то в районе длин двух-трех десятков GC-пар. Легко также заметить, что для коротких W- и S-треков одинаковой длины, например в геноме H.sapiens (рис. 5, б5), конкретные частотные отличия их встречаемости могут доходить до нескольких порядков! Подобная картина нетривиального распределения АТ- и GC-пар уже была нами выявлена ранее для случая геномной ДНК простейших микроорганизмов [66]. Было показано, что в довольно большом ряду архейных и эубактериальных хромосом (порядка 400 представителей) в 75 % случаев также характерным оказывается преобладание oligo(A)n- и oligo(T)n-треков над oligo(G)n- и oligo(C)n-треками (где n ≥ 5). Причем эта тенденция сохранялась даже для хромосом, в составе которых GC-пар было явно больше половины. Рис. 5. Частоты встречаемости мононуклеотидных poly(A)n-, poly(T)n-, poly(G)n-, poly(C)n-треков (а) и смешанных W(А/Т)n- и S(G/C)n-треков (б) в геномах: Dictyostelium discoideum (а1, б1); Caenorhabditis elegans (а2, б2); Arabidopsis thaliana (а3, б3); Drosophila melanogaster (а4, б4); Homo sapiens (а5, б5); Gallus gallus (а6, б6); Leishmania major (а7, б7) (см. также с. 30) Рис. 5. Окончание Для прояснения возможного влияния эволюционного фактора на процесс «формирования доминирования» АТ-пар в нуклеотидной организации геномной ДНК живых организмов мы выполнили аналогичный спектральный анализ геномов, по данным из GenBank, для реликтовых представителей эукариот - «мечехвоста» (Limulus polyphemus) и «тихоходки» (Tardigrada), появившихся на Земле около полумиллиарда лет тому назад. Размеры геномов этих эукариот не малы и составляют соответственно у Limulus polyphemus - 2 740 000 000 п.н. и у Tardigrada - 215 000 000 п.н. Чтобы не загромождать статью дополнительным графическим материалом, отметим сразу, что полученные результаты поведения частотных характеристик poly(A)n-, poly(T)n-, poly(G)n-, poly(C)n- и W(A/T)n- и S(G/C)n-нуклеотидных треков подтвердили, как ни странно, существование эффекта доминирования АТ-пар в ДНК у обоих этих организмов. Причем частотные графики во многом оказались похожими на таковые, наблюдаемые для геномов дрозофилы (Drosophila melanogaster), человека (Homo sapiens) и курицы (Gallus gallus) (соответственно рис. 5, а1 и б1, а5 и б5, а6 и б6). Вероятно схожести графиков во многом способствовала близость примерно к 40 % значений GC-состава у всех этих пяти эукариот. Таким образом, из приведенных здесь данных можно сделать вывод, что разным живым организмам присуще общее, необычно стабильное доминирование уотсон-криковских АТ-пар в первичной структуре геномной ДНК. Оно явно говорит о влиянии внутренней фундаментальной особенности строения АТ-пар на формирование такого масштабного эффекта селекции. На наш взгляд, именно изначальная би-стабильность пирамидального строения аминогруппы одиночных оснований с ее главным качеством - спонтанным характером инверсионной перестройки валентных связей атома азота - инициирует естественное правило «отбора». Оно заключается в выборе приоритетного участия определенного типа уотсон-криковских пар при организации свойств геномной ДНК. Исходно повышенный 4-кратный структурный полиморфизм водородного связывания GC-пар выступает фактором, вероятно, наиболее «слабой надежности» этих пар по сравнению с надежностью АТ-пар в обеспечении стабильности протекания в клетке процесса хранения и передачи генетической информации. В качестве примера реализации спонтанных структурных перестроек аминогрупп оснований в комплементарной двойной спирали В-формы ДНК с использованием методов молекулярной механики и полуэмпирического квантово-химического РМ3-метода [42, 43] нами были смоделированы два варианта организации Н-спариваний в нуклеотидном комплексе. Так, рассмотрен изолированный тетрамерный дуплекс, где в роли матричной цепи выступала последовательность вида 5’-AACC-3’, а в роли синтезированной de novo цепи - последовательность 5’-GGTT-3’. Первый случай (рис. 6, а) моделировал структуру комплементарного фрагмента двойной спирали с одной из возможных исходных геометрий водородного связывания у АТ- и GC-пар. В матричной цепи 5’-AACC-3’ аминогруппы оснований рассматривались находящимися в состоянии с наклоном «вниз» (down) своих N-H-связей относительно плоскости основания. В то время как в цепи 5’-GGTT-3’ наклон N-H-связей аминогрупп обоих гуанинов брался в ориентации «вверх» (up) этих связей относительно плоскости основания. Моделировался таким образом вариант «комплементарного сопряжения ДНК-цепочек» с уотсон-криковскими парами в конфигурации AT(WCd), AT(WCd), CG(WCdu) и CG(WCdu). Рис. 6. Компьютерное симулирование вариантов водородного связывания азотистых оснований в структуре В-формы тетрамерного ДНК-дуплекса AACC: а - вариант классического комплементарного Н-связывания оснований с участием неплоских форм AT(WCd), AT(WCd), CG(WCdu) и CG(WCdu) (см. текст); б - вариант водородного связывания оснований после спонтанного изменения «вверх» (up) ориентации N-H-связей NH2-групп у обоих аденинов и у одного из цитозинов в цепи 5’-AACC-3’. При этом в цепи 5’-GGTT-3’ реализована спонтанная ориентация «вниз» (down) N-H-связей NH2-группы только у второго гуанина Второй случай (рис. 6, б) симулировал другую ситуацию Н-связывания оснований в том же фрагменте ДНК. Предполагалось, что перед этим спариванием был реализован процесс расплетания цепочек. В каждой из них произошли спонтанные инверсионные перестройки пирамидальной структуры аминогрупп у некоторых из азотистых оснований. Затем эти две цепи были собраны опять в структуру «комплементарной» двойной спирали. Из рисунка видно, что в таком лишь одном из вариантов спонтанной перестройки формы NH2-групп сама укладка пар в двойной цепи реализовалась уже в другом, довольно сложном виде. Прежде всего, оказался «выпавшим» из уотсон-криковского АТ-спаривания один из тиминов. Кроме того, возникло бифуркационное водородное связывание обоих цитозинов из матричной цепи с одним из гуанинов во 2-й цепи. Но, самое главное, произошла структурная мутация и образовалась новая пара - пара хугстиновского типа AG. И этот вариант укладки нуклеотидов реализовался на той же самой комплементарной двойной последовательности d(AACC)•d(GGTT), что и в первом случае (рис. 6, а). Достаточно очевидно, что подобным способом могут быть реализованы и другие возможные внутренние «спонтанные структурные мутации» в указанном комплементарном фрагменте двойной спирали, которые мы здесь не приводим. Число таких вариантов многочисленно. Оно резко увеличивается именно за счет многообразия вариантов Н-связывания участвующих в таком процессе GC-пар, обладающих своим высоким 4-кратным структурным полиморфизмом. В качестве экспериментального подтверждения гипотезы о фатальной роли уотсон-криков¬ских GC-пар в подобного рода мутационных процессах следует указать на работу V.M. Schaibley с соавт. [67], в которой на довольно большом экспериментальном материале была отмечена корреляция скорости точечных спонтанных мутаций в генах человека с содержанием там GC-пар. Как ни странно, эта скорость действительно возрастает с ростом процентного GC-состава генов! Что и следовало ожидать, согласно приведенным нами выше аргументам. Вполне вероятно, что GC-пары как менее «предсказуемый» элемент в сохранении исходной геометрии своего Н-спаривания, несмотря на повышенную энергию водородного связывания, были попросту «минимизированы» природой в организации геномной ДНК. Достигалась таким способом надежность протекания в клетке генетических процессов дуплицирования и транскрипции, где крайне важна однозначность сохранения пространственной формы комплементарного спаривания оснований. 3. Особенности распределения GC-треков в структуре экзонов генома человека Установленное выше общее доминирование АТ-пар в структуре нуклеотидных последовательностей ДНК живых организмов заставляет обратить внимание на обсуждение другого важного вопроса: где в таком случае и каким образом реализуется геномный GC-состав? Обычно считают, что генным областям ДНК свойственен повышенный GC-состав по сравнению со всем геномом. При этом GC-пары концентрируются преимущественно в кодирующих участках хромосом и GC-состав здесь тем выше, чем больше длина экзона [68]. Рассмотрим геном человека, имеющего ~ 42 % GC-состава. Его диплоидный набор из 23 хромосом содержит, как известно, около 6.4•109 пар нуклеотидов. Суммарная длина белок-кодиру¬ющих, экзонных областей здесь составляет всего лишь 1.5 % от всей ДНК. Поэтому прежде всего можно сказать, что основная часть данного генома, его интронные и межгенные области, вероятнее всего, должны сохранить отмеченный выше доминирующий характер АТ-спариваний в своем составе. Рис. 7. Частоты встречаемости мононуклеотидных poly(A)n-, poly(T)n-, poly(G)n-, poly(C)n- и смешанных W(A/T)n- и S(G/C)n-треков в общем нуклеотидном составе 16-й хромосомы Ниже на рис. 7-11 в качестве примера приведены результаты частотного анализа встречаемости АТ- и GC-треков в нуклеотидной структуре 16-й хромосомы, одной из 23 хромосом человека. Показаны особенности распределения этих треков как в целой хромосоме, так и в отдельных ее составляющих - экзонах, интронах и межгенных областях. Ограничение здесь результатами лишь одной хромосомы во многом определяется достаточно схожим характером полученных графиков для всех хромосом. Возникающие конкретные отличия будут отмечены особо. Как видно из рис. 7-11, частотные распределения мононуклеотидных треков poly(A)n, poly(T)n, poly(G)n, poly(C)n, а также смешанных треков W(A/T)n и S(G/C)n в составе 16-й хромосомы в целом повторяют, как и следовало ожидать, общие черты доминирования АТ-треков, свойственные всему геному человека (рис. 5). Выделилась лишь область экзонов (рис. 10), где возникло локальное инвертирование частот встречаемости АТ- и GC-треков. Конкретный вид соотношения вкладов этих треков в нуклеотидную структуру данной области представлен на рис. 12. Рис. 8. Частоты встречаемости мононуклеотидных poly(A)n-, poly(T)n-, poly(G)n-, poly(C)n- и смешанных W(A/T)n- и S(G/C)n-треков в структуре белок-кодирующих генов 16-й хромосомы Рис. 9. Частоты встречаемости мононуклеотидных poly(A)n-, poly(T)n-, poly(G)n-, poly(C)n- и смешанных W(A/T)n- и S(G/C)n-треков в структуре межгенной области 16-й хромосомы Рис. 10. Частоты встречаемости мононуклеотидных poly(A)n-, poly(T)n-, poly(G)n-, poly(C)n-, и смешанных W(A/T)n- и S(G/C)n-треков в структуре экзонов 16-й хромосомы Рис. 11. Частоты встречаемости мононуклеотидных poly(A)n-, poly(T)n-, poly(G)n-, poly(C)n-, и смешанных W(A/T)n- и S(G/C)n-треков в структуре интронов 16-й хромосомы Рис. 12. Вклады (в %) треков из АТ- и GC-пар в нуклеотидную структуру экзонов 16-й хромосомы человека Оценки показали повышенный GC-состав экзонов у всех хромосом, доходящий иногда до 58 %. Фактически это конкретизирует перераспределение по хромосомам общего GC-состава генома человека, среднее значение которого находится, как известно, в районе 42 %. Выявилась неожиданно интересная особенность в дифференцировке хромосом. Обозначились группы хромосом с довольно близкими значениями GC-состава своих экзонов и с одинаковыми предельными длинами доминирующих в них коротких треков oligo(G)n, oligo(С)n и S(G/C)n (табл. 1). Если к этим наблюдениям привлечь замечание о «повышенной способности» GC-пар к исходным спонтанным структурным перестройкам в системе водородных связей комплементарных двойных цепей, то открывается возможность дополнительной спецификации хромосом по отличительным свойствам своих экзонов (рис. 13). Таблица 1 GC-состав и специфика структуры GC-треков экзонов у разных типов хромосом Тип I II III IV V GC-состав экзонов, % 56-58 53-54 51-52 48-50 45 Локальное доминирование в экзонах треков: S(G/C)n n ≤ 8 n ≤ 5 n ≤ 3 n = 2 - oligo(G)n n ≤ 5 n ≤ 3 n = 2 - - oligo(C)n n ≤ 5 n ≤ 3 n = 2 - - Рис. 13. Дифференциация хромосом генома человека по GC-составу экзонных областей Выделяются пять типов хромосом: I тип - хромосомы 16, 17, 19, 20, 22 с самым высоким GC-составом экзонов, 56-58 %, и с локальным доминированием в них S(G/C)n-треков длины n ≤ 8, а также oligo(G)n- и oligo(С)n-треков длины до пяти пар нуклеотидов. Можно предположить, что этот тип хромосом будет обладать относительно высокой потенциальной предрасположенностью к точечным спонтанным структурным мутациям своих белок-кодирующих областей; II тип - хромосомы 1, 6, 9, 11, 21. Здесь GC-состав экзонов около 53-54 %. Доминируют короткие треки S(G/C)n длины n ≤ 5, а также oligo(G)n- и oligo(С)n-треки длины n ≤ 3. Вполне возможно, что у этого типа хромосом следует ожидать уже более низкий фон частоты точечных спонтанных мутаций экзонов по сравнению с предыдущим типом; III тип - хромосомы 3, 7, 8, 10, 12, 14, 15, Х с пониженным GC-составом экзонов, 51-52 %. Доминируют здесь весьма короткие треки S(G/C)n длины n ≤ 3, а также oligo(G)n- и oligo(С)n-треки с n = 2. Можно ожидать у этого типа хромосом умеренный фон частоты точечных спонтанных структурных мутаций экзонных областей; IV тип - хромосомы 2, 4, 5, 13, 18, Y с еще более низким GC-составом, ~ 48-50 %, своих экзонов. Отличительной чертой этих хромосом является резкое снижение вклада GC-треков в структуре экзонов. Доминирующими остались только очень короткие динуклеотидные треки S(G/C)2. Вероятнее всего этот тип хромосом будет характеризоваться самым низким исходным фоном частоты точечных спонтанных мутаций экзонов. Отмечаемая рядом работ повышенная частота спонтанных мутаций у очень маленькой Y-хромосомы может быть связана, по нашему мнению [69], со спецификой нуклеотидной организации регуляторной области ее ДНК, где обнаруживается значительное доминирование как раз треков S(G/C)n-типа; V тип - особый случай. Сюда отнесена митохондриальная мтДНК, МТ. GC-состав ее экзонов 45 % и здесь нет доминирующих треков GC-типа. В определенном смысле это достаточно автономное структурное образование весьма малых размеров. Количество белок-кодирующих генов - минимально, нет интронов. Поэтому она должна характеризоваться, по нашему мнению, исходно низкой частотой точечных спонтанных мутаций своих экзонов. Наблюдаемые тем не менее в митохондриях повышенные частоты патогенных мутаций по сравнению с другими хромосомами обычно связывают с мутациями ядерного генома в кодирующих областях его белков, которые активно участвуют в функционировании митохондрий. Таким образом, пример генома человека, обладающего известным «дефицитом GC-состава», в своей структурно-функциональной организации оптимизирован весьма своеобразным способом. Наиболее важные его области - белок-кодирующие участки определенно обогащены этим составом, но в то же время участие самих GC-треков ограничено вкладом лишь очень коротких нуклеотидных GC-последовательностей. Тем самым минимизируется влияние исходно повышенного структурного полиморфизма уотсон-криковских GC-пар по сравнению с АТ-парами на сохранение надежности и точности протекания в клетке генетических процессов. 4. Специфика состава кодонов, предпочтительно используемых (codon usage bias) в геномах про- и эукариот Одним из важнейших примеров нетривиальной роли скрытого структурного полиморфизма уотсон-криковских АТ- и GC-пар в организации геномной ДНК является, на наш взгляд, наблюдаемое смещение частоты кодонов (codon usage bias) в структуре белок-кодирующих генов живых организмов. Как известно, несмотря на вырожденность генетического кода природные аминокислоты стараются «использовать» преимущественно определенного вида кодоны [70, 71]. Бытует мнение, что предпочтительность кодонов - это отражение баланса между мутационной предрасположенностью и естественным отбором. Однако есть основания говорить о значительном влиянии исходных отличий формы водородного связывания комплементарных АТ- и GC-пар и на организацию данного явления. Повышенная неоднозначность формы GC-спаривания должна каким-то образом нивелироваться в триплетной нуклеотидной системе связывания «кодон - антикодон» для обеспечения высокой точности и надежности протекания процессов транскрипции и трансляции. Соответственно доминирующий характер АТ-пар в структурной организации нуклеотидных последовательностей обязан найти свое отражение в составе предпочтительных кодонов. Выделяются два важных момента в реализации этого явления. 1-й момент - «оптимизация» нуклеотидного состава приоритетных кодонов. В качестве основного примера «оптимизации» состава нуклеотидных триплетов в структуре белок-кодирующих генов на рис. 14 представлены результаты сравнительного анализа встречаемости кодонов в геноме человека (H.sapiens) и геноме реликтовой «тихоходки» (Tardigrada). Была использована все та же база данных генов GenBank [64]. Рис. 14. Распределение кодонов в белковых генах человека, H.sapiens (а) и реликтовой тихоходки, Tardigrada (б). По осям абсцисс расположены все 64 кодона, а по осям ординат - числа встречаемости кодонов. Толстые горизонтальные пунктирные линии на графиках обозначают 50 %-ю границу встречаемости кодонов. Овалами отмечены сходные области доминирования кодонов в обоих геномах Как видно из рис. 14, у двух довольно разных представителей эукариот области часто повторяющихся кодонов во многом оказываются схожими. При этом для генома человека список кодонов вида codon usage bias с более чем 50 %-м участием в структуре генных областей ДНК «оптимизировался» к следующему набору: GAТ GAC CAG GAA GAG AТG CТG AAA AAG GТG CCC GCC GGC AGC Наблюдаются две группы приоритетных кодонов. Первая - наиболее многочисленная группа. В ней обозначились часто встречающиеся кодоны аминокислот, имеющие в своем центральном положении либо аденин, либо тимин. На «ключевое» центральное место в системе «кодон - антикодон» здесь вышли именно те основания, которым исходно свойственен низкий структурный полиморфизм комплементарного Н-спаривании. Вторая группа отвечает остальным часто встречающимся аминокислотам. Структура их кодонов такова, что во втором положении оказываются гуанин или цитозин. Эта группа сравнительно невелика, содержит всего 28 % общего числа доминирующих кодонов. Малочисленность образовавшейся группы удивительным образом оказалась коррелирующей с повышенной «неоднозначностью» (с повышенным 4-кратным полиморфизмом) структуры Н-связывания для центрального основания (G или С) в составе кодона. Для случая генома тихоходки также сформировались две неравноправные группы кодонов: AAТ AAC GAТ GAC CAA CAG GAA GAG AТТ AТC AТG GCU GCC GCG CGG GGA GGC ТТG CТC CТG AAA AAG ТТC ТТТ ТAC GТG GТC CCG ТCC ТCG AGC ACC ACG Процентное соотношение числа кодонов здесь составляет 64:36 и также отражает доминирование кодонов с аденином или тимином во втором положении. Можно тоже говорить о сочетании относительно малого числа кодонов второй группы с наличием в их составе во втором положении гуанина или цитозина, обладающих повышенной неоднозначностью геометрии своего комплементарного спаривания при организации «кодон - антикодон» водородного связывания. С целью проверки распространенности такого типа «оптимизации» приоритетных кодонов мы провели дополнительный частотный анализ встречаемости кодонов в генных областях геномов ряда других организмов. Была использована специализированная база данных «Codon Usage Database» ресурса www.kazusa.or.jp. Исследовалось распределение доминирующих кодонов у резуховидки Таля (A.thaliana), дрозофилы (D.melanogaster), пекарских дрожжей (S.сerevisiae), кишечной палочки (E.coli). Сводные результаты представлены в табл. 2. Таблица 2 Процентное содержание числа доминирующих кодонов с А- или Т-основанием во втором положении кодона белок-кодирующего гена у разных видов организмов Организм Человек (H.sapiens) Тихоходка (Tardigrada) Резуховидка Таля (A.thaliana) Дрозофила (D.melanogaster) Дрожжи пекарские (S.cerevisiae) Бактерия (E.coli) Размер генома, п.н. 3.2109 2.15108 1.57108 1.6108 1.2107 4106 GC-состав генома, % 42 47 38 38.8 39 51 Доля кодонов с А- или Т-основанием в центральном положении, % 72 64 75 78 85 64 Данные этой таблицы убедительно свидетельствуют об общем характере предпочтительности использования кодонов с аденином или тимином во втором положении при организации белок-кодирующей структуры геномной ДНК живых организмов 2-й момент - энтальпия А-U водородного связывания. Этому фактору, по нашему мнению, уделяется незаслуженно мало внимания. Считается, что само появление урацила в структуре нуклеиновых кислот связано с особенностью протекания в них мутационно-репарационного процесса, который оказывается эволюционно-закрепленным. Введение урацила в состав РНК способствует надежности сохранения генетической информации в структуре двойной спирали ДНК. Отмечают, что энергия водородного связывания аденин-урацил вероятно не на много уступает энергии уотсон-криковской АТ-пары, имеющей величину ~ 12 ккал/моль. Однако в свете установленного выше состава доминирующих кодонов в структуре белок-кодирующих генов разных видов организмов следует обратить внимание на точное соотношение величин энтальпии AT и AU комплементарного спаривания оснований. Как ни странно, реальное значение энергии водородного связывания AU-пары не мало, оно даже гораздо выше, чем у АТ-пары. Согласно данным температурно-зависимой полевой масс-спектрометрии [55], энтальпия газо-фазной структуры AU-пары составляет ΔНв.с = 14.48 ккал/моль. Фактически оно оказывается промежуточным между значениями энтальпий пар АТ (ΔНв.с = 12.97 ккал/моль) и GC (ΔНв.с. = = 20.95 ккал/моль). Именно данное обстоятельство значительно усиливает, на наш взгляд, важную роль AU-пары в формировании центрального звена системы «кодон - антикодон» в комплексах ДНК-РНК, мРНК-тРНК, тРНК-рРНК для обеспечения надежности протекания генетических процессов транскрипции и трансляции. Таким образом, проведенный анализ наблюдаемого явления смещения кодонов (codon usage bias) в составе белок-код

Ключевые слова

аминогруппа, непланарность азотистых оснований, уотсон-криковские АТ- и GC-пары, полиморфизм водородного связывания, ДНК, нуклеотидные треки, геном, ген, кодоны, aminogroup, non-planarity of nitrous bases, Watson-Crick AT and GC pairs, hidden polymorphism of hydrogen bonding, DNA, nucleotide tracts, genome, gen, codon

Авторы

ФИООрганизацияДополнительноE-mail
Комаров Владислав МихайловичИнститут биофизики клетки РАНд.ф.-м.н., ведущ. науч. сотр. ИБК РАНkomarov_vm@mail.ru
Самченко Александр АнатольевичИнститут биофизики клетки РАНк.ф.-м.н., ст. науч. сотр. ИБК РАНopen13@mail.ru
Всего: 2

Ссылки

Нурмухаметов Р.Н., Плотников В.Г., Шигорин Д.Н. // Журн. физ. химии. - 1966. - Т. 40. - С. 1154.
Шигорин Д.Н. // ЖВХО им. Д.И. Менделеева. - 1975. - Т. 20. - С. 32.
Шигорин Д.Н., Плотников В.Г. // ДАН СССР. - 1977. - Т. 234. - С. 121.
Шигорин Д.Н. // Журн. физ. химии. - 1977. - Т. 51. - С. 1894.
Комаров В.М., Плотников В.Г., Белоусова Л.В. // Опт. и спектр. - 1970. - Т. 29. - С. 1006- 1007.
Комаров В.М., Плотников В.Г. // Теор. и эксперим. химия. - 1974. - Т. 10. - № 1. - С. 62-68.
Комаров В.М., Плотников В.Г. // Журн. прикл. спектр. - 1974. - Т. 20. - № 2. - С. 256-260.
Komarov V.M. and Plotnikov V.G. // Spectrosс. Lett. - 1975. - V. 8. - No. 6. - P. 363-373.
Плотников В.Г., Долгих Б.А., Комаров В.М. // Опт. и спектр. - 1977. - Т. 43. - № 6. - С. 1072-1080.
Excited States. V. 1. / ed. E.C. Lim. - N.Y.: Academic Press, 1974.
Lim E.C. and Kedzierski M. // Chem. Phys. Lett. - 1973. - V. 20. - P. 242.
Watson J.D. and Crick F.H.C. // Nature. - 1953. - V. 171. - P. 737-738.
Зенгер В. Принципы структурной организации нуклеиновых кислот. - М.: Мир, 1987.
Wilson C.C. // Nucl. Acids Res. - 1987. - V. 15. - P. 8577-8591.
Wilson C.C. and Tollin P. // Nucleosides & Nucleotides. -1987. - V. 6. - P. 643-653.
Marx K.A., Hess S.T., and Blake R.D. // J. Biomol. Struct. Dyn. - 1993. - V. 11. - P. 057-066.
Marx K.A., Zhou Y., and Kishawi I.Q. // J. Biomol. Struct. Dyn. - 2006. - V. 23. - P. 429-446.
Dechering K.J., Cuelenaere K., Konings R.N.H., and Leunissen J.A.M. // Nucl. Acids Res. - 1998. - V. 26. - P. 4056-4062.
Shomer B. and Yagil G. // Nucl. Acids Res. - 1999. - V. 27. - P. 4491-4480.
Coenye T. and Vandamme P. // DNA Research. - 2005. - V. 12. - P. 221-233.
Piazza F. and Lio P. // Physica A. - 2005. - V. 347. - P. 472-488.
Subirana J.A. and Messeguer X. // J. Theor. Biol. - 2011. - V. 283. - P. 28-34.
Комаров В.М., Полозов Р.В., Коноплев Г.Г. // Неплоское строение аминозамещенных азотистых оснований. PCILO конформационное исследование: Препринт Научного центра биологических исследований АН СССР. - Пущино, 1989.
Komarov V.M. and Polozov R.V. // Z. Naturforsch. - 1990. - V. 45c. - P. 1080.
Komarov V.M., Polozov R.V., and Konoplev G.G. // J. Theor. Biol. - 1992. - V. 155. - P. 281- 294.
Свердлов Л.М., Ковнер М.А., Крайнов Е.П. Колебательные спектры многоатомных молекул. - М.: Наука, 1970.
Brand J.C.D., Williams D.R., and Cook T.J. // J. Mol. Spectrosс. - 1966. - V. 20. - P. 359-380.
Brown R.D., Godfrey P.D., and Kleibomer D.B. // J. Mol. Spectrosс. - 1987. - V. 124. - P. 21-33.
Brown R.D., Godfrey P.D., McNaughton D., and Pierlot A.P. // J. Am. Chem. Soc. - 1989. - V. 111. - P. 2308-2310.
Brown R.D., Godfrey P.D., McNaughton D., and Pierlot A.P. // Chem. Phys. Lett. - 1989. - V. 156. - P. 61-63.
Alonso J.L., Pena I., Lopez J.C., et al. // Angew. Chem. Int. Ed. - 2009. - V. 48. - P. 6141-6143.
Комаров В.М. // Биофизика. -1994. - Т. 39. - № 5. - С. 837-842.
Герцберг Г. Электронные спектры и строение многоатомных молекул. - М.: Мир, 1969.
Комаров В.М. // Биофизика. - 1998. - Т. 43. - № 6. - С. 967-974.
Komarov V.M. // J. Biol. Phys. - 1999. - V. 24. - P. 167-184.
Комаров В.М., Мевх Н.Г. // Журн. физ. химии. - 1995. - Т. 69. - № 8. - С. 1419-1421.
Kabanov A.V. and Komarov V.M. // Int. J. Quant. Chem. - 2002. - V. 88. - P. 579-587.
Kabanov A.V., Komarov V.M., Yakushevich L.V., and Teplukhin A.V. // Int. J. Quant. Chem. - 2004. - V. 100. - P. 595-609.
Hobza Pю and Sandorfy C. // J. Am. Chem. Soc. - 1987. - V. 109. - P. 1302-1307.
Hobza P. and Šponer J. // Chem. Rev. - 1999. - V. 99. - No. 11. - P. 3247-3276.
Roscioli J.R. and Pratt D.W. // Proc. Natl. Acad. Sci. USA. - 2003. - V. 100. - P. 13752-13754.
Stewart J.J.P. // J. Comput. Chem. - 1989. - V. 10. - P. 209.
Stewart J.J.P. // J. Mol. Struct. (THEOCHEM). - 1997. - V. 401. - P. 195.
Vinogradov A.E. // Nucl. Acids Res. - 2003. - V. 31. - P. 1838-1844.
Nishida H. // Curr. Issues Mol. Biol. - 2013. - V. 15. - P. 19-24.
Wu H., Zhang Z., Hu S., and Yu J. // Biology Direct. - 2012. - V. 7. - No. 2. - P. 1-16.
Frank-Kamenetskii M.D. // Biopolymers. - 1971. - V. 10. - P. 2623-2624.
Musto H., Naya H., Zavala A., et al. // FEBS Lett. - 2004. - V. 573. - P. 73-77.
Singer C.E. and Ames B.N. // Science. - 1970. - V. 170. - P. 822-825.
Musto H., Naya H., Zavala A., et al. // Biochem. Biophys. Res. Commun. - 2006. - V. 347. - P. 1-3.
Oliver J.L. and Marin A. // J. Mol. Evol. - 1996. - V. 43. - P. 216-223.
Sueoka N. // J. Mol. Evol. - 1993. - V. 37. - P. 137-153.
Kudla G., Lipinski L., Caffin F., et al. // PLoS Biol. - 2006. - V. 4. - P. e180.
Foerstner K.U., von Mering C., Hooper S.D., and Bork P. // EMBO Rep. - 2005. - V. 6. - P. 1208-1213.
Веркин Б.И., Янсон И.К., Суходуб Л.Ф., Теплицкий А.Б. Взаимодействия биомолекул. - Киев: Наукова думка, 1985.
Ussery D.W., Wassenaar T.M., and Borini S.B. Computing for Comparative Microbial Genomics: Bioinformatics for Microbiologists. - London: Springer Verlag, 2009.
Watson J.D. Molecular Biology of the Gene. - New York; Amsterdam: W.A. Benjamin, Inc., 1965.
Karlin S. and Mrazek J. // Proc. Natl. Acad. Sci. USA. - 1997. - V. 94. - P. 10227-10232.
Hamilton W.L., Claessens A., Otto T.D., et al. // Nucl. Acids Res. - 2017. - V. 45. - No. 4. - P. 1889-1901.
Subirana J.A. and Messeguer X. // Nucl. Acids Res. - 2010. - V. 38. - No. 4. - P. 1172-1181.
Yagil G. // J. Mol. Evol. - 1993. - V. 37. - P. 123-130.
Yagil G. // Genomics. - 2006. - V. 87. - P. 591-597.
Shomer B. and Yagil G. // Nucl. Acids Res. - 1999. - V. 27. - P. 4491-4480.
http://www.ncbi.nlm.nih.gov/genbank
Cамченко А.А., Киcелев C.C., Кабанов А.В. и др. // Биофизика. - 2016. - Т. 61. - № 6. - С. 1045-1058.
Киселев С.С., Комаров В.М., Масулис И.С., Озолинь О.Н. // Компьют. исследов. и моделир. - 2010. - Т. 2. - № 2. - С. 183-187.
Schaibley V.M., Zawistowski M., Wegman D., et al. // Genome Research. - 2013. - V. 23. - P. 1974-1984.
Glemin S., Clement Y., David J., and Ressayre A. // Trends in Genetics. - 2014. - V. 30. - No. 7. - P. 263- 270.
Комаров В.М., Самченко А.А., Кондратьев М.С. // Докл. Междунар. конф. «Математическая биология и биоинформатика» / под ред. В.Д. Лахно. - Пущино: ИМПБ РАН, 2018. - Т. 7. - Ст. № e103. DOI: 10.17537/icmbb18.114.
Sharp P.M. and Li W-H. // Nucl. Acids Res. - 1987. - V. 15. - No. 3. - P. 1281-1295.
Narakuma Y., Gojobori T., and Ikemura T. // Nucl. Acids Res. - 2000. - V. 28. - P. 292.
 Би-стабильность пирамидального строения NH<sub>2</sub>-групп азотистых оснований и ее роль в структурно-функциональной организации геномной ДНК | Известия вузов. Физика. 2020. № 8. DOI: 10.17223/00213411/63/8/24

Би-стабильность пирамидального строения NH2-групп азотистых оснований и ее роль в структурно-функциональной организации геномной ДНК | Известия вузов. Физика. 2020. № 8. DOI: 10.17223/00213411/63/8/24