Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

КНОРРЕ_3227

.pdf
Скачиваний:
65
Добавлен:
11.03.2016
Размер:
20.35 Mб
Скачать

70

Глава 3. Первичная структура нуклеиновых кислот

тов. И на заключительном этапе следует установить, в каком порядке все эти фрагменты были расположены в исходном полимере.

В связи со стремительным развитием проблемы некоторые из методов, сыгравшие решающую роль в начальный период становления проблемы, ста­ ли вытесняться новыми подходами. Но большая часть тех методов, которые перестали использоваться для решения таких масштабных задач, как уста­ новление полной структуры геномов живых организмов, остаются полезными для решения ряда менее глобальных задач. Поэтому эти методы будут рас­ смотрены в настоящей главе наравне с теми, которые сегодня являются осно­ вой полного секвенирования геномов.

Как уже говорилось, секвенирование нуклеиновых кислот началось с ус­ тановления первичной структуры нескольких транспортных РНК, но подхо­ ды, использованные в этих работах, в силу их трудоемкости и низкой эффек­ тивности, не открывали разумной перспективы для молекул большего разме­ ра, таких, например, как молекулы основных рибосомных РНК. С появлени­ ем первых же методов секвенирования ДНК и доступных ферментов для об­ ратной транскрипции все работы в РНК стали проводиться путем обратной транскрипции, секвенирования полученных кДНК и вывода структуры РНК из структуры кДНК на основе принципа комплементарности.

§ 3.2. Фрагментация ДНК

ДНК может быть расщеплена на довольно большие фрагменты с помо­ щью ферментов, имеющих общее названия эндонуклеазы рестрикции. Эти ферменты присутствуют у ряда микроорганизмов и катализируют расщепле­ ние двунитевых ДНК по определенным последовательностям, состоящим, в зависимости от природы фермента, из четырех-восьми нуклеотидов. На­ пример, в Escherichia coli присутствует фермент, который специфично узнает последовательность d(GAATTC) и катализирует ее расщепление между G

иА. Расщепление этими ферментами проходит с образованием фрагмента

сЗ’-концевой ОН-группой и фрагмента с 5’-концевым фосфатом. Последова­ тельности обычно самокомплементарны, и их расщепление проходит по обе­ им нитям. У бактерии Haemophilus influenzae имеется фермент, узнающий последовательность d(AAGCTT) и катализирующий в обеих нитях расщепле­ ние между двумя остатками А. Ферменты рестрикции обычно называют со­ кращенными символами, отражающими название биологического источника, в котором они присутствуют и из которых их соответственно получают. На­ пример, первый из упомянутых ферментов называют EcoRI, а второй - Hind III. Римские цифры при названиях отражают наличие в одном и том же биологическом источнике нескольких различных ферментов рестрикции. На рис. 21 представлена схема расщепления ДНК с помощью эндонуклеазы

EcoRI.

 

§ 3.2. Фрагментация ДНК

71

5'

'w'pGpApApTpTpCv/V4' 3'

 

3'

'W'CpTpTpApApGp 'лп-' 5’

 

 

 

| ecoRI

 

5’ ‘W'pG-OH

+

pApApTpTpC ^

3‘

3< 'w'CpTpTpApAp

HO-Gp'лгъ

5’

Рис. 21. Схемарасщепления ДНК по специфичному фрагменту эндонуклеазойEcoRI

Как видно из данных по расщеплению двунитевых ДНК рестриктазами, полученные фрагменты на своих концах содержат однонитевые фрагменты. Например, на 5’-концах двунитевых фрагментов, полученных расщеплением ДНК рестриктазой EcoRI, будут находиться однонитевые участки рАрАрТрТ, способные взаимодействовать с олиго- и полинуклеотидами, содержащими на 5’-конце последовательность рАрАрТрТ, т. е. «прилипнуть» к ним. В связи

сэтим такие участки называют липкими концами.

Втабл. 7 приведены несколько ферментов рестрикции, нашедших широ­ кое применение, сайты их узнавания и стрелками указаны, какие именно свя­ зи в этом сайте подвергаются расщеплению.

Таблица 7

Некоторые эндонуклеазы рестрикции

Микроорганизм Сокращение Последовательность

Bacillus aminoliquefaciens

BamHI

(S'KapGpApTpCpC (3’)

(З')СрСрТpApGpjG (5*)

 

 

Escherichia coli RYJ3

EcoRI

dfpApApTpTpC

CpTpTpApApjjG

 

 

 

 

*

Haemophilus aegyptius

Haell

PupGpCpGpCpPy

PypCpGpCpGp^Pu

 

 

Haemophilus aegyptius

Haelll

Gp(apCpC

CpCpppG

 

 

Haemophilus influenzae Rd

Hindlll

ApApGpCpT pT

 

 

TpTpCpGpA^A

Haemophilus parainfluenzae

Hpal

GpTpTpApApC

 

 

CpApAf|TpTpG

72

Глава 3. Первичная структура нуклеиновых кислот

 

 

 

Окончание табл. 7

 

Nocardia otitidis caviarum

Notl

1

 

GpCpGpGpCpCpGpC

 

 

 

CpGpCpCpGpGpCpG

 

 

 

T

 

Providencia stuartii

PstI

j

 

CpTpGpCpApG

 

 

 

GpjApCpGpTpC

 

Pseudomonas mendocina

Pmel

i

 

GpTpTpTpApApApC

 

 

 

CpApApApTpTpTpG

 

 

 

T

 

Streptomyces albus

SaLI

GpTpCpGpApC

 

 

 

CpApGpCpTpG

 

 

 

T

 

Примечание. Указаны микроорганизмы-продуценты и сайты, расщепляемые эти­

ми ферментами. Стрелками показаны расщепляемые ими связи, Ри - остатки пурино­ вых, а Ру - остатки пиримидиновых нуклеотидов

Из изложенного ясно, что средние размеры получающихся фрагментов достаточно велики. Если сайт рестрикции состоит из шести нуклеотидов, то вероятность нахождения такого фрагмента в ДНК составляет 1/46, т. е. 1/4096, и следовательно средняя длина фрагментов, получающихся при расщеплении ДНК этим ферментом, должна быть 4096 нуклеотидов. Поскольку специфи­ ческие последовательности распределены в цепи исследуемой ДНК неравно­ мерно, то среди полученного набора фрагментов могут присутствовать и су­ щественно более короткие, и существенно более длинные. Для разделения полученных фрагментов чаще всего используют электрофорез.

В наиболее развитых подходах к секвенированию геномов для фрагмен­ тации анализируемой ДНК стали использовать расщепление с помощью ультразвука или применять какое-либо механическое воздействие. В отличие от метода с использованием рестриктаз в этом случае разрывы происходят по случайным точкам, и в исследуемой пробе получается смесь значительно большего числа фрагментов. В этом случае проводится поштучное разделе­ ние фрагментов, например, смесь фрагментов подвергается эмульгированию, так, чтобы в каждой капле эмульсии оказывался в среднем один фрагмент. Для достижения достаточной чувствительности проводится размножение фрагментов, каждого в своей капле, с помощью полимеразной цепной реак­ ции, описанной в § 5.5.

§ 3.3. Прямое секвенирование полидезоксирибонуклеотидов

73

§3.3. Прямое секвенирование полидезоксирибонуклеотидов

В1977 году на Гордоновской конференции были обнародованы два эф­ фективных метода прямого секвенирования ДНК. По имени авторов, их раз­ работавших, они вошли в научную литературу как метод Максима - Гил­ берта (A. Maxam, W. Gilbert) и метод Сэнгера (F. Sanger). За разработку этих методов Гилберту и Сэнгеру в 1980 году была присуждена Нобелевская пре­ мия. У Сэнгера это уже была вторая премия. Первую он получил в 1958 году за расшифровку первичной структуру инсулина.

Воснову обоих методов положена общая стратегия, суть которой состоит

вопределении для каждого из четырех типов оснований расстояний до опре­ деленной точки (определенного нуклеотидного остатка) анализируемой ДНК. Под расстоянием в этом контексте понимается число нуклеотидных звеньев. В обоих методах информация получается одновременно для всего набора од­ нотипных нуклеотидов, что достигается путем использования статистических подходов.

Вметоде Максама - Гилберта анализируется ДНК (обычно достаточно протяженный фрагмент), на 5’-конце которой находится высокорадиоактив­ ный фосфат, введенный с помощью полинуклеотидкиназы (см. § 1.9). Анали­ зируемая ДНК по одному из типов оснований подвергается модификации, позволяющей элиминировать модифицируемые основания, т. е. получить на их месте АП-сайты. Такие реакции модификации описаны в § 2.2. Обработка гидразином в щелочной среде приводит к образованию АП-сайта по остаткам цитозина, а в нейтральной среде - по обоим пиримидинам. Алкилирование с последующим гидролизом гликозидной связи приводит к образованию АПсайтов по всем остаткам гуанина, а обработка 60 %-й муравьиной кислотой - по всем сайтам, лишенным гуанина и аденина. Как показано в § 2.5, по обра­ зовавшимся АП-сайтам возможно селективное расщепление полинуклеотидной цепи.

Проводя в отдельной пробе каждую из этих модификаций и последующее расщепление в таких условиях, чтобы в среднем в каждом образце произошел один разрыв, получают в каждой пробе набор фрагментов, оканчивающихся на определенный тип оснований или на определенную пару оснований. По­ лученный набор разделяют гель-электрофорезом и по наличию радиоактив­ ности выделяют все полосы, соответствующие разделенным фрагментам. На радиоавтографе проявляются только фрагменты, содержащие меченый 5’-конец анализируемого полинуклеотида, а на 3’-конце - лишенный гетеро­ цикла остаток нуклеотида. Положение каждого из таких остатков, т. е. его расстояние до 5’-конца, определяется длиной меченого фрагмента. Таким об­ разом находится положение всех цитозинов, сумма положений цитозинов и тиминов, всех гуанинов и сумма всех аденинов и гуанинов, т. е. полная структура образца.

На рис. 22 схематично представлено расположение всех четырех полос на участке радиоавтографа, взятого с полного радиоавтографа, полученного ме­

74

Глава 3. Первичная структура нуклеиновых кислот

тодом Максама и Гилберта для некоторого полидезоксирибонуклеотидного фрагмента. Справа выписана та последовательность, которая однозначно вы­ текает из расположения полос.

G

A+G

Т+С

С

 

 

——

 

 

А

 

——i

 

 

А

——

 

 

G

 

——

 

 

А

 

——

 

 

А

——

 

 

G

——

——

——

G

 

 

С

 

 

С

 

 

— |

 

Т

 

 

С

——

——

 

Т

 

 

G

——

——

 

 

G

 

——

 

 

А

——i

 

 

G

 

 

— -

С

Рис. 22. Рисунок электрофореграммы, полученной для олигонуклеотида d(AAGAAGGCCTCTGGAAGC)

В основе метода Сэнгера лежит анализ структуры не самой нуклеиновой кислоты, а продукта, получаемого в ходе ее репликации с помощью ДНКполимеразы. По этому методу в реакционную смесь вместе со смесью всех четырех природных dNTP вводят один из 2’,3’-дидезоксирибонуклеозид трифосфатов (ddNTP). В связи с тем, что ДНК-полимеразы неспособны иниции­ ровать репликацию, в систему вводится праймер, позволяющий начать реп­ ликацию в определенном участке анализируемой ДНК. Структура этого не­ большого участка должна быть заранее определена каким-либо другим мето­ дом. В такой системе начинается удлинение праймера, т. е. синтез ДНК, ком­ плементарной анализируемому фрагменту. ddNTP являются близкими струк­ турными аналогами соответствующих природных субстратов ДНК, опозна­ ются ферментом и могут включаться в строящуюся полинуклеотидную цепь. В результате в некоторых статистически разбросанных участках происходит включение остатка ddNTP. При этом полностью сохраняется принцип ком­ плементарное™. Например, ddTTP включается только в те места, где должен был бы включиться dTTP, т. е. напротив того участка анализируемой матри­ цы, где находится остаток dAMP. В случае включения ddNTP синтез компле­

§ 3.3. Прямое секвенирование полидезоксирибонуклеотидов

75

ментарной цепи обрывается, поскольку у остатка ddNTP отсутствует необхо­ димая для продолжения синтеза З’-ОН-группа. Таким образом, ddNTP явля­ ются терминаторами репликации. Их включение проходит статистически, и получается набор укороченных фрагментов, причем их длины определяются расстоянием от 3’-конца праймера до замещенного нуклеотидного остатка. Например, если в смесь введен ddTTP, то получается набор фрагментов, каж­ дый из которых имеет длину, равную расстоянию от начала праймера до точ­ ки расположения одного из остатков тимидина. Эти фрагменты далее разде­ ляются электрофорезом, что позволяет по их положению на электрофореграмме определить положение всех остатков тимидина и, таким образом, по­ ложение остатков dAMP на анализируемой ДНК. Схема установления распо­ ложения тимидина для небольшого фрагмента исследуемой ДНК приведена на рис. 23.

(3’) Х,Х2ХзХ4Х5Х6ХХХ А XX А ХХХХ А А X А (I)

(5’)Y,Y2Y3Y4Y5Y6YYYddT

(5’)Y1Y2Y3Y4Y5Y6YYY Т YYddT

(5’)Y,Y2Y3Y4Y5Y6YYY T YY T YYYY ddT

(5’)Y1Y2Y3Y4Y5Y6YYY T YY T YYYY TddT

(5’)Y1Y2Y3Y4Y5Y6YYY T YY T YYYY T T YddT

Рис. 23. Установление положения остатков дезоксиаденозина (А) в олигонуклео­ тиде (I) методом Сэнгера при репликации в присутствии дидезокситимидин-5’- трифосфата. X - остатки нуклеотидов, A, Y - остатки комплементарных им нуклео­ тидов

Аналогичным образом, используя другие ddNTP, можно определить по­ ложение всех четырех нуклеотидов. Тем самым определяется полная после­ довательность синтезированной ДНК и, следовательно, последовательность ана­ лизируемой ДНК, которая комплементарна полученному продукту репликации.

В своем оригинальном варианте Сэнгер в качестве субстратов использо­ вал [a-32P]dNTP и получал терминированные продукты репликации, меченые по всем межнуклеотидным фосфатам. Поэтому все укороченные фрагменты на электрофореграмме легко регистририровались радиоавтографически. Од­ нако этот метод регистрации плохо поддается автоматизации, поэтому в на­ стоящее время, особенно в связи с созданием автоматических секвенаторов {секвенаторов нуклеиновых кислот), анализ последовательностей в основном переведен на флуоресцентные методы регистрации. Разработаны специаль­ ные красители, которые могут быть присоединены к праймеру или к терми­ наторам и при облучении светом дают характерную флуоресценцию.

76

Глава 3. Первичная структура нуклеиновых кислот

Если краситель присоединен к праймеру, то с таким праймером в четырех различных реакторах, как правило, капиллярах, проводятся те же основные процессы, что и при радиохимической детекции: элонгация праймера в при­ сутствии одного из ddNTP и электрофорез. На выходе из капилляров прово­ дится облучение лазерами возбуждающим светом и регистрация флуоресцен­ ции. По порядку выхода из капилляра определяется весь набор терминиро­ ванных в присутствии определенного ddNTP полинуклеотидов и, тем самым, положение соответствующих нуклеотидов в синтезированной цепи.

Если красители присоединяются к терминатору, то можно использовать четыре красителя, флуоресцирующие при четырех различных длинах волн, связанные с четырьмя различными терминаторами. В этом случае электрофо­ рез продуктов репликации можно проводить в одном капилляре, однако реги­ стрировать не только сам факт флуоресценции, но и спектр каждого выходя­ щего из капилляра продукта терминации, что позволяет идентифицировать последовательно каждый входящий в продукт репликации терминирующий дидезоксинуклеотид. В этом варианте секвенирования нужно использовать такие флуоресцирующие производные терминаторов, которые, несмотря на присоединение к основанию объёмистого радикала, сохраняют субстратные свойства. На рис. 24 приводятся четыре терминатора - производные всех че­ тырех dNTP, которые возбуждаются при 488 нм, но дают четыре разных спектра флуоресценции. Это позволяет по мере выхода разделяемой реакци­ онной смеси регистрировать спектры испускания и идентифицировать каж­ дый нуклеотид, выходящий из капилляра, в котором проводится электрофорез.

В связи с возможностью автоматизации этот метод за короткий срок вы­ теснил метод Максама - Гилберта. Однако и он уступил место новым мето­ дам, среди которых прежде всего следует сказать о методе пиросеквенирования, в настоящее время достаточно широко используеющемся в схемах для скоростного секвенирования геномов.

Метод имеет в своей основе использование ДНК-полимераз. Как и в слу­ чае метода Сэнгера, речь идет о синтезе новой молекулы ДНК на анализи­ руемой матрице. Существенно, что ДНК-матрица может быть закреплена на носителе, причем найдены системы, в которых ДНК-полимераза нормально функционирует на такой закрепленной матрице. Присоединение нуклеозид- 5’-трифосфата, как уже ранее указывалось, сопровождается отщеплением ос­ татка пирофосфата, т. е. каждый акт присоединения очередного мономера сопровождается появлением новой молекулы пирофосфата. Таким образом, факт удлинения растущей цепи может быть зарегистрирован по появлению новой молекулы пирофосфата. Естественно, что при добавлении dNTP, не соответствующего считываемому на данном шаге нуклеотиду ДНК-матрицы, пирофосфат не образуется. Образование пирофосфата может быть зарегист­ рировано многочисленными методами, однако наиболее перспективным ока­ зался метод, основанный на превращении пирофосфата в молекулу АТР, ко-

§ 3.3. Прямое секвенирование полидезоксирибонуклеотидов

77

Рис. 24. Формулы флуоресцирующих производных четырех ddNTP, используе­ мых в качестве терминаторов для секвенирования ДНК методом Сэнгера

торое осуществляется ферментативно, например, с помощью фермента сульфорилазы, катализирующего реакцию:

аденилилсульфат + пирофосфат -» АТР + сульфат.

Образование АТР может с высокой чувствительностью быть зарегистрирова­ но по его взаимодействию с люцеферином, который по реакции с АТР пре­ вращается в люцефериладенилат, способный при участии специального фер­ мента - люцеферазы - взаимодействовать с молекулярным кислородом с ис­ пусканием кванта света. Таким образом, по возникновению свечения в системе, содержащей люцеферин и люцеферазу, при добавлении соответст­ вующего считываемому нуклеотиду матрицы определяется природа очеред­ ного нуклеотида секвенируемой ДНК.

78

Глава 3. Первичная структура нуклеиновых кислот

§ 3.4. Сборка полной структуры полидезоксирибонуклеотида (генома)

Установление последовательности отдельных нуклеотидных фрагментов еще не означает установления первичной структуры нуклеиновой кислоты в целом. После установления последовательности нуклеотидов в каждом из фрагментов необходимо установить, в каком порядке эти фрагменты были расположены в исходной нуклеиновой кислоте. Аналогичная задача стоит и при секвенировании полипептидных цепей и первоначально была разрабо­ тана для определения первичной структуры белков, получив название мето­ да перекрывающихся блоков. В этом методе для каждого фрагмента (блока мономеров) нужно определить, с какими именно фрагментами он соседство­ вал. Общий подход к решению данной задачи основан на использовании двух (или больше) различных способов фрагментации анализируемого биополи­ мера. Условно можно назвать их блоками первого и второго типа. Для каж­ дой пары соседних фрагментов первого типа А и В среди фрагментов второго типа найдется блок С, содержащий конец блока А и начало блока В, т. е. час­ тично их перекрывающий (рис. 25). Таким образом, в основе метода лежит проведение фрагментации анализируемого биополимера двумя способами, отличающимися точками расщепления, и секвенирование всех полученных обоими способами фрагментов.

фрагменты первого типа

/\

перекрывающий их фрагмент второго типа

Рис. 25. Схема метода перекрывающихся блоков: А и В - два соседних в иссле­ дуемой структуре фрагмента, полученных при первом способе фрагментации. С - фрагмент, полученный при втором способе фрагментации, содержащий конец фраг­ мента А и начало фрагмента В

В приборах для скоростного секвенирования проводится неспецифиче­ ская фрагментация анализируемой ДНК. Анализу естественно подвергается образец, содержащий большое число одинаковых молекул ДНК, но в силу статистического характера процедуры разные молекулы фрагментируются по-разному. Поэтому для каждого секвенированного фрагмента скорее всего найдется фрагмент, частично его перекрывающий, но содержащий некоторую избыточную часть, соответствующую соседнему фрагменту, что позволяет их

§ 3.5. Банки данных для последовательностей нуклеотидов

79

состыковать. Так как речь идет о массовом поиске перекрывающихся фраг­ ментов, то практически это можно сделать только с помощью ЭВМ, исполь­ зуя специальные алгоритмы. В последние годы начался выпуск нескольких вариантов быстродействующих секвенаторов. Такие установки называют ДНК-секвенаторами следующего поколения.

§3.5. Банки данных для последовательностей нуклеотидов

внуклеиновых кислотах

Информация об экспериментально определенных последовательностях хранится в специальных банках нуклеотидных последовательностей. Любая занесенная в этот банк последовательность может быть вызвана на персо­ нальный компьютер, подключенный к международной сети Internet. Выход на банк данных будет ниже рассмотрен на примере банка Genbank.

Эта база данных разрабатывается и поддерживается Национальным цен­ тром биотехнологической информации (National Center of Biotechnolical In­ formation, NCBI) Национального института здоровья (National Institute of Health, NIH) США и является открытой для свободного доступа. По состоя­ нию на август 2009 года в базе содержались десятки миллионов последова­ тельностей, а их общая длина составила десятки миллиардов остатков нук­ леотидов. Вызов нужной последовательности на рабочий компьютер начина­ ется с выхода в Genbank, адрес которого в системе Internet http://www.ncbi.nlm.nih.gov/Genbank. При этом открывается вкладка «Search»

с двумя окнами. В левом окне находится вкладка с записью «entrez» (фр. «войдите»). При нажатии на эту вкладку раскрывается список поисковых баз, из которого выбирается база «nucleotide». После входа в эту базу в свободное правое окно заносится название объекта, последовательность нуклеотидов которого нужно вызвать на персональный компьютер. Ниже приводится два примера вызова нуклеотидных последовательностей.

Для вывода последовательности валин-специфичной тРНК из пекарских дрожжей в правое окно заносится запись valine tRNA baker’s yeast и для по­ лучения ответа нажимается кнопка «go». Между названием вызываемой по­ следовательности и организма, к которому относится вызываемая последова­ тельность, вводится оператор AND и слово «organism» в квадратных скобках. Последовательность, представленная на рис. 26, приводится в однобуквенном коде, причем для унификации записей в банке уридиновые остатки обозна­ чаются буквой t, т. е. не делается различий между урацилом и тимином. При линейной записи последовательности минорные компоненты не отмечаются.