Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Meditsinskaya_genetika_glava_4

.pdf
Скачиваний:
54
Добавлен:
20.05.2015
Размер:
2.8 Mб
Скачать

ГБОУ ВПО «КАЗАНСКИЙ ГОСУДАРСТВЕННЫЙ МЕДИЦИНСКИЙ УНИВЕРСИТЕТ» МИНИСТЕРСТВА ЗДРАВООХРАНЕНИЯ РФ

КАФЕДРА МЕДИЦИНСКОЙ БИОЛОГИИ И ГЕНЕТИКИ

Медицинская генетика

Часть 4. Секвенирование. Геном человека. Генная инженерия

КАЗАНЬ 2014

УДК 611:018(075.8) ББК 28.05+28.06

Печатается по решению Центрального координационно-методического совета Казанского государственного медицинского университета.

Авторы:

Скоблов М.Ю., Иллариошкин С.Н., Салафутдинов И.И., Исламов Р.Р., Кошпаева Е.С. Под общей редакцией: Исламова Р.Р.

Рецензенты:

Заведующий кафедрой гистологии, цитологии и эмбриологии КГМУ проф. Челышев Ю.А. Заведующий кафедрой гистологии, цитологии и эмбриологии РНИМУ им. Н.И. Пирогова проф. Глинкина В.В.

Медицинская генетика. Часть 4. Секвенирование. Геном человека. Генная инженерия. Частота мутантных генов в популяции. Учебно-методическое пособие / Скоблов М.Ю., Иллариошкин С.Н., Салафутдинов И.И., Исламов Р.Р., Кошпаева Е.С.

– Казань: КГМУ, 2014. – 25 с.

Учебно-методическое пособие составлено в соответствии с Государственным образовательным стандартом высшего профессионального образования (ФГОС-3) и типовой Учебной программой по дисциплине «Биология». В 4 части «Секвенирование. Геном человека. Генная инженерия. Частота мутантных генов в популяции» Учебнометодического пособия «Медицинская генетика» изложены цели и задачи данной темы, указаны формируемые компетенции, приведён теоретический обзор изучаемого материала, изложенный в лаконичной, рубрицированной форме и имеющий медицинскую направленность. Практические навыки включают освоение метода секвенирования, биоинформатический анализ фрагмента ДНК с помощью базы данных NCBI и установление функциональной значимости и гомологичности целевой ДНК. Пособие включает типовые тестовые вопросы, вопросы самоконтроля, справочник терминов.

Учебно-методическое пособие предназначено для студентов младших курсов медицинских факультетов и медицинских вузов.

© Казанский государственный медицинский университет, 2014

Часть 4. Секвенирование. Геном человека. Генная инженерия

Целью публикации настоящего учебно-методического пособия является систематизация знаний и представлений студентов о структурной организации генома человека и способах определения нуклеотидной последовательности ДНК. В учебно-методическом пособии приводится обзор литературы, содержащий современные представления о геноме человека, его структурной организации, классификации генов и элементов генома и способах изучения строения генома. В учебно-методическое пособие включена новейшая информация, которая не представлена в учебниках, используемых студентами.

Задачей учебно-методического пособия является ознакомление студентов с современными представлениями о методах определения нуклеотидной последовательности ДНК, выработка навыков проведения анализа фрагмента ДНК с помощью базы данных NCBI, выработка навыков самостоятельной работы.

Цель занятия:

Ознакомление с общим принципом организации генома человека. Изучение методов определения нуклеотидной последовательности ДНК.

Задачи занятия:

1.Ознакомиться со строением генома человека

2.Освоить алгоритм поведения анализа на определение нуклеотидной последовательности ДНК (секвенирование)

3.Научиться проводить биоинформатический анализ фрагмента ДНК с помощью базы данных NCBI.

4.Научиться устанавливать функциональную значимость и гомологичность целевой

ДНК

Формируемые компетенции:

ОК-1, ПК-2, ПК-3, ПК-9, ПК-31, ПК-32

Студент должен знать:

1.Общий принцип организации генома человека

2.Сущность проекта «Геном человека»

3.Структуру генома человека

4.Классификацию генов

5.Цель и способы физического картирования генов

6.Последовательность операций при получении векторов и клонировании генов

7.Сущность создания генетически модифицированных организмов

8.Сущность и последовательность операций при определении нуклеотидной последовательности ДНК методом секвенирования

Студент должен уметь:

1.Решать ситуационные задачи по теме.

2.Работать с обучающей компьютерной программой при изучении темы.

5.Проводить биоинформатический анализ фрагмента ДНК с помощью базы данных

NCBI.

6.Устанавливать функциональную значимость и гомологичность целевой ДНК.

Студент должен владеть:

1.Знаниями о структурной организации генома человека.

2.Основными понятиями и терминами по теме.

3.Навыками проведения анализа фрагмента ДНК с помощью базы данных NCBI.

Оснащение занятия:

1.Таблицы

2.Мультимедийный проектор

3.Компьютеры

4.Билеты с ситуационными задачами

Хронологическая карта занятия:

1.Организационная часть.

2.Письменный тестовый контроль базового уровня знаний.

3.Разбор теоретического материала.

4.Самостоятельная работа студентов и текущий контроль за выполнением заданий.

5.Проверка выполненных работ в тетрадях и альбомах.

6.Установка задания для подготовки к следующей теме.

Теоретический обзор

В 1920 г. Ганс Винклер предложил термин геном — "совокупность генов, заключенных в гаплоидном наборе хромосом организмов одного биологического вида". Геном организма включает суммарную ДНК гаплоидного набора хромосом и каждого из внехромосомных генетических элементов, содержащихся в отдельной клетке зародышевой линии многоклеточного организма. Физический размер генома у разных биологических видов различается. У кишечной палочки — 4х106 п.н., у дрозофилы — 1,4х108 п.н., у человека 3,3х109 п.н. Физическое расстояние на генетической карте хромосомы (порядок расположения генетических маркёров в хромосоме) выражается в морганидах (единица Моргана — единица сцепления генетических маркёров; 1М = 100 сантиморганид). На генетической карте 1 сантиморганида (1 сМ) соответствует физическому расстоянию между двумя маркёрами, рекомбинация между которыми происходит с частотой 1%. 1 сМ примерно соответствует 1 млн. п.н. Геном «любит» транскрибироваться. Промоторы расположены повсеместно, с большинства которых экспрeссируются некодирующие РНК, функции которых на сегодняшний день неизвестны. По разным данным у человека транскрибируется от 50% до 80% геномной ДНК, из которой 2% РНК транслируется в белки, а 98% являются некодирующими РНК. Все это огромное разнообразие различных РНК ученые пытаются систематизировать и исследовать. Систематизирование заключается в аннотации транскриптов на геноме, в результате чего получаются гены. Гены же являются объектом изучения генетики, медицинской генетики, чьей задачей является изучение наследования разных аллелей генов и связи их с фенотипом.

Секвенирование

Для установления точной нуклеотидной последовательности определенного фрагмента ДНК на практике наиболее широкое распространение получил метод секвенирования. Секвенирование (от лат. Sequentum — последовательность) — комплекс методов направленных на расшифровку аминокислотной или нуклеотидной последовательности биополимеров (белков и нуклеиновых кислот). Секвенирование ДНК — прочтение нуклеотидной последовательности первичной структуры дезоксирибонуклеиновой кислоты.

В основе реакции секвенирования лежит в принцип удлинения новосинтезированной цепи ДНК на изучаемой матрице (фрагмент ДНК, например, продукт ПЦР) при участии праймера, набора дезоксирибонуклеотид-трифосфатов и ДНК-полимеразы. Помимо

природных трифосфатов в реакцию также добавляется один из 4 химически измененных дезоксирибонуклеотид-трифосфатов (терминаторов). В качестве таких терминаторов выступают ди-дезоксирибонуклеотид-трифосфаты (ddGTP, ddATP, ddTTP и ddCTP). Терминаторные буквы участвуют в реакциях секвенирования раздельно друг от друга при более низкой концентрации относительно их природных аналогов, таким образом, что в результате прохождения реакции они могут случайно встраиваться в растущую цепь обрывая её рост в различных местах по всей длине матрицы. При проведении четырех одинаковых реакции с разными ди-дезоксирибонуклеотид-трифосфатами в каждой из пробирок накапливается набор дочерних молекул ДНК различной длины, оканчивающихся строго на один и тот же нуклеотид. После электрофореза продуктов этих реакций в 4 соседних дорожках проводится считывание информации от более коротких фрагментов к более длинным, при этом выявляемый пошаговый порядок удлинения цепей

иотражает последовательность нуклеотидов в составе анализируемой ДНК-матрицы. При секвенировании геномной ДНК всегда следует помнить, что получаемая картина отражает нуклеотидную последовательность обоих аллелей изучаемого фрагмента гена. Поэтому в случае гетерозиготной мутации (например, нуклеотидной замены) в определенном месте авторадиограммы будут одновременно видны две полосы, соответствующие нормальному и мутантному основаниям. В случае гомозиготной мутации, а также в редких случаях секвенирования «однокопийной» ДНК (например, клонированной ДНК или фрагмента гена с Х-хромосомы у индивида мужского пола) мутация будет определяться как одна полоса, расположенная в атипичном сайте по отношению к нормальному сиквенсу.

Одномоментно может быть секвенирован участок ДНК средней длинной около 500 п.о., поэтому для исследования более длинных участков гена они должны быть амплифицированы в виде совокупности коротких перекрывающихся фрагментов, каждый из которых секвенируется отдельно. Обычно для обнаружения мутаций секвенируются только экзоны изучаемого гена вместе с примыкающими к ним интронными последовательностями (областями сплайсинга). Иногда при небольшом размере гена проводится секвенирование целой молекулы кДНК, получаемой при проведении обратнотранскриптазной ПЦР.

В настоящее время техника секвенирования ДНК значительно усовершенствовалась благодаря внедрению в практику лазерно-флюоресцентных автоматических секвенаторов

– специальных приборов, осуществляющих детекцию продуктов реакции в геле путем регистрации интенсивности их флюоресценции. Для этого реакция секвенирования проводится с использованием флуоресцентно-меченных ди-дезоксирибонуклеотид- трифосфатов. При дальнейшем проведении капиллярного гель-электрофореза, флуоресцентно-меченные молекулы ДНК возбуждаются лазерным лучом и испускают сигнал определенной длиной волны, который фиксируется специальными датчиками и визуализируется на экране в виде разноцветных пиков. Для автоматического считывания

ианализа продуктов реакции используется соответствующее компьютерное программное обеспечение.

Проект «Геном человека»

В 1990 году начался крупнейший проект в области биологии «Геном человека», инициатором и руководителем которого был Джеймс Уотсон. Целью проекта было определение последовательность нуклеотидов ДНК человека и идентификация генов. Ожидалось, что выполнение проекта займет 15 лет. Связано это в первую очередь с большим размером генома человека – 3х109 нуклеотидов (рис. 1). А во вторую очередь с самим алгоритмом секвенирования, в котором весь геном разбивался на огромное количество небольших участков длиной около 100т.п.н., а затем уже эти участки секвенировались шаг за шагом примерно по 500 нуклеотидов. Весь этот процесс занимал большое количество времени и конечно участия большого количества людей.

Масштабность и сложность проекта, безусловно, подразумевало участие в нём большого количества коллективов из многих стран: США, Китай, Франция, Германия, Япония, Великобритания, в том числе и из России. В программе «Геном человека» участвовало более 400 Российских исследователей из 30 научных учреждений, ими были опубликованы сотни научных работ, описывающих те или иные участки генома человека и модельных животных. В базах данных Российскими учеными было зарегистрировано более миллиона нуклеотидных пар фрагментов ДНК человека и многие сотни генетических маркеров, имеющих большое значение для детального анализа генома человека.

Первая («черновая») версия генома человека была опубликована в 2001 году, в журнале «Nature». Эта версия впервые дала представление о почти 90% последовательности генома размером 3,2 миллиарда пар нуклеотидов. Оказалось, что геном человека содержит не так уж много генов, намного меньше, чем было предсказано экспертами – менее 30 тысяч. И на сегодняшний день ведётся работа по установлению функций этих генов, на что потребуется, по меньшей мере, столетие.

Не смотря на успешное завершение проекта «Геном человека», сама технология секвенирования продолжает развиваться и совершенствоваться. На смену технологии Сэнгера, которая и по сей день активно используется во всем мире, пришла так называемая технология нового поколения (NextGen). Основная цель данного направления сделать доступным индивидуальное секвенирование генома человека стоимостью менее 1’000 долларов, что позволит приблизиться к созданию персонализированной медицины, когда по индивидуальному секвенированию генома можно будет диагностировать и лечить заболевания.

Структура генома

Результатом определения нуклеотидной последовательности человека стало картирование и описание всех основных геномных элементов: гены, псевдогены, повторы, транспозоны, ретротранспозоны (рис. 1). Хотя конечно больше всего научное сообщество, да и весь мир, интересовали гены. При анализе последовательности генома человека было найдено 22,585 генов, кодирующих разнообразные белки. Надо отметить, что периодически это число изменяется до сих пор, причем как в большую сторону, так в меньшую.

Все вместе, кодирующие участки ДНК составляют не более 1.5% от длины всего генома (рис. 2). Средняя длина белок-кодирующего гена составляет около 20 т.п.н. Самый длинный ген, кодирующий один из белков мышц - миодистрофин, содержит 2,5 миллиона нуклеотидов. Исследование функции генов это индивидуальный процесс, требующий несколько лет работы научной лаборатории. На сегодняшний день у человека известна функция примерно для половины генов, и оценивается, что каждый год примерно для 100 генов открывают функцию (рис. 3).

Интересно, что, несмотря на малую долю, занимаемую кодирующими участками, примерно 80% всего генома с той или иной скоростью транскрибируется, просто многие транскрипты не транслируются в белки. На сегодняшний день, данные некодирующие РНК являются самым модным и интересным объектом изучения всего мира. И полученные результаты говорят, что во многих случаях некодирующие РНК несут регуляторную функцию в различных процессах и взаимодействиях. Исходя из этого, поменялось и определение самого понятия ген, которое сегодня звучит так: «Ген – это совокупность геномных последовательностей, кодирующих сцепленный набор потенциально перекрывающихся функциональных продуктов». Еще раз хочется отметить, что под «функциональными продуктами» понимают теперь как белки, так и некодирующие РНК.

Разные хромосомы человека содержат различное количество генов. Величина эта зависит не только от размера хромосомы, но и от плотности генов на ней. Самое большое число генов находится на хромосоме 1, - 2316 генов, самое маленькое – на Y хромосоме – 94

гена. Первая хромосома – самая длинная, плотность генов, однако, самая большая не на ней, а на хромосоме 19 – в среднем 26 генов на каждый миллион пар оснований длины. Псевдогенами называют последовательности, родственные генам, но лишенные способности кодировать белки. Как правило, псевдогены не имеют промотора и интронов. Псевдогены, в которых отсутствуют интроны гена-предшественника, называют процессированными псевдогенами. Предполагается, что процессированные псевдогены возникают путем интеграции в геном кДНК, образовавшейся в результате обратной транскрипции соответствующей мРНК, перед этим претерпевшей полный сплайсинг. Встраивание такой кДНК может быть обеспечено с помощью белковых продуктов, кодируемых автономными ретротранспозонами. Интересно, что многие псевдогены человека сохраняют очень большое сходство с функциональными родственниками. Сходство между псевдогенами и родственными им генами может достигать от 40% до почти 100%.

Процессированные псевдогены наиболее распространены в геноме человека. На сегодняшний день зарегистрировано 17609 псевдогенов. Детальное исследование части их показало, что около 20% транскрипционно активно. В этом случае, подобные псевдогены могут являться источником некодирующей РНК, способной выполнять регуляторную функцию.

Другим часто встречающимся элементом в геноме человека являются повторы. Насчитывается их около 5 миллионов, и покрывают собой почти половину генома. Повторы делятся на два основных класса: тандемные и диспергированные. Тандемные повторы представляют собой повторяющиеся последовательности ДНК различной длины: микросателлиты содержат ДНК повторы от 1 до 6 нуклеотидов, минисателлиты от 7 до 100 нуклеотидов, сателлиты более 100 нуклеотидов. Диспергированные повторы включают в себя транспозоны и ретротранспозоны. Транспозоны – это мобильные элементы, репликация которых включает перемещение своей ДНК последовательности на новое место в геноме. В геноме человека они занимают 2-3%, такие как MER1, MER2. Ретротранспозоны – это мобильные элементы, которые могут самовоспроизводиться в геноме, осуществляя реакцию обратной транскрипции. В геноме человека они занимают 42%, среди них такие семейства как Alu, MIR, LINE1, LINE2.

Также в отдельную группу элементов генома принято выделять регуляторные участки. В эту группу входят как базовые элементы, такие как промоторы, так и не менее важные дополнительные регуляторные элементы энхансеры, сайленсеры, инсуляторы. В геноме человека их насчитывается несколько сотен тысяч, что составляет порядка 10% генома.

По окончанию проекта «Геном человека» в 2003 году стартовал следующий международный исследовательский проект ENCODE (The Encyclopedia of DNA Elements). Основной задачей его была характеристика функциональных элементов генома. Первый пилотный проект был выполнен на 1% генома человека (30Mb), но уже в 2012 году были опубликованы результаты по исследованию всего генома человека. Сегодня каждый может убедиться в колоссальности этого проекта, зайдя на сайт ENCODE, выбрав любой интересующий район генома человека и увидев какое количество данных там представлено. Все это, безусловно, сильно помогает ученым в исследованиях функционирования генома, как в норме, так и патологии.

Рис. 1. Процентное содержание основных генетических элементов человека [по Наследственные болезни. Национальное руководство, 2012].

Рис. 2. Количество генов у представителей животного и растительного мира [Nature, 2004].

Рис. 3. Классификация и количество генов с известной функцией [по http://commons.wikimedia.org/wiki/File:Human_genome_by_functions.svg].

Генетические карты

Генетическая карта это схема взаимного расположения и относительных расстояний элементов генома, таких как гены, генетические маркеры. Стоит еще раз отметить, что генетическая карта правильно отражает порядок расположения генетических маркеров на хромосомах, при этом значения расстояний между ними не соответствуют реальным физическим расстояниям. Генетическая карта была придумана как инструмент, который должен облегчить картирование всех генов человека, особенно генов наследственных болезней.

Сами хромосомы представляют собой группы сцепления генов, и одной из задач построения генетических карт сцепления является отнесение исследуемого гена или последовательности нуклеотидов к конкретной группе сцепления. При составлении генетических карт указывается группа сцепления, полное или сокращенное название генов, расстояние в процентах от одного из концов хромосомы. Понятно, что, генетические карты сцепления являются наименее точными из всех имеющихся типов генетических карт, и их можно рассматривать только в качестве первого приближения к реальным физическим картам. Тем не менее, построение и использование генетических карт помогло за короткое время в геноме человека картировать несколько тысяч генов.

В последнее время, благодаря активному развитию технологии секвенирования нового поколения (NextGen), становится возможным определение нуклеотидной последовательности генома de novo, на основании которой уже строится физическая карта, в которой расстояние между маркерами определяется в парах нуклеотидов.

Базы данных генома человека

Еще в начале проекта «геном человека» участники проекта договорились вся получаемая информация о генетических последовательностях будет находится в свободном доступе в виде баз данных. Таким местом стал сервер национального центра биотехнологической информации США (National Center for Biotechnology Information (NCBI) - www.ncbi.nlm.nih.gov), в задачу которого входит хранение и анализ данных по молекулярной биологии, биомедицине и генетике. На его базе были созданы десятки различные базы данных: GenBank – база данных нуклеотидных последовательностей, Genome – база данных целых геномов различных организмов, Gene – база данных зарегистрированных генов различных организмов, dbSNP – база данных однонуклеотидных полиморфизмов (SNP), dbEST – база данных экспрессирующихся последовательностей (EST), UniGene – база данных кластеров экспрессирующихся последовательностей, и так далее.

При существующих технологиях получения и анализа нуклеотидных последовательностей базы данных NCBI динамично развиваются. Уникальность системы NCBI, что все созданные базы данных взаимосвязаны с собой. Исследуя какой-то объект, например ген, можно легко получить всю интересующую информацию о местоположении гена, его экспрессии, его белке, консервативности, публикаций по теме исследования данного гена. Сегодня, живя в эпоху расцвета биоинформатики, различными учеными каждый день создаются все новые специфичные базы данных. Но базы данных организованных на сервере NCBI при этом остаются для всего мира неким эталоном и при публикации статей, впервые получаемые нуклеотидные последовательности, обязательно регистрируются в одной из баз данных NCBI.

Существует также и обратная сторона. При такой доступности регистрации любой информации иногда встречается противоречивая информация, или ошибочная. Особенно это касается базы данных однонуклеотидных полиморфизмов, изучать которые до недавнего времени было модно. На сегодняшний день в геноме человека описано и зарегистрировано около 10 милионов однонуклеотидных полиморфизмов, среди которых много ложных. Показательным также является база данных Gene. Интересно, что при наблюдении за динамикой изменения её размера можно заметить, что с каждой новой версией размер базы данных увеличивается, но иногда и уменьшается. С точки зрения биологической – это нонсус. Количество генов может увеличиваться по мере их открытия учеными, но никак уж не уменьшаться. Однако ошибки могут встречаться и здесь.

Остается добавить, что все базы данных хорошо организованы, и даже неопытному пользователю не составит труда разобраться с тем, как найти нужную информацию. Также к каждой базе данных можно найти краткое описание как она устроена и как с ней работать.

Гомологичность геномов

Известно, что ежедневно в отдельной клетке человека возникает около 100 новых мутаций. Большинство из них нейтральные, и имеют возможность накапливатся в геноме. В пределах одной группы мутации распределяются равномерно. Если группы разделились, то накопление мутаций идёт независимо. Чем дольше разделены группы, тем больше различий в геноме.

При доступности большого количества геномов возникает естественное желание сравнить их, чтобы определить разницу между видами, их уникальность. Данные исследования относятся к области сравнительной геномики. На сегодняшний день хорошо известно, что шимпанзе является самым близким к человеку видом, отличаясь друг от друга чуть более 1% (предки человека отделились от шимпанзе 5-7 млн лет назад). В то же время для мыши 80 % генома совпадает с человеческим. Конечно это средний показатель по всему геному. При детальном анализе видно, что в геноме человека существуют как высоко консервативные последовательности, так и низко консервативные, или же вообще

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]