Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ginter_E.K._Medicinskaya_genetika_(Medicina,200...docx
Скачиваний:
40
Добавлен:
25.11.2019
Размер:
1.82 Mб
Скачать
      1. Некоторые особенности организации генома человека

Только 1,1 —1,4 % всего секвенированного генома состав­ляют последовательности, кодирующие белки. Это 5 % из 28 % сиквенса, последовательностей нуклеотидов, которые транскрибируются в РНК. Более 50 % ДНК представлено по­вторяющимися последовательностями разных типов: 45 % в 4 классах паразитических элементов ДНК, возникших из транспозонов [длинные вставочные элементы — LINE, ко­роткие вставочные элементы — SINE, LTR (ретровирусопо­добные) транспозоны и ДНК-транспозоны], 3 % в повторах, состоящих из нескольких нуклеотидов, и 5 % в недавних дуп­ликациях больших сегментов ДНК, происходящих из разных частей генома. Количество классов 1 и 3, несомненно, возра­стет, когда начнутся исследования гетерохроматиновых райо­нов хромосом. Большая часть паразитической ДНК возник­ла, вероятно, в результате обратной транскрипции РНК. Ме­стами геном выглядит как море обратно транскрибированной РНК с небольшой примесью генов.

По-видимому, большинство повторов представляет собой паразитические, самодостаточные элементы ДНК, т.е. способ­ные самовоспроизводиться, которые используют геном чело­века как удобного хозяина. Длинные вставочные элементы (LINE) содержат внутренние промоторы для РНК-полимера- зы II и кодируют две открытые рамки считывания. Все необ­ходимые для транскрипции регуляторные элементы содержат также LTR-транспозоны. Самодостаточная повторяющаяся ДНК у центромер и теломер организована в крупные сегмен­ты. Редкость повторов в некоторых высокорегулируемых час­тях генома предполагает, что их инсерция может нарушать ре­гуляцию генов и, следовательно, повторы могут быть вредны­ми. Однако обогащение Alu-повторами обогащенных генами областей с большим содержанием ГЦ предполагает, что Alu- повторы обладают каким-то положительным эффектом. По­вторы могут быть местом, где создаются гены с новыми функ­циями, а также происходит перестройка генов.

У человека все паразитические повторы ДНК кажутся ста­рыми, практически нет доказательства продолжающихся ре- инсерций. Поэтому они могут быть использованы для анали­за эволюционной истории генома. В противоположность ге­ному человека геном мышей имеет массу вновь внедренных паразитических последовательностей, геном мыши выглядит более молодым и динамичным. В геноме человека обнаруже­ны ГЦ- и АТ-богатые области. В ГЦ-богатых областях плот­ность генов выше, а средний размер интронов меньше. «Раз­бавление» интронами кодирующих последовательностей су­щественно затрудняет компьютерный поиск генов. Генрегу- лирующие последовательности нуклеотидов в геноме у чело­века выявляют на основе их сходства у разных видов, в том числе тех, у которых функционально незначимая ДНК встре­чается редко.

Одним из наиболее важных разделов программы «Геном человека» является обнаружение генов в секвенированных последовательностях генома. Положение многих генов опре­делено путем соотнесения сиквенсов мРНК с геномным сик- венсом, для остальных генов локализацию устанавливают с помощью специальных компьютерных программ. Просекве- нировано 11 174 полноразмерных мРНК, относящихся к 10 742 генам (2,4 % генов дают множественный сплайсинг). Соотнесение EST с рабочим сиквенсом обусловливает более высокую оценку множественного сплайсинга. Согласно этой оценке, 60 % генов дают несколько мРНК, но эта оценка мо­жет быть завышена.

Поиск генов в сиквенсе ведут также с помощью ортологи- ческого подхода, т.е. выявления последовательностей нуклео­тидов, похожих на последовательности генов у других видов. Это делают, используя компьютерную программу BLAST, по геномным или(лучше) мРНК-сиквенсам. Еще один путь по­иска генов — это выявление паралогов (членов семейства, воз­никших в результате дупликации генов). Использованы так­же и другие методы поиска генов в секвенированной ДНК человека. Следует иметь в виду, что некоторые классы генов могут быть вообще пропущены при применении современ­ных методов поиска генов в секвенированных последователь­ностях. Гены могут быть пропущены, если уровень их эксп­рессии низкий или они экспрессируются в небольшом числе клеток, или их последовательности быстро эволюционируют и их трудно найти по белковой гомологии и при сравнении геномов. Одноэкзоновые гены, кодирующие маленькие бел­ки, также легко могут быть пропущены, так как EST для та­ких генов нельзя отличить от геномного загрязнения и гомо­логия для маленьких белков трудно определяется. В целом проблемы идентификации генов в секвенированных последо­вательностях генома ясно показывают, что наши представле­ния о структуре генов, не говоря уже об их регулирующих элементах, явно недостаточны и неполны.

Общественный проект «Геном человека» дает оценку бе- локкодирующих генов в 31 ООО, в настоящее время выявлено по результатам сиквенса менее 20 ООО генов. Среди них иден­тифицировано 740 генов для РНК, которая не кодирует бел­ки, но, вероятно, таких генов будет обнаружено значительно больше. У дрожжей кодирующих генов 6000, у дрозофилы — 13 000, у растений (арабидопсис) — 26 000. Поэтому вопрос, за счет чего обеспечивается сложность организации человека по сравнению с другими более просто организованными ор­ганизмами, остается открытым.

Плотность генов в человеческом геноме существенно ниже, чем у других видов: на 106 п.н. у дрожжей приходится 483 гена, у червя (caenorhabditis elegans) — 197, у дрозофи­лы — 117, у арабидопсис — 221 ген. В хромосоме 21 человека плотность генов на 106 п.н. составляет 7, в хромосоме 16 — 16, в среднем на секвенированную часть генома человека — 12. К сожалению, методы компьютерного предсказания генов по результатам сиквенса еще очень неточны. Могут быть ошибочными не только точки старта и финиша, но и пропу­щены или найдены ошибочно целые экзоны.

Только 94 из 1278 семейств белков в геноме человека свойственны лишь позвоночным. Основные различия между человеком и дрожжами или мухой заключаются в сложности организации белков человека, которая проявляется большим числом доменов на белок, а также новыми комбинациями доменов. Некоторое количество генов получено человеком, по-видимому, прямо от бактерий в результате так называемо­го горизонтального переноса генов. Очевидно, бактериальный геном мог служить прямым донором генов для позвоночных.

У позвоночных наблюдаются усовершенствование и появле­ние de novo двух типов генов, специфичных для позвоночных, таких как нейрональные гены, гены свертывания крови и гены приобретенного иммунного ответа, с одной стороны, и генов, обеспечивающих увеличение точности контроля внутриклеточ­ных процессов (гены для внутри- и межклеточных сигналов, программированной клеточной гибели и контроля транскрип­ции генов), — с другой. У человека чаще, чем у других видов, геном которых секвенирован, встречается альтернативный сплайсинг в генах, т.е. реализуется больше путей объединения экзонов для создания молекул функциональной мРНК.

Сиквенс генома человека позволил провести сравнение ге­нетических и физических карт по 5282 полиморфным локусам из генетической карты, положение которых определено в тер­минах как сантиморганов (или сантиморганид), так и в мил­лионах пар нуклеотидов вдоль хромосом. После такого анали­за стали очевидными две особенности. Средняя частота ре­комбинаций увеличивается по мере уменьшения длины хро­мосомных плеч. Длинные плечи имеют среднюю частоту ре­комбинации 1 сМ, а наиболее короткие плечи — 2 сМ на 1 млн п.н. Частота рекомбинаций уменьшается вблизи цент­ромер, а повышается в терминальных 20—35 млн п.н. Наибо­лее заметно это увеличение на мейотической карте мужчин. Полагают, что кроссинговер необходим для нормального мей- отического расхождения гомологичных хромосом у эукарио­тов. Крайний случай представляет собой псевдоаутосомные области X и У, которые спариваются во время мужского мейо- за. Физически эта область занимает всего 2,6 млн п.н., а ее ге­нетическая длина составляет 50 сМ. В результате кроссинго­вер в этой области происходит практически в каждом мейозе.

Результаты сиквенса генома человека стимулировали вы­явление однонуклеотидного полиморфизма (ОНП), который предполагают использовать для картирования генов предрас­положенности к частым мультифакториальным заболевани­ям. Международная рабочая группа по картированию ОНП представила карту для 1,42 млн ОНП, распределенных по всему геному со средней плотностью 1 ОНП на 1,9 тыс. п.н.; 60 ООО ОНП находятся в экзонах генов, а 85 % экзонов нахо­дятся не далее 5 тыс п.н. от ближайшего ОНП.

Обнаружение генов наследственных заболеваний значите­льно облегчилось с использованием чернового сиквенса, так как он доступен всем исследователям благодаря интернету. Возможна идентификация генов-кандидатов по их положе­нию в геноме с помощью компьютерных программ прямо по базе данных сиквенса с последующим скринингом на мута­ции, дополненным информацией о структуре гена. Таким об­разом, найдено уже более 30 генов наследственных болезней. Сиквенс оказался полезным для выявления причин частых

хромосомных делеционных синдромов. Показано, что по­вторные делеции возникают в результате гомологичной ре­комбинации и неравного кроссинговера между большими и почти идентичными внутрихромосомными дупликациями. Сиквенс позволяет также легко идентифицировать паралоги генов заболеваний. В частности, найдено 286 паралогов для 971 гена наследственных болезней из OMIM.

Предполагают, что сиквенс будет завершен в течение от­носительно короткого периода времени. Особое внимание будет обращено не только на создание более совершенных компьютерных программ идентификации генов, но и их регу­ляторных областей. По-видимому, успех двух последних на­правлений исследований будет зависеть от успешности сик­венса геномов других высших животных. На основе сиквенса генома человека будет создан каталог генетических вариаций у человека. Наконец, в широких масштабах начнется работа по функциональной геномике, где на первое место выйдут изучение активности генов и их взаимодействия с другими генами, определяющими формирование различных феноти­пических признаков.

В 70—80-е годы XX в. в молекулярной генетике сформи­ровалось новое научное направление исследований, кото­рое получило название «генетическая инженерия», или технология рекомбинантных ДНК. Это направление мо­жет быть разделено на две большие области: методы кло­нирования ДНК и методы анализа ДНК, прежде всего сиквенса.

Клонирование ДНК in vivo включает 6 этапов: 1) получе­ние фрагментов ДНК (в том числе генов или их частей) с помощью ферментов рестрикции; 2) рекомбинация фраг­ментов; 3) вставка фрагмента ДНК в вектор; 4) трансфор­мация с помощью вектора организма хозяина; 5) скрининг на рекомбинантный вектор; 6) отбор интересующих иссле­дователя клонов.

Секвенирование фрагментов ДНК заключается в опре­делении последовательности нуклеотидов во фрагменте. Именно эта процедура позволяет, в частности, расшифро­вать структуру гена, установить природу мутаций в нем, определить аминокислотную последовательность в моле­куле белка, кодируемым этим геном на основе генетиче­ского кода, и т.д.

Наиболее распространенным методом, который испо­льзуют для секвенирования ДНК, является метод, разра­ботанный Фредериком Сэнгером. Этот метод называют еще дидезокси-методом, поскольку в нем используют ди- дезоксинуклеотиды для терминации синтеза цепи ДНК.

Три основные цели программы «Геном человека» включа­ют создание точной генетической карты, создание физи­ческой карты и сиквенс всего генома человека.

Точная генетическая карта генома человека с разреше­нием менее 1 сМ была создана с использованием разнооб­разных ДНК-полиморфизмов (ПДРФ, VNTR полимор­физм, мини- и микросателлиты, ОНП) и достаточно боль­шой выборки французских семей, иммортализованные ли­нии клеток от членов которых были доступны для анализа сцепления между этими маркерами и установления их вза­имного расположения.

Создана также физическая карта генома человека на основе анализа перекрывания, а следовательно, взаимного расположения клонированных фрагментов всей геномной ДНК в составе искусственных бактериальных и фаговых хромосом, маркированных STS и другими способами.

Для осуществления сиквенса генома человека ВАС-кло­ны, представляющие полноразмерный геном, разрезали на фрагменты и клонировали. Полученные в результате кло­нирования фрагментов субклоны секвенировали. Каждый раз секвенировали большое число одинаковых субклонов, чтобы быть уверенными в том, что каждый фрагмент ори­гинального ВАС-клона проанализирован несколько раз и при этом не допущено ошибок. Сиквенсы отдельных фрагментов объединяли с тем, чтобы получить последова­тельность нуклеотидов в каждом исходном ВАС-клоне. На­конец, сиквенс всего генома собирали путем соединения сиквенсов набора ВАС, перекрывающих весь геном. К на­чалу 2001 г. секвенировано и собрано с помощью компью­терных программ в протяженные участки около 90 % эу- хроматиновых районов генома. Законченным, однако, можно считать сиквенс только приблизительно для уА гено­ма, в которой каждая пара оснований секвенирована в среднем 8—10 раз.

Результаты «чернового» сиквенса генома человека, не­сомненно, представляют интерес как с общебиологиче­ских позиций (соотношение уникальных и повторяющих­ся последовательностей в геноме, соотношение последо­вательностей, кодирующих полипептиды и синтез РНК, плотность генов в геноме, эволюционное происхождение генома и его отдельных частей и др.), так и с практиче­ских позиций (секвенирование генов, обусловливающих наследственные болезни, выявление генов, представляю­щих интерес для фармакогенетики, создание карт различ­ных ДНК-полиморфизмов, которые могут быть использо­ваны для выявления генов предрасположенности к частым заболеваниям и др.).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]