Lection03
.pdfЛекция 3. Банки биологических данных и форматы данных
Принятых расширений для файлов обоих форматов пока что нет, но наиболее часто используемые следующие:
.gb, .genbank, .fas, .fasta, .fs
Лекция 3. Банки биологических данных и форматы данных
Рассмотрим пример полуения данные генетических последовательстей рода Ctenotus (Ктетонус) род ящериц из смейства сцинковые.
Лекция 3. Банки биологических данных и форматы данных
Рис. 2. Ctenotus (Ктетонус)
Лекция 3. Банки биологических данных и форматы данных
Ðèñ. 3. GenBank
Лекция 3. Банки биологических данных и форматы данных
Перейдем по ссылке Entrez Nucleotide
В главном поисковом окне введем (*12S*) AND Ctenotus[Organism] и нажмем кнопку Search.
Мы указали, что хотим искать все записи, у которых в поле Organism стоит слово Ctenotus, а в любых других полях должно быть указано 12S это название митохондриального гена,
который нам потребуется для дальнейшего анализа.
Лекция 3. Банки биологических данных и форматы данных
Митохондрия энергетическая станция клетки; основная функция окисление органических соединений и использование освобождающейся при их распаде энергии в синтезе молекул АТФ, который происходит за сч¼т движения электрона по электронно-транспортной цепи белков внутренней мембраны.
Лекция 3. Банки биологических данных и форматы данных
АТФ аденозинтрифосфат нуклеотид, основная роль которого состоит в том, что он является универсальным источником энергии для всех биохимических процессов, протекающих в живых системах.
Лекция 3. Банки биологических данных и форматы данных
GenBank
Митохондриальная ДНК представляет собой замкнутую кольцевую двуспиральную молекулу, в клетках человека имеющую размер 16569 нуклеотидных пар, что приблизительно в 105 раз меньше ДНК, локализованной в ядре.
Лекция 3. Банки биологических данных и форматы данных
Ðèñ. 4. Entrez Nucleotide
Лекция 3. Банки биологических данных и форматы данных
В результате поиска мы получим записи из базы данных. Наиболее важная информация для нас следующая:
название вида,
название гена и то, как именно он секвенирован (полностью или нет),
длина гена,
accession ID уникальный идентификатор записи в базе.