- •Глава 9 Физические модели баз данных
- •Файловые структуры, используемые для хранения информации в базах данных
- •Стратегия разрешения коллизий с областью переполнения
- •Организация стратегии свободного замещения
- •Индексные файлы
- •Файлы с плотным индексом, или индексно-прямые файлы
- •Файлы с неплотным индексом, или индексно-последовательные файлы
- •Организация индексов в виде в-tree (в-деревьев)
- •Моделирование отношений «один-ко-многим» на файловых структурах
- •Моделирование отношения 1:м с использованием однонаправленных указателей
- •Алгоритм нахождения нужных записей «подчиненного» файла
- •Алгоритм удаления записи из цепочки «подчиненного» файла
- •Инвертированные списки
- •Модели физической организации данных при бесфайловой организации
- •Структура хранения данных для ms sql 6.5
- •Структуры хранения данных в sql Server 7.0
- •Карты распределения блоков
- •Карты свободного пространства
- •Карты размещения
- •Страницы данных
- •Строки данных
- •Текстовые страницы
- •Страницы журнала транзакций
- •Архитектура разделяемой памяти
- •Глава 10 Распределенная обработка данных
- •Терминология
- •Модели «клиент—сервер» в технологии баз данных
- •Двухуровневые модели
- •Модель удаленного управления данными. Модель файлового сервера
- •Модель удаленного доступа к данным
- •Модель сервера баз данных
- •Модель сервера приложений
- •Модели серверов баз данных
- •Типы параллелизма
- •Глава 11 Модели транзакций
- •Свойства транзакций. Способы завершения транзакций
- •Журнал транзакций
- •Журнализация и буферизация
- •Индивидуальный откат транзакции
- •Восстановление после мягкого сбоя
- •Физическая согласованность базы данных
- •Восстановление после жесткого сбоя
- •Параллельное выполнение транзакций
- •Уровни изолированности пользователей
- •Гранулированные синхронизационные захваты
- •Предикатные синхронизационные захваты
- •Метод временных меток
- •Глава 12 Встроенный sql
- •Операторы, связанные с многострочными запросами
- •Оператор определения курсора
- •Оператор открытия курсора
- •Оператор чтения очередной строки курсора
- •Оператор закрытия курсора
- •Удаление и обновление данных с использованием курсора
- •Хранимые процедуры
- •Триггеры
- •Динамический sql
- •Глава 6. Проектирование реляционных бд на основе
- •Глава 7. Мифологическое моделирование . . .............. 121
- •Глава 8. Принципы поддержки целостности
- •Глава 9. Физические модели баз данных................. 162
Карты распределения блоков
В данных картах хранится информация о распределении блоков. Карта распределения блоков состоит из стандартного заголовка и одного битового массива в 64 000 битов. Каждый бит характеризует один блок. Поэтому одна страница карты распределения описывает пространство в 64 000 блоков или 4 Гбайт данных.
Карты распределения блоков делятся на два типа:
О Глобальная карта распределения (Global allocation map, GAM) хранит информацию об использовании блоков. Если бит установлен в 0, то блок занят данными, если в 1 — то блок свободен.
Q Вторичная глобальная карта распределения (Secondary global allocation map, SGAM) хранит информацию о типе блоков. Если бит установлен в 1, то блок смешанный и минимум одна страница в нем свободна, в остальных случаях (блок свободен, блок смешанный, но свободных страниц нет, блок однородный) бит равен 0.
При отведении пространства сервер использует обе карты распределения.
Карты свободного пространства
Степень заполнения страниц в SQL 7.0 отслеживает специальный механизм — карты свободного пространства (Page free space page, PFS). Каждая PFS-страница хранит информацию о 8000 страниц, по 1 байту на страницу. Каждый байт представляет собой битовую карту, которая сообщает о степени занятости страницы и о том, принадлежит ли она объекту.
Первые страницы файла БД всегда используются под карты распределения. Страница № 1 состоит из двух частей. После стандартного заголовка страницы следует заголовок файла, содержащий его описание, затем размещается блок PFS. Страницы PFS повторяются через каждые 8000 страниц, если размер файла
превосходит один блок. Страница № 2 — это GAM, страница № 3 — это SGAM. Карты распределения блоков повторяются через каждые 512 000 страниц. Кроме того, каждая девятая страница первичного файла — это загрузочная страница БД (database boot page), содержащая описание БД и параметры конфигурации.
Карты размещения
Для организации связи между блоками и расположенными на них объектами используются индексные карты размещения (Index Allocation Map, IAM). Каждая таблица или индекс имеют одну или более страниц IAM. В каждом файле, в котором размещаются таблица или индекс, существует минимум одна карта размещения для этой таблицы или индекса. Страницы IAM размещаются произвольно внутри файла и отводятся по мере необходимости. IAM объединены друг с другом в цепочку двунаправленными ссылками. Указатель на первую карту размещения содержится в поле FirstIAM системной таблицы Sysindex.
Каждая IAM описывает некоторый диапазон блоков и представляет собой битовую карту: если бит установлен в 1, то в данном блоке есть страницы, принадлежащие данному объекту, если в 0 — то нет.
Все страницы размещения не связаны напрямую с некоторым объектом БД, они соответствуют некоторой системной информации, поэтому параметр «идентификатор объекта» для всех этих страниц одинаков и равен 99.
Страницы данных
На самом общем уровне здесь, так же как и в предыдущей версии, страница данных делится на 3 зоны: заголовок, область данных и таблицу смещений, но размер страницы увеличен, размер заголовка также и некоторые отличия существуют и в структуре остальных зон.
Прежде всего стоит отметить, что в отличие от SQL Server 6.5 в новой версии страницы данных не связаны друг с другом в цепочки. За связь между страницами и объектами отвечает новая специальная структура — карты размещения.
Кроме того, ранее данные на странице хранились непрерывно. При удалении строки данные внутри страницы перемещались так, чтобы не оставалось пустот. Однако такой подход затруднял строчные блокировки. И в новей версии данные на странице не обязательно хранятся непрерывно. Здесь допустимы пропуски. При удалении строки пустое пространство помечается и потом его может занять новая строка, но перемещения строк не происходит.
В SQL Server 7.0 теперь поддерживается классический термин слот (Slot), и это место размещения строки на странице. Если таблица не имеет кластеризованного индекса, то номер слота является идентификатором строки и не меняется, пока не будет удалена соответствующая строка. Если же таблица имеет кластеризованный индекс, то слоты располагаются в порядке, задаваемом индексом.