Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЭУМКД_БД_2.doc
Скачиваний:
20
Добавлен:
23.09.2019
Размер:
6.01 Mб
Скачать

1.3.3. Типы данных

Современные СУБД позволяют обрабатывать данные самых разнообразных типов, среди которых наиболее распространёнными являются:

Целые числа. В столбцах, имеющих этот тип данных, обычно хранятся данные о ценах, количествах, возрасте сотрудников и т.д. Целочисленные столбцы часто используются также для хранения идентификаторов, таких как идентификатор клиента, служащего или заказа.

Десятичные числа (дроби). В столбцах данного типа хранятся числа, имеющие дробную часть, но которые необходимо вычислять точно, например курсы валют и проценты. Кроме того, в таких столбцах часто хранятся денежные величины.

Числа с плавающей запятой. Столбцы этого типа используются для хранения величин, которые можно вычислять приблизительно, например значения весов и расстояний. Числа с плавающей запятой могут представлять больший диапазон значений, чем десятичные числа, однако при вычислениях возможны погрешности округления.

Строки символов постоянной длины. В столбцах, имеющих этот тип данных, обычно хранятся инициалы, телефоны, коды товаров и т.п.

Строки символов переменной длины. Столбцы этого типа позволяют хранить строки символов, длина которых изменяется в некотором диапазоне.

Денежные величины. Во многих СУБД поддерживается тип данных MONEY или CURRENCY, который обычно хранится в виде десятичного числа или числа с плавающей запятой. Наличие отдельного типа данных для представления денежных величин позволяет правильно форматировать их при выводе на экран.

Дата и время. Поддержка значений даты/времени также широко распространена в различных СУБД, хотя способы её реализации довольно сильно отличаются друг от друга. Как правило, над значениями этого типа данных можно выполнять различные операции. Стандарт SQL2 включает определение типов данных DATE, TIME, TIMESTAMP и INTERVAL, а также поддержку часовых поясов и возможность указания точности представления времени (например, десятые или сотые доли секунды). Отметим, что наиболее универсальным способом хранения времени является т.н. unixtime, в котором время представлено целым числом, равным количеству секунд, прошедших с 1 января 1970 года до момента, сохранённого в виде unixtime.

Булевые (логические) величины. Некоторые СУБД явным образом поддерживают логические значения (TRUE или FALSE), а другие СУБД разрешают выполнять в инструкциях SQL логические операции (сравнение, логическое И/ИЛИ и др.) над данными.

Длинный текст. Многие СУБД поддерживают столбцы, в которых хранятся длинные текстовые строки (обычно длиной до 32000 или 65000 символов, а в некоторых случаях и больше). Это позволяет хранить в базе данных целые документы. Как правило, СУБД запрещает использовать эти столбцы в интерактивных запросах.

Неструктурированные потоки байтов. Современные СУБД позволяют хранить и извлекать неструктурированные потоки байтов переменной длины. Столбцы, имеющие этот тип данных, обычно используются для хранения графических и видеоизображений, исполняемых файлов и других неструктурированных данных. К примеру, тип данных IMAGE в SQL Server позволяет хранить потоки данных размером до 2 миллиардов байтов.

Азиатские символы. В последнее время все больше поставщиков СУБД стали включать в свои продукты поддержку строк переменной и постоянной длины, содержащих символы азиатских алфавитов. Однако над такими строками, как правило, нельзя выполнять операции поиска и сортировки.

Таблица – стандартные типы данных в SQL

Тип данных

Описание

CHAR(длина)

CHARACTER(длина)

Строки символов постоянной длины

VARCHAR(длина)

CHAR VARYING(длина)

CHARACTER VARYING (длина)

Строки символов переменной длины

NCHAR(длина)

NATIONAL CHAR(длина)

NATIONAL CHARACTER(длина)

Строки локализованных символов по­стоянной длины

NCHAR VARYING(длина)

NATIONAL CHAR VARYING(длина) NATIONAL CHARACTER VARYING(длина)

Строки локализованных символов пе­ременной длины

INTEGER

INT

Целые числа

SMALLINT

Малые целые числа

BIT(длина)

Цепочки битов постоянной длины

BIT VARYING(длина)

Цепочки битов переменной длины

NUMERIC(точность, степень)

DECIMAL(точность, степень)

DEC(точность, степень)

Числа

FLOAT(точность)

Числа с плавающей запятой

REAL

Числа с плавающей запятой низкой точности

DOUBLE PRECISION

Числа с плавающей запятой высокой точности

DATE

Дата

TIME(точность)

Время

TIMESTAMP(точность)

Дата и время

INTERVAL

Временной интервал

Различия в поддержке типов данных в разных СУБД существенно препятствуют переносимости приложений, в которых используется SQL. Причины подобных различий следует искать в самом пути, по которому развивались реляционные базы данных. Вот типичная схема:

1) Поставщик СУБД добавил в свой продукт поддержку нового типа данных, который обеспечивает новые полезные возможности для определённой группы пользователей.

2) Другой поставщик, оценив идею, ввел поддержку того же типа данных, но с небольшими модификациями, чтобы его нельзя было обвинить в слепом копировании.

3) Если идея оказалась удачной, то по прошествии нескольких лет рассматриваемый тип данных появляется в большинстве ведущих СУБД, став частью "джентльменского набора" базовых типов данных.

4) Далее этой идеей начинают интересоваться комитеты по стандартизации, чьей задачей является устранение произвольных различий в реализации идеи в ведущих СУБД. Но чем больше таких различий, тем труднее найти компромисс. Как правило, результатом деятельности комитета является вариант, который не соответствует ни одной из реализаций.

5) Поставщики СУБД начинают внедрять поддержку полученного стандартизированного типа данных, но поскольку они располагают обширной базой уже инсталлированных продуктов, то вынуждены сопровождать и старый вариант типа данных.

6) По прошествии длительного периода времени (обычно включающего выпуск нескольких новых версий СУБД) пользователи, наконец, полностью переходят к использованию стандартного варианта рассматриваемого типа данных, и поставщик СУБД начинает процесс исключения поддержки старого варианта из своего продукта.

В качестве примера рассмотрим форматы представления даты и времени в различных СУБД. Например, в DB2 существует сразу три типа данных:

DATE – представляет дату как "June 30, 1990"

TIME – представляет время как "12:30 P.M."

TIME STAMP – представляет конкретный момент времени с точностью до наносекунд.

Значения даты и времени можно представлять в виде строковых констант. Кроме того, поддерживаются арифметические операции над значениями даты. Ниже приведён пример допустимого запроса для СУБД DB2, в котором предполагается, что в столбце HIRE_DATE содержатся данные типа DATE:

SELECT NAME, HIRE_DATE FROM SALESREPS WHERE HIRE_DATE >= ‘05/30/2008’ + 15 DAYS

В СУБД MS SQL Server имеется единый тип данных для представления даты и времени – DATETIME, который напоминает тип данных TIMESTAMP из DB2. Если бы столбец HIREDATE имел тип DATETIME, в этой СУБД можно было бы выполнить такой запрос:

SELECT NAME, HIRE_DATE

FROM SALESREPS WHERE HIRE_DATE > ‘06/14/2008’

Поскольку в запросе не указано конкретное время, SQL Server по умолчанию примет, что время соответствует полуночи. Таким образом, запрос для SQL Server в действительности означает:

SELECT NAME, HIRE_DATE

FROM SALESREPS WHERE HIRE_DATE >= '06/14/2008 12:00AM'

Если информация о дате приёма служащего на работу была сохранена в базе данных в полдень 14 июня 2008 года, то строка, содержащая сведения об этом человеке, не попадёт в результаты запроса в SQL Server, однако попадёт в результаты запроса в DB2 (поскольку эта СУБД оперировала бы только датой). Кроме того, SQL Server поддерживает арифметические операции над датами с помощью набора встроенных функций. Так, рассматривавшийся выше запрос из DB2 можно переписать для SQL Server следующим образом:

SELECT NAME, HIRE_DATE

FROM SALESREPS WHERE HIRE_DATE >= DATEADD(DAY, 15, ‘05/30/2008’)

Это, конечно же, значительно отличается от синтаксиса DB2.

СУБД Oracle также поддерживает единственный тип данных для представления даты и времени, который называется DATE. Как и тип данных DATETIME в SQL Server, тип данных DATE в Oracle фактически соответствует типу данных TIMESTAMP из DB2.

Аналогично SQL Server, временная часть значения типа DATE по умолчанию принимается равной полуночи. Формат даты, принятый в Oracle по умолчанию, отличается от форматов, принятых в DB2 и SQL Server, поэтому версия запроса для Oracle имеет следующий вид:

SELECT NAME, HIRE_DATE FROM SALESREPS WHERE HIRE_DATE >= ‘14-JUN-08’

СУБД Oracle также поддерживает арифметические операции над датами, поэтому запрос из DB2 можно представить в виде:

SELECT NAME, HIRE_DATE FROM SALESREPS WHERE HIRE_DATE >= ‘3Q-MAY-08’ + 15

В конце концов, в стандарт SQL2 был введён набор типов данных для работы с датой и временем, основанных на рассмотренных типах данных из DB2, но не идентичных им. Помимо типов DATE, TIME и TIMESTAMP, появился также тип INTERVAL, предназначенный для хранения значений интервалов времени. В стандарте определены чёткие принципы выполнения арифметических операций над значениями даты и времени, принципы задания точности вычисления интервалов времени, учёта разницы между часовыми поясами и т.д.

Приведённые примеры наглядно демонстрируют, как незначительные отличия в реализации типов данных приводят к значительным отличиям в синтаксисе инструкций SQL. Эти отличия могут даже привести к тому, что, выполнив один и тот же запрос в различных СУБД, можно получить различные результаты.

Примечание: данный пример также наглядно показывает преимущество использования unixtime для хранения даты-времени.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]