Методы кодирования
Цель кодирования, которое выполняется при сборе информации, – замена названия объекта на условное обозначение. Выполняется для уменьшения объема регистрируемой информации и, возможно, для защиты от несанкционированного доступа. Как правило, это кодирование здесь выполняется человеком.
Различают следующие методы кодирования: регистрационные и классификационные.
А) Регистрационные методы кодирования
Эти методы не требуют предварительной классификации объектов. Включают следующие 2 вида:
порядковое кодирование. Объекты обозначаются числами натурального ряда или другими символами. Применяется, когда количество объектов невелико.
Пример 4. Выполнить порядковое кодирование для значений классификационных признаков из примера 2 раздела Иерархическая классификация.
При решении этой задачи преследуем две цели – уменьшение объема информации (для шифров учебных групп и названий дисциплин) и шифрование для защиты от несанкционированного доступа (для оценок за экзамен). Примерная система кодирования будет иметь вид:
Значения признака «шифр учебной группы» |
Коды |
Значения признака «название дисциплины» |
Коды |
Значения признака «оценка за экзамен» |
Коды |
ВС |
1 |
информатика |
1 |
5 |
# |
АС |
2 |
математика |
2 |
4 |
$ |
|
|
физика |
3 |
3 |
% |
|
|
культурология |
4 |
2 |
? |
|
|
|
|
1 |
* |
серийно-порядковое кодирование. Предварительно выделяются группы объектов, которые составляют серию, затем в каждой серии производится порядковое кодирование. Сами серии также кодируются с помощью порядкового кодирования. Между кодами серии и ее элементов ставится разделитель. Применяется, когда число объектов сравнительно велико, но классификация не применяется.
Пример 5. Выполнить серийно-порядковое кодирование для значений признака «название дисциплины», условно предположив, что число его значений велико.
Для кодирования упорядочим значения по алфавиту и разобьем список на две равные части - серии. Первой серии присвоим код А, второй – В. Элементы в каждой серии пронумеруем по порядку. Получим:
Серия А Серия В
1 информатика 1 математика
2 культурология 2 физика.
Тогда коды имеют вид:
Значения признака "название дисциплины" |
Коды |
информатика |
A.1 |
математика |
B.1 |
физика |
B.2 |
культурология |
A.2 |
Б) Классификационные методы
Эти методы ориентированы на проведение предварительной классификации объектов на основе иерархической или фасетной классификации. Включают следующие 2 подхода:
последовательное кодирование. Используется для иерархической классификации – сначала записывается код класса первого уровня, затем – второго и т.д. Коды классов формируются способом регистрационного кодирования, между кодами разных уровней классификации возможны разделители.
Пример 6. Выполнить последовательное кодирование для вершин третьего уровня классификатора из примера 2 раздела Иерархическая классификация. При этом использовать коды признаков, полученные при порядковом кодировании из примера 4 раздела Регистрационные методы.
Решение задачи. Припишем коды из примера 4 раздела Регистрационные методы вершинам классификатора (коды приписаны вершинам справа и выделены жирным стилем; для упрощения рисунка показаны только оценки со значениями 4 и 5):
Тогда, например, для класса студентов из группы ВС, получивших оценку 5 на экзамене по информатике, сформируем код: 1.1.#, где точка играет роль разделителя.
параллельное кодирование. Используется для фасетной классификации. Фасеты кодируются с использованием регистрационного кода, между кодами разных уровней возможны разделители.
Пример 7. Выполнить параллельное кодирование для класса со следующими значениями классификационных признаков (при построении кода учитывается и порядок признаков):
название дисциплины = физика;
шифр учебной группы = АС;
оценка за экзамен = 4.
При решении задачи использовать коды признаков, полученные при порядковом кодировании из примера 4 раздела Регистрационные методы.
В результате решения задачи имеем код: 3.2.$, где точка играет роль разделителя.