Введение. Понятие информации, общая характеристика процессов сбора, передачи, обработки и накопления информации.
Компьютер как универсальное средство обработки информации.
Возможности и области применения ЭВМ
Информатика это наука, связанная с:
разработкой вычислительных машин и систем;
разработкой математических моделей естествознания и общественных явлений;
разработкой алгоритмов решения задач управления, расчета и анализа математических моделей;
программированием алгоритмов, создание программного обеспечения ЭВМ.
Термин информация имеет множество определений. Информация – это отражение реального мира с помощью сведений (сообщений).
В информатике информация – это любые сведения, являющиеся объектом хранения, передачи и преобразования. С практической точки зрения информация представляется в виде сообщения. Информационное сообщение связано с источником сообщения, получателем сообщения и каналом связи. Сообщение – это материально-энергетическая форма представления информации в виде речи, текста, изображения, цифровых данных, графиков, таблиц, электрических сигналов и т.п.
Таким образом, информационное сообщение х(t) характеризует изменение во времени материально-энергетических параметров физической среды, в которой проходят информационные процессы. Функция х(t) может быть непрерывна, то есть, имеет место непрерывная или аналоговая информация, или дискретна (звуковая инф., цифровая).
В настоящее время информация обрабатывается на вычислительных машинах.
Компьютер – это устройство преобразования информации посредством выполнения управляемой программой последовательности операций. Синоним вычислительная машина (ВМ). В зависимости от вида обрабатываемой информации ВМ может быть аналоговой или цифровой. В настоящее время наибольшее распространение получили цифровые ВМ - ЭВМ.
Данные – это информация, представленная в виде, позволяющем ее хранить и обрабатывать техническими средствами. Для представления дискретной информации в ЭВМ применяется алфавитный способ. Алфавит – это упорядоченность знаков, предназначенная для образования и передачи сообщений. Символы из набора алфавита называются буквами, а последовательность букв – словом. Так как все процессы, происходящие в ЭВМ, связаны с различными физическими носителями этой информации, то возникает потребность в кодировании - представлять буквы одного алфавита посредством букв другого. Процесс обратного преобразования информации относительно ранее выполненного называется декодированием.
Современные системы сбора информации обеспечивают ее кодирование ввод в ЭВМ и выполняют предварительную обработку этой информации. Сбор информации –это процесс получения информации из внешнего мира и приведение ее к виду, стандартному для данной информации.
Обмен информацией между воспринимающей системой (ЭВМ) и окружающей средой осуществляется посредством сигналов. На первом этапе первичный сигнал с помощью датчика преобразуется в электрический сигнал. На втором этапе происходит его оцифровка с помощью аналого-цифрового преобразователя АЦП. Второй этап необязателен. Например, клавиатура не имеет АЦП (нажатие клавиш непосредственно преобразуется в цифровой код).
На третьем этапе происходит ее размещение на различных физических носителях (магнитных, оптических, магнитооптических, полупроводниковых и т. п.). При этом необходимо обеспечить удобство хранения, поиска, манипулирования записанных данных. Для этого каждый элемент должен строго идентифицироваться.
Чтобы учесть особенности информации, ввиду ее разнообразия по содержанию и виду, ее изучаются в процессе синтаксического, семантического и прагматического анализа.
Синтаксический анализ – устанавливает важнейшие параметры информационных потоков: тип носителя, скорость передачи, скорость обработки, размеры кодов представления информации, надежность и точность представления этих кодов. Данные параметры позволяют выбрать технические средства для регистрации, обработки, передачи и хранения информации.
Синтаксическая мера информации:
а) объем данных VD – количество символов (разрядов) в сообщении;
б) количество информации I – измеряется изменением неопределенности состояния системы:
,
где - первоначальная энтропия системы(неопределенность состояния),- энтропия системыпосле получения сообщения,- количество информации полученной в сообщении;
в) коэффициент информативности: .
Семантический анализ – изучает информацию с точки зрения содержания ее отдельных элементов и устанавливает способы языкового соответствия при однозначном распознавании вводимых в систему сообщений (соответствие между образом объекта и объектом).
Семантическая мера информации:
,
где С – коэффициент содержательности.
Прагматический анализ – проводится с целью определения полезности информации, используемой для управления, выявления практической значимости сообщений, применяемых для выработки управленческих воздействий. Для прагматического анализа важными критериями являются оценки достоверности и своевременности информации.
Прагматическая мера носит относительный характер и измеряется в тех же единицах что и целевая функция.
Необходимость передачи информации для различных объектов обуславливается различными причинами, например как необходимостью донести ее до получателя, так территориальной отдаленностью сбора и регистрации информации от ее обработки. Взаимодействие между территориально отдаленными объектами осуществляется за счет обмена данными. Доставка данных производится по заданному адресу с помощью сетей передачи данных. В настоящее время для распределенной обработки информации используются информационно вычислительные сети (ИВС), которые являются частью автоматизированной технологии процессов ввода, передачи, обработки и выдачи информации.
Важнейшим звеном ИВС является канал связи. Элементы данных по непрерывному каналу связи передаются в виде физических сигналов. Так как ЭВМ работает с дискретной информацией, то на концах непрерывного канала связи находятся модуляторы/демодуляторы. Так же для повышения достоверности передаваемых/получаемых данных на входном конце может быть устройство подготовки данных, а на выходном устройство повышения достоверности данных.
Обработка информации
Обработка информации осуществляется последовательно-параллельным во времени решением вычислительных задач. Организация обработки информации может осуществляться централизованным, децентрализованным и смешанным способами.
При централизованном способе информация вводится с различных терминалов (клавиатур, дисплеев, датчиков, рабочих станций, ПК), а обрабатывается одним центральным ЭВМ (например, системы заказов авиабилетов, оплаты коммунальных платежей). Децентрализованном способом информация обрабатывается в автономных пунктах ее регистрации и потребления (автоматизированные ПК рабочие места, абонентские пункты). При смешанном способе часть информации обрабатывается автономно, а часть централизовано, при этом может иметь место иерархия доступа к данным.
Так же различают режимы взаимодействия с пользователем при обработки информации: пакетный и интерактивный (запросный, диалоговый) режимы.
Пакетный режим. Пользователь подготавливает данные для обработки, программные средства, справочные данные и т.п. Пакет вводится в ЭВМ. Дальше процесс происходит без участия оператора (пользователя), который получает готовый результат на выходе.
Интерактивный режим предусматривает взаимодействие пользователя (оператора) и ЭВМ в запросном или диалоговом режиме. Запросный режим используется для доступа через значительное количество терминальных устройств или при большом удалении от центра обработки. ЭВМ при этом работает в режиме разделения времени, осуществляя доступ для нескольких независимых абонентов.
Диалоговый режим предусматривает непосредственное взаимодействие с ЭВМ, многократно реализуя циклы задания, получения и анализа ответов. При этом ЭВМ может сама инициировать диалог.
1.2 Представление информации в эвм
В компьютерах используется двоичная система счисления, которая основана на двух цифрах, «0» и «1». Это объясняется тем, что электронные элементы, из которых состоит оперативная память, могут находиться, только в одном из двух устойчивых состояний («0» или «1»). Информация любого типа может быть закодирована с использованием двух цифр и помещена в оперативную или долговременную память компьютера. Впервые принцип двоичного счисления был сформулирован в 17 веке немецким математиком Готфридом Лейбницем.
Количество информации, которое может помещаться в один элемент памяти («0» или «1»), называется битом (сокращение словосочетания «двоичная цифра» binary digit -bit) и не несет никакой смысловой нагрузки. Однако если соединить несколько таких элементов в ячейку, то тогда можно сохранить требуемую информацию в памяти ЭВМ. Таким образом, машинное слово – это последовательность битов, рассматриваемых аппаратной частью ЭВМ как единое целое.
Системы счислений
Позиционные системы счислений. Для представления чисел в настоящее время используются позиционные системы счислений, в которых значение каждой цифры (ее вес) изменяется в зависимости от ее положения (позиции) в последовательности цифр, изображающих число.
Запись числа Х в произвольной К-ичной системе основывается на представлении этого числа в виде полинома:
,
где аi – одно из базисных чисел и изображается одной цифрой, К – основание системы счисления.
Двоичная система счислений. Для обозначения двоичных цифр применяется термин бит - сокращение словосочетания «двоичная цифра» (binary digit - bit).
Число Х в двоичной системе представляется в виде:
,
где аi – 0 или 1.
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
0,5 |
0,25 |
12 |
102 |
112 |
1002 |
1012 |
1102 |
1112 |
10002 |
10012 |
10102 |
0.12 |
0.012 |
Восьмеричная система счислений.
Для передачи и хранения информации применяют 8-битовые коды - байты (byte).
Восьмеричная система – базисные числа 0, 1, 2, 3, 4, 5, 6, 7. Число 83,5 будет записано в восьмеричной системе как:
.
Существует 28=256 восьмибитовых чисел. Информация, содержащаяся в одном байте, обычно достаточна для представления одной буквы алфавита или 2 десятичных цифр. Этого достаточно для кодирования всех заглавных и строчных букв алфавита, цифр, знаков препинания, символов национальных алфавитов, других необходимых символов и служебных кодов, используемых при передаче информации.
Таблица кодирования символов 8-битовыми числами называется ASCII -American Standard Code for Information Interchange (латиница). Первая, или «нижняя», половина таблицы ASCII (коды 0-126) содержит знаки препинания, арабские цифры и символы английского алфавита. Она является общепринятой во всем мире. В каждой стране используется своя «верхняя» половина таблицы ASCII (коды 127-255, или «расширенные» ASCII-коды), в которой находятся буквы национальных алфавитов и специальные символы.
Для поддержки русского алфавита применяют три основных варианта таблицы кодировок символов - кодовую таблицу 866 для операционной системы MS-DOS и кодовую таблицу 1251 для операционной системы Windows и KOI-8. Русские буквы в этих кодировках расположены на совершенно разных позициях.
В основе измерения больших объемов информации лежит байт. Более крупные единицы измерения: килобайт (1 Кбайт = 210 байт = 1024 байта), мегабайт (1 Мбайт = 1024 Кбайт = 220 байт = 1048576 байт), гигабайт (1 Гбайт = 1024 Мбайт = 230 байт = 1073741824 байт). Современные носители информации имеют емкость до нескольких терабайт.
Для работы с большими числами используются слова - 16-битовые числа, и двойные слова - 32-битовые числа.
Шестнадцатеричная система счислений. Для обозначения адресов расположения данных в памяти компьютера и других целей удобнее пользоваться не двоичным и не десятичным, а шестнадцатеричным представлением чисел. «Цифры» от 10 до 15 в шестнадцатеричной системе изображаются символами от a до f. Двух байтов достаточно, чтобы сформировать единую кодировку для всех современных алфавитов и основных подмножеств иероглифики, такая кодировка называется Unicode.
При написании шестнадцатеричных чисел используют суффикс «h».
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
a |
b |
c |
d |
e |
f |
0000 |
0001 |
0010 |
0011 |
0100 |
0101 |
0110 |
0111 |
1000 |
1001 |
1010 |
1011 |
1100 |
1101 |
1110 |
1111 |
.
Смешанные системы счислений. Двоично-десятичная система.
Для представления в ЭВМ десятичных чисел с помощью двоичных используется смешанные системы счислений, в которых Р-ичное разложения числа записывается в Q-ичной системе. Такая система называется (Q-P) – ичной, в ней Р- старшее основание, Q- младшее основание. Для того чтобы запись в такой системе была однозначной, для представления Р-ичной цифры отводится одно и тоже количество Q-ичных разрядов, достаточное для представления любого базисного числа Р-ичной системы.
В двоично-десятичной системе десятичные числа могут быть представлены в упакованном формате - для изображения каждой десятичной цифры отводится четыре двоичных разряда (полбайта).
84510= 8 4 5 =1000 0100 01012-10.
Знак кодируется (1100 – «+», 1101 – «-»). В общем виде, структура поля упакованного формата под число представлено:
цифра |
цифра |
… |
цифра |
знак |
845= 8 4 5 =1000 0100 0101 1100знак +.
Распакованный формат – для каждой десятичной цифры отводится по байту. Полбайта – зона (0011 – для ASCII – кода) полбайта цифра. Для самого младшего на месте зоны располагается знак.
845 |
зона |
цифра |
зона |
цифра |
знак |
цифра |
0011 |
1000 |
0011 |
0100 |
1100 |
0101 |
Представление числа в формате с фиксированной запятой (точкой).
При представлении любого числа в формате с фиксированной запятой (точкой), число записывается в разрядную сетку в виде:
,
где m- число разрядов до запятой, s - число разрядов после запятой.
В ЭВМ числа с фиксированной запятой могут занимать слово (2 байта) или полуслово (байт). Если число с фиксированной запятой занимает байт, то для его представления используются разряды с 0-го по 6-й. Разряд 7 используется для знака. При размещении числа с фиксированной запятой в слове используются разряды с 0-го по 14-й. Разряд 15 используется для знака. Значение знакового разряда: 0 – для положительных, 1 – для отрицательных.
Пример
|
Знак |
Абсолютная величина числа | ||||||||||||||
N |
15 |
14 |
13 |
12 |
11 |
10 |
9 |
8 |
7 |
6 |
5 |
4 |
3 |
2 |
1 |
0 |
-193 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
1 |
Диапазон представления чисел в формате с фиксированной запятой: для байта от до, для слова отдо.
Представление числа в формате с плавающей запятой (точкой).
,
где m- мантисса () ,р- порядок числа.
Если после запятой в мантиссе первым не стоит ноль, то число называется нормализованным справа.
Нормализованное число одинарной точности записывается в память в виде двойного слова следующим образом: знак (0, 1) - 31 разряд 15 бита первого слова, порядок 24-30 разряд 7-14 бита первого слова, мантисса остальные 23 бита в двух словах. Нормализованное число двойной точности занимает четыре слова, для мантиссы отводится 55 бит.
Пример
|
знак |
порядок |
мантисса | |||||||||||||||||
N |
31 |
30 |
29 |
28 |
27 |
26 |
25 |
24 |
23 |
22 |
21 |
20 |
19 |
18 |
17 |
16 |
… |
1 |
0 | |
-193 |
1 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
Порядок числа в формате с плавающей запятой изменяется в диапазоне от до.
При сложении чисел представленных в формате с плавающей запятой сначала уравнивают порядки слагаемых. При умножении (делении) порядки складываются (вычитаются), а мантиссы умножаются (делятся). После выполнения операции проводят нормализацию результата. Поэтому запись числа в таком формате называется с «плавающей запятой».