Информатика Lec_1_1
.pdfТема № 1
Сообщения, данные, сигнал, атрибутивные свойства информации, показатели качества информации, формы представления информации. Системы передачи информации. Меры и единицы количества и объема информации. Позиционные системы счисления. Логические основы ЭВМ.
1. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ИНФОРМАТИКИ
1.1.Понятие информатики и информатизации
Вшироком смысле под информатикой можно понимать науку о вычислениях,
хранении и обработки информации.
Как наука информатика сформировалась в результате целенаправленного изучения
информационных процессов. Впервые термин «информатика» возник во Франции в 60-х годах ХХ столетия путем слияния двух слов information (информация) и automatique
(автоматика) для обозначения деятельности по автоматизированной обработке информации с помощью ЭВМ. В англоязычных странах аналогичный круг проблем обозначили термином «computer science», т.е. компьютерные науки [1].
В1983 г. термин «информатика» был утвержден в бывшем СССР при создании
отделения информатики, вычислительной техники и автоматизации в Академии
наук.
Стремительное развитие информатики приводит к тому, что она становится неотъемлемой частью общечеловеческой культуры. Вместе с тем развитие
компьютерной техники и информационных технологий послужило резким толчком к
развитию общества, построенного на всемирном использовании различной информации
иполучившего название информационного общества [1].
Информационное общество – концепция постиндустриального общества; новая историческая фаза развития цивилизации, в которой главными продуктами производства
являются информация и знания.
Отличительными чертами информационного общества являются:
–увеличение роли информации и знаний в жизни общества;
–возрастание доли информационных коммуникаций, продуктов и услуг в валовом внутреннем продукте;
–создание глобального информационного пространства, обеспечивающего: o эффективное информационное взаимодействие людей
o их доступ к мировым информационным ресурсам
o удовлетворение их потребностей в информационных продуктах и услугах.
Процесс проникновения информационных технологий во все сферы жизни и
деятельности общества называется процессом информатизации общества [2].
Информатизация общества является одной из закономерностей современного
социального прогресса. Следует различать два понятия: компьютеризация и информатизация.
При компьютеризации объекта или общества основное внимание уделяется развитию и внедрению технической базы в виде компьютеров для оперативной обработки информации.
При информатизации упор делается на комплекс мер по обеспечению доступа каждого человека к накопленному и имеющемуся в системе информационному ресурсу
[1].
То есть под информатизацией можно понимать организованный социально-
экономический и научно-технический процесс создания оптимальных условий для удовлетворения информационных потребностей.
Термин «информатика» (комбинация из слов «информация» и «автоматика») был введен в 1970-х годах прошлого века в связи с началом массового производства и широкого внедрения электронных вычислительных машин (ЭВМ).
Информатика – это наука, предметом изучения которой являются процессы сбора,
получения, передачи, хранения, накопления, отображения, использования, защиты, преобразования и обработки информации
Основные направления развития информатики можно подразделить на теоретическую и прикладную информатику.
Теоретическая информатика включает теорию информации, информационное
моделирование, методы измерения информации, алгебра логики, теория алгоритмов, искусственный интеллект (ИИ), теорию автоматов, теорию БД, представление знаний
Прикладная информатика включает вычислительные и информационные технологии, техническое и программное обеспечение информационных процессов.
1.2.Понятие информации, общая характеристика процессов сбора, передачи, обработки и накопления информации
Одним из фундаментальных понятий информатики является информация.
Под информацией понимают отражение реального мира с помощью некоторых знаков или сигналов, совокупность знаний о нем.
Информация – от латинского informatio – сведения, разъяснения, изложение.
Под информацией в технике принято понимать любую последовательность символов, знаков, сигналов, не учитывая их смысл.
Информация – это совокупность сведений, передаваемых в определенной форме между различными объектами.
Для человека же информация – это его знания, ощущения и накопленный опыт.
Взаконе РФ «Об информации, информационных технологиях и о защите информации» № 149-ФЗ от 27 июля 2006 г. [4] прописаны следующие определения:
•информация – сведения (сообщения, данные) независимо от формы их
представления;
•информационные технологии – процессы, методы поиска, сбора, хранения, обработки, предоставления, распространения информации и способы осуществления таких процессов и методов;
•информационная система – совокупность содержащейся в базах данных информации и обеспечивающих ее обработку информационных технологий и технических средств;
Всоответствии с [4]:
1.Информация может являться объектом публичных, гражданских и иных правовых
отношений.
2.Информация может свободно использоваться любым лицом и передаваться одним лицом другому лицу, если федеральными законами не установлены ограничения доступа к информации, либо иные требования к порядку ее предоставления или
распространения.
3.Информация в зависимости от категории доступа к ней подразделяется на:
1)общедоступную информацию,
2)информацию, доступ к которой ограничен федеральными законами (информация ограниченного доступа).
4.Информация в зависимости от порядка ее предоставления или распространения
подразделяется на:
1)информацию, свободно распространяемую;
2)информацию, предоставляемую по соглашению лиц, участвующих в соответствующих отношениях;
3)информацию, которая в соответствии с федеральными законами подлежит
предоставлению или распространению;
4)информацию, распространение которой в Российской Федерации
ограничивается или запрещается.
Кроме того, информация классифицируется:
1.По способам восприятия:
–Зрительная (визуальная)
–Слуховая (аудиальная)
–Осязательная (тактильная)
–Обонятельная
–вкусовая
2.По форме представления:
–Текстовая
–Числовая
–Графическая
–Звуковая
–Комбинированная
Вбытовом понимании термин «информация» ассоциируется с другими: сведения, сообщения, данные, знания и т.п. Чтобы в дальнейшем не путать смысл данных
терминов, важно рассмотреть их различие.
Информация – мера устранения неопределенности в отношении исхода
интересующего события. То есть под информацией «…чаще всего понимают содержательный аспект данных,…» [2].
Окружающий мир является источником разнообразных сигналов, которые
воспринимает субъект, фиксирует их, превращая в объективно существующие данные. Они используются в процессе решении конкретных задач, проявляясь в виде информации. То есть данные служат «сырьем» для получения информации. Важно
понимать: одни и те же данные могут нести различную информацию для разных
потребителей. Решая задачи на основе получаемой информации, у субъекта формируется новое личное знание. Результаты решаемой задачи, обобщения в виде теорий, совокупности представлений, полученных отдельными субъектами становятся истинной, проверенной информацией, которая в дальнейшем образует обобществленные
знания, и представляются обычно виде документов и сообщений. Последние
существуют объективно и в свою очередь могут рассматриваться как данные для последующих исследований (рис.1).
Источник
информации
Сообщение
Канал связи
Приемник информации
Рис.1. Схема передачи информации
Процессы, связанные с поиском, передачей, обработкой, хранением и
использованием информации называются информационные процессами.
Эти процессы происходят и в живых организмах, и в обществе, и в технических
устройствах. Причем подчиняются они одним и тем же законам, изучением которых
занимается кибернетика.
В процессе информационного обмена (рис. 1.1) устанавливается связь между двумя
объектами: источником (генератором) информации и приемником (получателем). В
качестве объектом могут выступать любые объекты материального мира. В информатике
изучаются схемы информационного обмена между человеком и автоматом. Сообщения – это совокупность знаков или сигналов, отображающих ту или иную
информацию.
Сигнал – физический процесс, несущий передаваемое сообщение в пространстве и времени.
Линия связи – физическая среда, используемая для передачи сигналов.
Данные – это зарегистрированные сигналы, представленные в форме, пригодной для
хранения, передачи и обработки информации.
Система передачи информации – состоит из источника, передатчика, канала связи, приемника и получателя информации.
Информационный процесс – это последовательность действий, производимых с информацией, наиболее значимыми процессами являются процессы:
–Сбора;
–Передачи;
–Преобразования;
–Обработки;
–Накопления;
–Хранения
–и использования информации
Передача информации
Впроцессе передачи информации участвуют источник и приемник информации: первый передает информацию, второй ее получает (рис.1).
Поиск информации – это извлечение хранимой информации.
Существуют следующие методы поиска:
–ручной – непосредственное наблюдение; чтение соответствующей литературы; работа со словарями, каталогами; работа в библиотеках, архивах; просмотр видео, телепрограмм; прослушивание радиопередач и аудиокассет;
общение со специалистами;
–автоматизированный – использование автоматизированных информационно-поисковых систем; запрос базам и банкам компьютерных данных.
Обработка информации – это процесс преобразования информации из одного вида
в другой (рис.2).
Входная |
|
Обработка |
|
Выходная |
информация |
|
информации |
|
информация |
|
|
|
|
|
Рис.2. Схема обработки информации
Обработка информации может происходить:
а) по строгим формальным правилам; б) по принципу «черного ящика».
Хранение информации – это способ распространения информации в пространстве и
времени.
Человек хранит информацию всю жизнь – либо в собственной памяти, либо на внешних носителях (например, на бумаге).
Носитель информации – это среда для записи и хранения информации. Пример носителей информации: бумага, камень, дерево, классная доска; звук, свет, радиоволна, давление, притяжение; вода, жидкий раствор, температура.
Машинными носителями являются перфоленты, перфокарты, магнитные ленты,
магнитные диски, лазерные диски и т.п.
Осуществлять различные действия с информацией (вводить, искать, сортировать,
выдавать, удалять и др) позволяет информационная система называемая хранилищем информации. Например – библиотеки, видеотеки, фонотеки, архивы, патентные бюро, музе, базы и банки данных, информационно-поисковые системы, электронные
энциклопедии, медиатеки.
Человек обменивается информацией – принимает и передает ее – непосредственно,
или с помощью тех или иных технических средств.
При этом из-за дефектов канала связи, шумов, помех и т.п. возможны искажения или потеря информации.
Нужно искать способы обнаружения ошибок передачи и их исправления. Человеку непрерывно приходится обрабатывать информацию:
–получать новую информацию на основании имеющейся,
–изменять представление информации (например, переводить, сортировать, искать нужную в информационном массиве).
Это тоже может делаться как с помощью вспомогательных средств, так и без них.
Информация может существовать:
–в образной форме (это запахи, вкус, звуковые или зрительные образы),
–в символьной (знаковой).
Язык – система знаков и правил их использования для представления информации.
–естественными языки – разговорные языки, возникшие и развивающиеся
вместе с народом-носителем этого языка;
–искусственные (формальные) языки – специально созданные для представления какого-либо особого вида информации в определенной области человеческой деятельности.
Компьютер – универсальный инструмент для работы с информацией.
С технической точки зрения наиболее рациональным оказалось использование в нем
языка двоичных кодов.
1.3.Атрибутивные свойства информации
Формы представления информации
Существует множество форм и видов представления информации.
По способу восприятия информации через органы чувств различают: визуальную, звуковую, тактильную, ароматическую и вкусовую информацию. форма восприятия
информации тесно связана с понятием пользовательского интерфейса. Особое значение
имеет визуальная и звуковая информация.
Визуальная информация может быть представлена в знаковой, графической и табличной форме, а звуковая – в виде устной словесной (вербальной) и музыкальной
формы.
Для хранения информации используются различные материальные носители (книги,
пластинки, оптические диски и т.д.).
При компьютерном хранении и обработке информации все формы информации кодируются, т.е. каждому значению некоторой физической величины присваивается
числовое значение. Этот процесс имеет еще одно название - оцифровка.
Показатели качества информации
Качественные характеристики информации определяет получатель информации. Одна и та же информация с точки зрения одного получателя может быть очень важной и ценной, а с точки зрения другого нет.
Основными свойствами информации являются структурированность, смысл и ценность.
Структурированность, или синтаксические характеристики информации
позволяют выделять информацию из получаемых сигналов.
Смысл, или семантические характеристики информации, позволяют определить
цель, назначение и практическую значимость информации (прагматические характеристики).
Ценность информации выражается в таких понятиях, как содержательность,
актуальность, своевременность, адекватность, полнота и достоверность.
Критерии качестваэкономической информации
Качество информации влияет на эффективность и качество функционирования
системы.
Входная информация определяет качество информационной системы в целом. Неверно подобранные данные могут исказить результат любой обработки и принести не
пользу в решении каких-либо вопросов, а, напротив, навредить и привести к ошибочным выводам. В соответствии с [7], важно выделить понятие и свойства качества
информации.
Качество информации – те ее свойства, определяющие возможность использования данных в информационной технологии для удовлетворения
определенных потребностей в соответствии с ее назначением. На рис.__ представлены показатели качества информации, определяющие ее возможность и эффективность
использования.
Если экономическая информация не соответствует требуемым нормам, то
последствия всегда будут нести негативный характер.
Нарушение адекватности и устойчивости информации приводит нередко к существенным погрешностям в работе с информационной системой. Несвоевременная информация приводит к экономическим потерям и в сфере управления, и в сфере
производства. Достоверность и точность информации играют решающую роль в процессе
управления. Любые существенные искажения исходной информации могут повлечь за собой ошибочные выводы при принятии решения [7].
Случайные причины искажения информации:
•неверная методика сбора данных,
•ошибочные действия пользователей,
•выход из строя аппаратных средств во время ввода или передачи информации.
Для устранения случайных причин обычно предпринимается ряд мер, сводящих
искажения информации к минимуму:
•совершенствование методик сбора информации на основе научно обоснованных разработок,
•дополнительные средства логического и арифметического контроля данных,
•использование специальных кодов обнаружения ошибок и т.д.
Неслучайные причины нарушения достоверности - преднамеренные действия физических лиц, сознательно предоставляющих неверные данные или разрушающих сети, компьютеры, базы данных при непосредственном воздействии или с
использованием программных вирусов.
Для устранения неслучайных причин разрабатываются средства информационной
безопасности, которыми являются меры по защите информации от несанкционированного доступа, модификации, искажения, разрушения в процессе создания данных, их ввода, обработки и вывода. Информационная безопасность включает в себя правовые, организационные и технические меры по защите
достоверности информации. К ним можно отнести разработку норм, устанавливающих ответственность за компьютерные преступления в уголовном и гражданском
законодательстве, охрану сетей и компьютерных центров, создание универсальных
средств защиты от несанкционированного доступа к системе, резервирование особо
важных компьютерных подсистем, организацию вычислительных сетей с возможностью
перераспределения ресурсов в случае нарушения работоспособности отдельных звеньев и многое другое. Целью информационной безопасности является охрана ценности
системы, защита данных, гарантия достоверности и целостности информации. Данная
тема будет подробно представлена во второй части данной работы.
Рис. 13. Три формы выражения адекватности информации
В заключении следует отметить, что на основе эффективно осуществляемого
экономического управления определяется ценность экономической информации.
Хранение и обработка информации реализованы в двоичных кодах с применением двоичной системы счисления. Это связано с использованием в ЭВМ многоразрядных электронных схем памяти, каждый разряд которых – бит, может принимать одно из двух
различных состояний – 0 и 1.
Определить понятие «количество информации» довольно сложно. В решении этой проблемы существуют два основных подхода.
Исторически они возникли почти одновременно:
–в конце 40-х годов XX века один из основоположников кибернетики,
американский математик Клод Шеннон, развил вероятностный подход к измерению количества информации
–работы по созданию ЭВМ привели к «объемному» подходу.
Вероятностный подход
Данный подход основан на использовании численной величины, измеряющей неопределенность – энтропии (Н). Любое событие может иметь несколько исходов, или
результатов (например, N). При этом любой из этих исходов имеет определенную долю
вероятности, в сумме все они дают единицу.
ПОКАЗАТЕЛИ КАЧЕСТВА ИНФОРМАЦИИ
Достоверность
Точность
Свойство информации точно отражать
реально существующие объекты
Степень близости отображаемого информацией значения и истинного значения показателя, обеспечивающая
правильность принимаемого управленческого решения
Адекватность |
Правильность отражения заданных |
|
свойств объекта, которая зависит от способа |
|
ее отбора и формирования |
Устойчивость |
Свойство результатной информации |
|
реагировать на изменения исходных данных, |
|
сохраняя необходимую |
|
точность |
Полнота |
Минимальный набор экономических |
|
показателей, достаточный |
|
для принятия правильного |
|
управленческого решения |
Доступность |
Обеспечивается ИТ в процессе |
|
обработки данных: интерфейс ИТ |
|
согласуется с тезаурусом пользователя и |
|
преобразует информацию в удобную для |
|
восприятия форму |
Своевременность |
Свойство, обеспечивающее |
|
возможность использования информации |
|
в заданный момент времени |
Актуальность |
Гарантия сохранения ценности |
|
информации для управления во времени |
Рис. 14. Показатели качества информации
Пример – процедура сдачи зачета студентом.
1)Студент готовится к зачету; исход неизвестен, т.е. имеется некоторая неопределенность (Н1).
2)Студент ответил на вопросы и получил отметку за зачет; информация об этом
исходе получена, количество полученной информации I.
3) Неопределенность этой процедуры после его осуществления H2.
Количество информации, которое получено в ходе сдачи зачета, принимается как
разность неопределенностей «до» и «после» зачета: |
|
I = H1 – H2. |
(1) |
Естественно, когда студент получил оценку, имевшаяся неопределенность (Н2 = 0)
была снята, таким образом, первоначальная энтропия соответствует количеству полученной информации. То есть неопределенность события совпадает с информацией
об исходе этого события.
В случае, когда вероятности Рi, результатов (N) события неодинаковы, имеет место
формула Шеннона |
|
|
|
|
|
N |
|
1 |
|
|
|
H = −∑Pi log |
|
|
|
(2) |
|
|
|
||||
2 |
|
. |
|||
i=1 |
|
Pi |
|
|
|
|
P |
= |
1 |
|
|
|
N |
|
|||
В случае равновероятности событий |
i |
|
|
формула Шеннона переходит в |
|
формулу Хартли: |
|
|
|
|
|
Н = log2N. |
|
|
|
|
(3) |
Учитывая, что в ЭВМ используются многоразрядные электронные схемы памяти, каждый разряд которых – может принимать одно из двух различных состояний – 0 и 1 (N =
2), энтропия (Н) будет равна единице при N = 2 и одинаковых вероятностях этих двух исходах.
В качестве единицы принимается количество информации, связанное с проведением
опыта, состоящего в получении одного из двух равновероятных исходов:
Н = log22= 1 бит.
Количество информации (в битах), заключенное в двоичном слове, равно числу двоичных знаков в нем.
Существуют таблицы вероятностей частоты употребления различных знаков, полученные на основе анализа очень больших по объему текстов (табл.1.1).
Для определения количества информации, связанного с появлением каждого символа
в сообщениях, записанных на русском языке (русский алфавит состоит из 33 букв и знака «пробел» для разделения слов) подставим количество знаков 34 в формулу Хартли: Н = log234 ≈ 5,09 бит.
Таблица 1.1
Частотность букв русского языка
i |
Символ |
P(i) |
i |
Символ |
P(i) |
i |
Символ |
P(i) |
1 |
– |
0,175 |
12 |
Л |
0,035 |
23 |
Б |
0,014 |
2 |
О |
0,090 |
13 |
К |
0,028 |
24 |
Г |
0,012 |
3 |
Е |
0,072 |
14 |
М |
0,026 |
25 |
Ч |
0,012 |
4 |
Ё |
0,072 |
15 |
Д |
0,025 |
26 |
Й |
0,010 |
5 |
А |
0,062 |
16 |
П |
0,023 |
27 |
X |
0,009 |
6 |
И |
0,062 |
17 |
У |
0,021 |
28 |
Ж |
0,007 |
7 |
Т |
0,053 |
18 |
Я |
0,018 |
29 |
Ю |
0,006 |
8 |
Н |
0,053 |
19 |
Ы |
0,016 |
30 |
Ш |
0,006 |
9 |
С |
0,045 |
20 |
3 |
0,016 |
31 |
Ц |
0,004 |
10 |
Р |
0,040 |
21 |
Ь |
0,014 |
32 |
Щ |
0,003 |
11 |
В |
0,038 |
22 |
Ъ |
0,014 |
33 |
Э |
0,003 |
|
|
|
|
|
|
34 |
Ф |
0,002 |
Объемный подход
Объемный подход определения количества информации основан на следующем положении. Объем информации, записанной двоичными знаками в памяти компьютера
или на внешнем носителе информации, подсчитывается просто по числу требуемых для такой записи двоичных символов.
Вдвоичной системе счисления знаки 0 и 1 называют битами (bit — от английского
выражения Binary digiTs — двоичные цифры).
Вкомпьютере бит является наименьшей возможной единицей информации.
При этом в частности, невозможно нецелое число битов (в отличие от вероятностного подхода).
Для удобства использования введены и более крупные, чем бит, единицы количества
информации [2].
Двоичное слово из восьми знаков содержит один байт информации.
1.4.Единицы измерения информации
Минимальной единицей информации является бит.
Бит – это количество информации, которое можно записать в одном двоичном разряде. Двоичный разряд может принимать значение 1 или 0.
Байт равняется 8 битам. Один байт может принимать 256 различных значений, (т.е.
можно закодировать 256 различных символов).
Более крупными единицами информации являются килобайты (К), мегабайты (М), гигабайты (Г) и терабайты (Т). По определению: 1 килобайт = 1024 байт.
1 Кбайт = 210 байт = 1024 байт.
1 Мбайт = 220 байт = 1024 Кбайт. 1 Гбайт = 230 байт = 1024 Мбайт. 1 Тбайт = 240 байт = 1024 Гбайт.
Между вероятностным и объемным количеством информации соотношение
неоднозначное.
В прикладной информатике практически всегда количество информации понимается в объемном смысле.
1.5.Меры и единицы количества и объема информации
Имеется несколько подходов, которые устанавливают количество информации в сообщении, при этом учитываются синтаксические и семантические характеристики информации.
Комбинаторный подход
Количество информации в комбинаторной мере – это число возможных комбинаций информационных элементов.
Размещениями из n элементов по m называются такие их соединения, которые
различаются друг от друга самими элементами и их порядком. Например, размещения их трех элементов А, В, С по 2: АВ, АС, ВС, ВА, СА, АС. Число всех размещений из n
различных элементов по m равняется: |
|
. |
|
Перестановками из n элементов называются их соединения, отличающиеся друг от
друга только порядком входящих в них элементов. Например, перестановки из трех элементов А, В, С: АВС, АСВ, ВСА, ВАС, САВ, СВА. Число перестановок из n элементов
равняется n!.
Сочетаниями из n элементов по m называются их соединения, отличающиеся друг от друга только самими элементами. Например, сочетания из трех элементов А, В, с по 2: АВ, АС, ВС. Число всех сочетаний из n различных элементов по m равняется
.