Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Bazy_dannykh_i_znanii_UP_SHirokov_L.A._2000

.pdf
Скачиваний:
40
Добавлен:
10.06.2015
Размер:
901.06 Кб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНДУСТРИАЛЬНЫЙ УНИВЕРСИТЕТ ИНСТИТУТ ДИСТАНЦИОННОГО ОБРАЗОВАНИЯ

Л.А.ШИРОКОВ

БАЗЫ ДАННЫХ И ЗНАНИЙ

УЧЕБНОЕ ПОСОБИЕ

ЧАСТЬ 1

МОСКВА 2000

УДК681.142 Ш64

ШИРОКОВ Л.А. БАЗЫ ДАННЫХ И ЗНАНИЙ: Учебное посо-

бие. Ч. 1. -М.:МГИУ, 2000. –86 c.

Учебное пособие посвящено вопросам изучения баз данных и знаний для решения различных задач при финансово-экономической, производственной, хозяйственной, сбытовой, деятельности в условиях перехода на рыночные отношения и при работе в них. В первой части пособия рассматриваются основные положения теории построения и использования баз данных для различных приложений. Особое внимание уделено вопросам моделирования данных для представления в базах данных, функциям и составу универсальной СУБД, манипулирования данными, проектирования баз данных. Комплексно рассмотрены вопросы формирования структур баз данных, нормализации отношений для различных информационных систем.

Учебное пособие предназначено для изучения курса "Базы данных и знаний" студентами дистанционной формы обучения по направлениям 521500 "Менеджмент", 522300 "Информационные системы в экономике" и специальностям 061100 "Менеджмент", 071900 "Информационные системы в экономике".

Рецензент В.Б. Закорюкин, проф. (Московский государственный университет радиотехники, электроники и автоматики)

Редактор З.И. Фадеева

 

ЛР № 020407 от 12.02.97.

Подписано в печать 14.03.2000

Сдано в производство 15.03.2000

Формат бумаги 60 ×90/16

Бум. множит.

Усл. печ. л. 5,5

Уч.-изд. л. 5,75 Тем. план 1999 г., № 3-17

Тираж 500

 

Заказ №

РИЦ МГИУ, 109280, Москва, Автозаводская, 16

ISBN 5-276-00035-2

© - Л.А. Широков, 2000.

 

© - Л.А. Широков,

 

 

Компьютерная реализация, 2000.

Цивилизация - это прежде всего информация. Информация делает народы человечеством.

С.Залыгин (К вопросу о бессмертии)

ВВЕДЕНИЕ

В1. КАТАЛИЗАТОР АДАПТАЦИИ В ПРОЦЕССАХ РАЗВИТИЯ

Современные мобильные стремительно развивающиеся, носящие глобальные масштабы процессы в производственной и хозяйственной, научно-технической и научно-оганизационной, общественнополитической и социальной областях человеческой деятельности сложны прежде всего тем, что требуют перманентного изменения их самых активных участников, т.е. людей. Открывая новые перспективы, эти процессы одновременно вскрывают и различные проблемы, к которым относятся:

-интенсификация освоения новых знаний;

-форсирование процессов получения и обработки информации;

-овладение эффективными технологиями, современными инструментариями.

Возможно ли сегодня в условиях научно-технической революции при скоротечных жизненных процессах оперативно осваивать, воспринимать нарастающие потоки новых знаний, лавинообразно увеличивающиеся объемы информации, успешно их использовать в решении практических задач? Существует ли какой-либо катализатор для ускорения адаптации в перестроечных процессах? Где его найти, как применить для достижения своих целей?

Практика ведущих мировых государств уверенно дает утвердительный ответ на все перечисленные вопросы. Рецепт - освоение и повсеместное применение современных компьютерных и информационных технологий на базе ЭВМ, персональной компьютерной техники, локальных и глобальных вычислительных информационных сетей, рабочих станций.

Сегодня информатизация общества - это свершившийся факт. Стало очевидным, что информация - это не просто научная категория,

акоммерческая, являющаяся таким же принципиальным фактором развития, как сырье, энергия. Теперь для восполнения уменьшающихся запасов сырья и энергии человечество остро нуждается в информации. Информация открывает новые пути более рационального и экономного получения средств для дальнейшего научно-технического

3

прогресса, развития всех сфер человеческой деятельности. Любая серьезная проблема неразрешима без переработки значительных объемов информации и налаженных коммуникационных процессов.

Исследования американских специалистов, отраженные в табл.В1, наглядно иллюстрируют эффективность качественного информационного обеспечения при проведении исследовательских и проектных работ. Из таблицы видно, что даже у высококвалифицированных специалистов временные затраты по выполнению работ можно сократить более чем в 1,5 раза лишь за счет своевременного и полного информационного обеспечения. Для серьезных разработок это дает выигрыш в несколько лет.

 

Таблица В1

Использование информации

Относительное время

 

решения заданий, %

Без изучения информации

100

С изучением информации в средней фазе работ

84

С изучением информации до начала работ

60

Дальнейший рост объема информации в еще большей степени повышает эффективность и актуальность систем информационного обеспечения. По данным ЮНЕСКО, около половины занятого населения наиболее развитых стран непосредственно участвует в процессах производства и распространения информации. В ряде стран до половины национального продукта связано с информационной деятельностью общества. Информатизация превратилась в важнейший ресурс общества, стала фактором производственной деятельности на всех уровнях.

В наше время информатика - это основа успеха в науке, технике, коммерции, бизнесе, менеджменте, политике, в любой духовной, культурной, производственной деятельности человека.

В2. ИНФОРМАТИКА И НОВЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

Информационные ресурсы - продукт интеллектуальной деятельности наиболее квалифицированной и творчески активной части трудоспособного населения. В последней четверти ХХ века информационные ресурсы достигли столь рекордных объемов, что были введены понятия "информационного взрыва", "информационной революции". Подтверждением тому является увеличение информационного потока с начала текущего столетия более чем в 30 раз.

Ежегодно в мире выпускается более 100 тыс. журналов на раз-

4

личных языках, 5 млн. научных статей, книг, брошюр. Всемирный фонд описаний патентов содержит около 500 млн. страниц текста, его ежегодный прирост - 1 млн. документов. В мире ежеминутно печатается примерно 2 тыс. страниц научных текстов, каждый час регистрируется 15-20 изобретений или открытий. Современный специалист должен ежедневно прочитывать примерно 1.5 тыс. страниц информации. В США около 50% рабочих и служащих заняты информационным обслуживанием. Однако практически вследствие невозможности оперативно проанализировать все научно-технические публикации немало разработок дублируется. Например, Американское химическое общество информирует, что каждое десятое проводимое в США исследование излишне, так как ранее подобная работа уже была проделана и результаты опубликованы.

Сегодня информационное невежество - прямой путь к банкротству. Вместе с тем информационный поток уже опережает возможности человека по его обработке и использованию, так как мозг человека не беспределен. Необходимо изыскание и применение принципиально новых методов и средств восприятия, передачи, обработки, хранения и распространения информации, способных оперировать с большими массивами информации в реальном времени.

В настоящее время это реализовано - на базе компьютеров создана информационная индустрия, определившая переход к безбумажным технологиям обмена информацией на основе видеотелефонов, факсимильной передачи документов, видеотекстных систем, электронной почты, телеконференций, локальных и глобальных сетей передачи данных, спутниковой связи, баз и банков данных, информаци- онно-поисковых систем, автоматизированных рабочих мест. В мире работает несколько сотен информационных центров, имеющих около 3 000 баз данных, обеспечивающих удаленный диалоговый режим пользования. Информационная индустрия весьма доходна. В 1990 г. прибыль американских компаний, вовлеченных в информационную индустрию, составила 1 триллион долларов.

Феномен информации инициировал новую науку - науку об информации. Ее задачами являются: изучение свойств информации, методов управления информационными потоками и их использования, методов обработки информации для оптимального хранения, поиска и распространения. Можно сказать, что в настоящее время мировое сообщество все более превращается в гигантскую информационную систему. При этом в общем случае информационной системой называется функциональная система, предназначенная для записи, хранения, обработки и выдачи информации по запросам пользователей.

5

В соответствии с документами ЮНЕСКО для информатики введено следующее определение:

ИНФОРМАТИКА - это крупное научное направление, которое включает методы и средства сбора, анализа и обработки информации на основе достижений микропроцессорной, компьютерной техники и технологий, средств и систем коммуникаций в целях научнотехнического прогресса и социального развития мирового сообщества.

Методы и средства информатики, материализуясь, доходят до потребителя в виде новых информационных технологий, т. е. современных видов информационного обслуживания на базе компьютерных средств и коммуникаций. Компьютер открыл эру безбумажной технологии. По мнению академика Н.Н. Моисеева, создание компьютера столь же крупная веха в становлении человечества, как и использование огня.

В3. ДИНАМИКА РАЗВИТИЯ СРЕДСТВ ХРАНЕНИЯ ИНФОРМАЦИИ

Базой любых компьютерных, информационных технологий являются средства памяти данных. Их мобильность, стоимость предопределяют эффективность, массовость и перспективность применения. Для анализа и оценки состояния и тенденций развития этих средств целесообразно рассмотреть динамику двух основных показателей:

-емкость оперативных файлов данных;

-удельная стоимость средств хранения данных.

Оперативными файлами данных называются файлы, считываемые непосредственно с ЭВМ без участия оператора за время, не превышающее 1 с, т. е. в режиме on-line.

На рис.В.1 приведен график в логарифмической шкале, показывающий динамику роста емкости V оперативных файлов данных по годам. Из него видно, что примерно за сорок лет их емкость возросла более чем на 9 порядков.

Рис.В.2 отражает динамику изменения удельной стоимости C средств хранения данных. Из графика видно, что стоимость средств хранения данных по мере развития микроэлектронной техники и технологий стремительно уменьшается.

Таким образом, проведенный анализ позволяет сделать вывод о росте экономических показателей применения информатики и информационных технологий как за счет их собственной эффективности, так и за счет интенсивного снижения стоимости технических средств. Это является фундаментом жизненности, активного повсеместного распространения информатики и информационных технологий.

6

Год

Рис. В1. Динамика роста емкости оперативных файлов данных

Год

Рис. В.2. Динамика изменения удельной стоимости хранения данных

7

В4. КОНТРОЛЬНЫЕ ВОПРОСЫ

1.В чем сложность перестроечных процессов?

2.Что является катализатором ускорения адаптации в перестроечных процессах?

3.Определите понятие "информационный взрыв", приведите иллюстрирующие примеры.

4.Определите понятие "информационные ресурсы" и обоснуйте их значимость.

5.Что вкладывается в понятие информатика?

6.Приведите характеристики, иллюстрирующие динамику развития технических и экономических факторов средств хранения информации.

7.Укажите основные направления, в которых актуально применение ПЭВМ.

8.Каковы основные аспекты решения различных прикладных задач на ПЭВМ?

8

ГЛАВА 1. КОНЦЕПЦИЯ БАНКОВ ДАННЫХ И ЗНАНИЙ

1.1. ОСНОВНЫЕ ПОНЯТИЯ О БАНКАХ ДАННЫХ И ЗНАНИЙ

Информация – это понятие, подразумевающее знание определенных сведений, используемых в различных областях человеческой деятельности. На основе информации углубляются познания законов развития материального мира, взаимосвязываются и координируются работы, контролируются процессы и принимаются решения.

Информацией называются любые сведения о каких-либо явлениях, событиях, процессах, являющиеся объектами восприятия, передачи, преобразования, хранения и использования.

Обычно потребителя информации интересует какой-либо конкретный вопрос, область знаний или какая-то определенная совокупность объектов. В соответствии с этим в области информационной деятельности введено понятие предметной области.

Предметной областью (ПО) называется определенная часть реального мира, представляющая интерес для конкретного исследования или планируемых действий и соответственно для использования и отображения в информационной системе (в банке данных или знаний).

В процессе исследования объекта наблюдатель фиксирует состояние системы в определенной форме без выполнения над ним ка- ких-либо операций. Информация, фиксируемая в определенной форме и пригодная для последующей обработки, хранения и передачи, называется данными. Процесс восприятия состояния системы в виде данных, описывающих состояние системы, называется фиксацией данных. Информация, представляемая в виде зарегистрированных фактов, называется фактографической.

При изучении ПО в соответствии с понятиями "информация" и "данные" рассматривается 2 аспекта:

-инфологический;

-датологический.

Инфологический аспект предусматривает рассмотрение вопросов смыслового содержания информации, независимо от способа формирования и организации данных в памяти ЭВМ. На этом этапе осуществляется:

-описание вводимых в информационную систему понятий об объектах информации, их характеристиках, взаимосвязях;

-выявление объектов или явлений реального мира, информацию

окоторых требуется накапливать и обрабатывать;

-перечень основных учитываемых характеристик и их взаимо-

9

связей.

Датологический аспект охватывает вопросы представления данных в памяти информационной системы. На этом этапе:

-формулируются правила смысловой интерпретации данных;

-определяются формы представления информации посредством данных в информационной системе;

-определяются модели и методы представления и преобразования данных.

Определение смыслового содержания зарегистрированных данных называется семантической информацией (или семантикой). Она необходима для дальнейшего использования в производственных операциях.

Основное средство представления семантики данных - это естественный язык.

В общем случае работа с семантикой - это работа со знаниями. Благодаря семантической информации машинные системы способны "понимать" задачу в формулировке пользователя, т.е. реализуются "интеллектуальные" возможности или способности ЭВМ. В результате общение с пользователем становится возможным на естественном языке. При этом в режиме диалога "человек - ЭВМ" возможно использование текстовой, графической, а также речевой форм представления информации и получения результатов ее обработки.

Специализированные информационные системы, оперирующие со знаниями и называемые системами искусственного интеллекта, используются специальные формализованные языки. Эти языки более эффективно реализуют обработку семантической информации.

В информационных системах сложноорганизованные данные, содержащие одновременно как фактографическую, так и семантическую информацию, необходимую пользователю для машинного преобразования исходных фактов в соответствии с определенными правилами, т.е. для работы с данными, называются знаниями.

Для представления знаний в ЭВМ применяются различные модели, среди которых наиболее распространены семантические сети, фреймы, логические модели, системы продукций.

Интеллектуальные системы, называемые также системами искусственного интеллекта, используются для принятия решений в задачах менеджмента, в различных областях экономической деятельности, для автоматического перевода текстов на иностранных языках, доказательства теорем, распознавания изображений, диагностирования ситуаций, автоматизации процессов проектирования и т.д.

Учитывая лавинообразно нарастающие потоки информации в самых различных областях человеческой деятельности, естественен вопрос, как и какими средствами можно представить в ЭВМ столь многообразную и многочисленную информацию и успешно ее использовать. Наиболее совершенной и прогрессивной формой органи-

10

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]