Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Воробьев Документ Информационный анализ.doc
Скачиваний:
25
Добавлен:
12.02.2016
Размер:
1.77 Mб
Скачать

Г. Г. Воробьев ,

ДОКУМЕНТ: информационный анализ

ИЗДАТЕЛЬСТВО «НАУКА» МО,СКВА 1973

Ш^оьч fcV?

УДК 002: [001.8; 02; 025.4; 651.5; 659.2]

Воробьев Г. Г. Документ: информационный анализ. М «Hav ка», 1973. • у

Рассматриваются природа и свойства документальной информа­ции, информационные характеристики документов, типы и функ­ции составляющих традиционного вспомогательного аппарата. Го­ворится о формализации предсшвляемых в документах сведений. Рассмотрен непрерывный классификационный ряд документов по уровням формализации, начиная от произвольных анкетных дан­ных и кончая матричными документами. Книга рассчитана на ши­рокие круги читателей. Таблиц 8. Иллюстраций 66. Библиогр. 262 назв.

Ответственный редактор

М. Л. колчинскии

cf К

В 042(02)—73 1077~~73 0 Издательство «Наука», 1973 г.

0. ВВЕДЕНИЕ

0.1. Проблема информации.— 0.2. Проблема документа.— 0.3. Науки об информации и документах.— 0.4. Новые специальности: информацион­ные работники и документалисты

0.1. Проблема информации

Одна из особенностей нашей эпохи —популярность слова ин.- | формация, которое существовало и ранее почти во всех евро­пейских языках, но применялось крайне редко. В переводе с этих языков «информация» означает: новости, сведения, дан­ные, т. е. здесь нет ничего такого, что требовало бы применения специального термина. Однако такую популярность не следует считать простой данью моде. За этим кроется большая обще­ственная проблема, которой раньше не существовало, и поэтому не было необходимости в специальном термине.

Проблема информации: возросшие объемы сведений, кото­рые люди должны собирать, хранить, извлекать из накопленных массивов других данных, перерабатывать и передавать друг другу [60]. В 60-х годах выражения «информационный кризис», «информационный взрыв» встречались в печати особенно часто и сопровождались внушительными цифрами объемов зафиксиро­ванной информации и прироста этих объемов.

По опубликованным данным [159, 189, 192, 200, 206, 210, 214, 229, 238, 244, 247], например, ежегодно химики открывают сот­ни тысяч новых химических соединений, ботаники — тысячи ви­дов растений, геохимики делают до 200 млн. анализов горных пород. Каждый год во всем мире выпускаются сотни миллиар­дов листов деловых бумаг, миллиарды страниц печатного текста, в том числе десятки миллионов страниц научных публикаций, сотни тысяч технических отчетов и такое же количество катало­гов фирм и патентных описаний.

Число научных и технических журналов приближается или уже превысило 100 тыс. названий. При этом, как впервые уста­новил Д. Прайс [95], прирост их происходит по экспоненциаль­ному закону, с удесятерением количества в среднем через каждые 50 лет. Характерно, что такие же темпы прироста имеют другие

виды документальных материалов — книги, корреспонденция и даже почтовые марки. Прошоз на 2000-й год в области научной информации: 2 млрд. страниц научных изданий (в том числе приблизительно 30 млн. страниц по биологии и почти столько же по химии) [159, 192, 206]; ежегодные ассигнования на научную информацию во всем мире приблизятся к 1 млрд. долл. [210, 241].

Такие перспективы, естлствен-но, не могут не волновать спе­циалистов. По известным словам Дж. Бернала, «во многих об­ластях создается такое положение, когда по сути дела легче от­крыть новый факт или создать новую теорию, чем удостоверить­ся, что они еще не были созданы или выведены» [60]. По мнению экономистов, скоро мы будем тратить еще больше времени на дублирование тех работ, о существовании которых не знали, или же усиленно заниматься поисками информации, не оставляя до­статочно времени на проведение новых исследований. Полага­ют, что из-за дублирования работ тратится впустую до 85% времени ученых и инженеров [189], причем по этой и другим причинам к. п. д. труда инженерных работников вообще не пре­вышает 10% [60]. Многие специалисты стали нелестно называть библиотеки и архивы складами листованного целлюлозного сырья. При этом они считают, что беда состоит не в том, что пи­шется слишком много деловых бумаг и печатается много лите­ратуры, а в том, что людям приходится читать не самое главное, в то время как до них не доходит материал, с которым важно ознакомиться [109].

Обрисованное положение заставляет обратиться к анализу режима работников умственного труда. Было подсчитано, что ученые-химики почти 45% рабочего времени тратят на сбор ин­формации и только 6% —на обдумывание и обработку получае­мых данных [203]; при этом, не удовлетворяясь существующим положением в области документации, они в 40% случаев пред­почитают личные контакты, чем знакомство с литературой [136]. У руководителей научных лабораторий США на информацион­ные процессы тратится в целом 28% рабочего времени, в СССР у начальников отделов НИИ и КБ — 42%, начальников секто­ров— 29%, руководителей групп — 27% [136]. До введения ав­томатизации и механизации в административном управлении в начале 60-х годов в США на бесполезную, «бумажную» работу тратили 600 млн. долл. ежегодно [19]. Во всех высокоразвитых странах угрожающе растут штаты канцелярских служащих (8—10% к занятым в народном хозяйстве [75]) и никакие во­люнтаристские действия не в состоянии приостановить этот процесс.

В связи с этим возникает ряд важных вопросов: каково должно быть оптимальное соотношение между различными ин­формационными процессами (письмо, чтение, разговор, коллек­тивные встречи) у различных категорий работников умственно­го труда, каково значение организации и механизации в их ра­боте и какова во всем этом роль носителей информации— до­кументов?

0.2. Проблема документа

С повышением роли информации стал быстро эволюциониро­вать более старый термин документ. Он возник от латинского слова documentum (доказательство, поучительный пример) и был введен в русский язык Петром I, который перевел это сло­во как «письменное свидетельство» [37]. Таким образом, с са­мого начала документы имели сугубо правовое значение и к ним причислялись разные деловые бумаги, имеющие юридичес­кую силу. В «Энциклопедическом словаре» Ф. Павленко (СПб., 1913) мы читаем: «Документ—1) всякая бумага, составленная законным порядком и могущая служить доказательством прав на что-нибудь или выполнение каких-либо обязанностей, 2) вообще всякое письменное доказательство». Постепенно это понятие распространилось на все «важные деловые бумаги» (Толковый словарь живого великорусского языка. М., 1956, т. 1) и приобрело два дополнительных оттенка: узкий, бытовой (пас­порт, удостоверение личности) и широкий, публицистический (исторический документ). В «Малой советской энциклопедии» 1959 г. (т. 3) впервые из документов (в «праве») были выделе­ны «служебные документы» (приказы, инструкции), а в «Боль­шой советской энциклопедии» 1962 г. (т. 15) появился само­стоятельный термин: «Документ счетный — документ, слу­жащий основанием для осуществления хозяйственных дей­ствий... и последующих бухгалтерских записей...» — в отличие от государственно-правовых, административно-правовых, су- дебно-правовых, «земельно-правовых и финансово-правовых до­кументов.

С развитием техники, особенно вычислительной техники и ки­бернетики, появились новые типы материальных носителей ин­формации: перфокарты, перфоленты, магнитные записи, фото­графии, некоторые из которых приняли на себя функции адми­нистративных, финансовых, научных документов. Поэтому поня­тие «документ» стихийно еще более расширилось. При этом de facto стали считать документами и всю печатную информацию (публикации): книги, журналы, брошюры и пр. В 1964 г. в «Терминологическом словаре по теории и практике научной ин­формации» впервые появилось такое определение: «Документ — материальный объект, содержащий информацию в закреплен­ном виде». Дальнейшие толкования и уточнения [37,90,91,113] позволяют дать следующее окончательное определение доку­мента как любого материального носителя с закрепленной ин­формацией на любом языке и любым способом.

1 Еще в 1951 г. С. Брие на вопрос: можно ли назвать доку­ментом звезду, является л и документом камень в канаве, живой зверь — документ или нет?—отвечала: «Нет. Но докумен­тами являются фотографии и каталоги звезд, образцы в минера­логическом музее и животные, занесенные в реестр и выстав­ленные в зоопарке» [170]. Ее определение документа — это любые зафиксированные знания, которые могут быть использо­ваны для справок, изучения и доказательства. і Такое столь широкое толкование включает в состав документ­ных фондов не только архивы и библиотеки, но также музеи и выставки. Но специалисты в своей работе еще- не могут охва­тить столь широкий диапазон.

Характерным примером при рассмотрении данного вопроса являются машинные перфокарты, которые сначала получили распространение только как удобный способ фиксации проме­жуточных и окончательных результатов в сложных вычислитель­ных процессах. Со временем в вычислительных центрах и на ма­шинно-счетных станциях стали накапливаться огромные архивы таких перфокарт, которые явочным порядком приобрели значе­ние документов, если не штучно, то в совокупностях. Еще позже на перфокарты стали часто наносить многочисленные цифровые данные о тех или иных объектах, подвергая их последующей вы­числительной обработке, и в ряде случаев такие перфокарты ста­ли гыполнять роль не вторичных, а первичных документов — сче­тов, нарядов, ордеров, чеков, учетных карт. Поэтому на вопрос: какую перфокарту не формально, а фактически следует считать документом? — можно ответить: ту, которая является достаточ­но емкой (в информационном отношении), долговечной и ценной, чтобы подвергаться достаточно продолжительным процессам об­работки— хранению, поиску, дублированию, передаче и т. п.

Проблема документа продолжает волновать нас еще в од­ном— юридическом отношении. Существует мого нерешенных вопросов: права первичных документов на новых носителях, права копий документов на новых носителях и связанные с этим вопросы хранения и уничтожения подлинников [249], ответст­венность ЭВМ за правильность автоматически составленной до­кументации [190], а также стандартизация .форм и методов об­работки 'документов в связи с их обращением во многих пере­крывающихся информационных системах [37].