- •Isbn 5-88283-048-6
- •Введение
- •3 Глава 1. Понятие информации и документ
- •1.1. Проблема понятия информации
- •1.2. Зависимость информации от характера материального носителя
- •1.3. Виды информации и документ
- •1.4. Свойства информации
- •Глава 2. Документирование информации
- •2.1. Информационные предпосылки документирования
- •2.3. Язык информации
- •2.4. Эволюция способов документированием
- •2.5. Документ в коммуникации
- •Глава 3. Текст документа
- •3.1. Характеристика текста документа
- •3.2. Текст а информационном пространстве
- •3.3. Чтение текста
- •3.4. Понимание текста
- •3.5. Текст в экстралингвистическом контексте
- •3.6. Интерпретация текста
- •Глава 4. Характеристика документа
- •4.1. Понятие «документ»
- •4.2. Свойства документов
- •4.3. Функции документа
- •4.4. Виды документов
- •Глава 5. Документная деятельность
- •5.7. Структура и сущность документной деятельности
- •5.2. Потребности в документной информации
- •5.3. Докуменгопроизводство
- •5.4. Каналы распространения документов
- •5.5. Сбор документов
- •5.6. Обработка документов
- •5.7. Хранение документов
- •5.8.Поиск документов
- •5.9. Использование документов
- •5.10. Правовые вопросы работы с документами
- •5.7 7. Современные проблемы стандартизации в области работы с документами
- •Глава 6. Теоретические проблемы документоведения
- •6.7. Статус документоведения
- •6.2. Документоведение в структуре наук и сфер практической деятельности
- •Глава 7. Документоведческие исследования
- •7.1. Задачи докумеитоведческих исследований
- •7.2. Методика научного исследования
- •7.3. Системные методы исследования документов
- •7.4. Типологический метод изучения документов
- •7.5. Информационный анализ документов
- •7.6. Метод терминологического анализа
- •7.7. Контент-анализ
- •7.8. Психолингвистический метод изучеяяя документов
- •7.9. Методы конкретно-социологических исследований
- •7.10. Метод экспертных оценок
- •7.11. Библиографический метод изучения документов
- •7.12. Наукометрический метод изучения документов
7.7. Контент-анализ
Контент-анализ — метод количественного изучения содержания документа. Сущность этого метода заключается в подсчете частоты встречающихся в тесте единиц: знаков, комбинаций знаков, букв, слов, терминов, словосочетаний, фамилий отдельных лиц и т.д. После подсчета выделенные единицы выстраиваются в порядке убывания частоты их употребления (использования) в тексте, т.е. формируется тезаурус. Результаты подсчета
188
позволяют увидеть то, что рассеяно в тексте и на первый взгляд не видно.
Наиболее сложный и ответственный этап состоит в том, что исследователь намечает те смысловые единицы, наличие (или отсутствие) которых интересует его в изучаемом тексте (текстах). Поскольку одно и то же смысловое содержание может быть выражено с помощью различных языковых средств, то вслед за выделением смысловых единиц исследователь должен сформулировать их конкретные эмпирические индикаторы (показатели), т.е. формализовать единицы. И, наконец, решается вопрос о единице счета - ею может быть не только частота упоминаний, но и такие величины, как число строк, отданных данной смысловой единице, или площадь газетной полосы. В итоге всех этих подготовительных процедур формируется система четких правил, т.е. определенный алгоритм, посредством которого и анализируется содержание рассматриваемого текста.
Существует несколько разновидностей контент-анализов в зависимости от цели исследования и выбора показателей. Например, используется семантический контент-анализ. Он ориентирован на выявление смысла текста. В качестве показателей для подсчета выбираются смысловые единицы, заключенные в словах, словосочетаниях и высказываниях. В литературоведении используется лингвистический контент-анализ. Каждый литературный текст характеризуется своими особенностями: длиной абзацев и фраз, порядком слов в предложениях, наиболее часто встречающимися словосочетаниями. Каждый показатель может служить единицей для подсчета, статистическая обработка которых позволяет сделать обоснованные выводы: кто написал данный текст, к какому жанру он относится и т.д. Поскольку каждый автор может быть охарактеризован с этой стороны, с точки зрения длины слов и предложений, излюбленных словосочетаний и стилистических оборотов. В спорных случаях, когда авторство неизвестно или приписывается сразу нескольким лицам, такой анализ позволяет доказать принадлежность текста конкретному автору, если результаты контент-анализа совпадают с результатами анализа других текстов данного лица.
Существует категория текстов, которые называются научными. Для них предлагается свой контент-анализ, называемый
189
цитационным. В научных текстах принято ссылаться на того, у кого автор позаимствовал что-нибудь (идею, метод, факт), с которыми он согласен или не согласен. Так как наука не делается на пустом месте и каждый ученый берет у кого-то эстафетную палочку и кому-то ее передает, ссылки во всех публикациях образуют сеть, раскрывающую логику развития науки. При установлении общности выявленных связей между работами создается карта определенной научной деятельности, совокупность которых складывается в научный атлас исследований в этой области на данный момент.
Этот метод позволяет определить «фронт исследований» -вычислить группу работ, текстов, авторов, цитируемых наиболее активно. Эти широко цитируемые работы определяются как «ядерные» для данной области исследования, по ним можно судить в целом об уровне, качестве, фундаментальности исследований этой научной сферы.
Статический анализ цитирования позволяет вычислить «фактор влияния» отдельной работы на исследовательский процесс, который определяется как среднее годовое число ссылок на данную работу. Наибольшее число ссылок свидетельствует о высокой значимости работы и о серьезном ее влиянии на умонастроение исследователей.
«Фактор оперативности» цитирования характеризуется скоростью цитирования работ, определяется как временной интервал между выходом в свет работы и последующих работ, в которых она упоминается и цитируется. Чем этот временной интервал меньше, тем выше скорость научного взаимообмена, выше интенсивность, темп развития данной научной области.
Анализируя цитируемые публикации, можно обнаружить такой временной отрезок, заключающий в себе максимальное количество ссылок, за пределами которого будут следовать все более длинные интервалы времени, разделяющие дату выхода в свет работы от дат источников, на которые авторы ссылаются. Как будто есть некоторая граница, за которой интерес к более ранним публикациям утрачивается. В таком случае говорят о «полупериоде старения» информации, который вычисляется для каждой научной области путем количественного подсчета частоты цитирования документов.
190