Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Зиновьева Докментовед-е ВОРД.doc
Скачиваний:
46
Добавлен:
12.02.2016
Размер:
948.22 Кб
Скачать

7.7. Контент-анализ

Контент-анализ — метод количественного изучения содержа­ния документа. Сущность этого метода заключается в подсчете частоты встречающихся в тесте единиц: знаков, комбинаций зна­ков, букв, слов, терминов, словосочетаний, фамилий отдель­ных лиц и т.д. После подсчета выделенные единицы выстраива­ются в порядке убывания частоты их употребления (использова­ния) в тексте, т.е. формируется тезаурус. Результаты подсчета

188

позволяют увидеть то, что рассеяно в тексте и на первый взгляд не видно.

Наиболее сложный и ответственный этап состоит в том, что исследователь намечает те смысловые единицы, наличие (или отсутствие) которых интересует его в изучаемом тексте (текстах). Поскольку одно и то же смысловое содержание мо­жет быть выражено с помощью различных языковых средств, то вслед за выделением смысловых единиц исследователь дол­жен сформулировать их конкретные эмпирические индикато­ры (показатели), т.е. формализовать единицы. И, наконец, ре­шается вопрос о единице счета - ею может быть не только частота упоминаний, но и такие величины, как число строк, отданных данной смысловой единице, или площадь газетной полосы. В итоге всех этих подготовительных процедур форми­руется система четких правил, т.е. определенный алгоритм, посредством которого и анализируется содержание рассмат­риваемого текста.

Существует несколько разновидностей контент-анализов в зависимости от цели исследования и выбора показателей. На­пример, используется семантический контент-анализ. Он ори­ентирован на выявление смысла текста. В качестве показателей для подсчета выбираются смысловые единицы, заключенные в словах, словосочетаниях и высказываниях. В литературоведении используется лингвистический контент-анализ. Каждый литера­турный текст характеризуется своими особенностями: длиной абзацев и фраз, порядком слов в предложениях, наиболее час­то встречающимися словосочетаниями. Каждый показатель мо­жет служить единицей для подсчета, статистическая обработка которых позволяет сделать обоснованные выводы: кто написал данный текст, к какому жанру он относится и т.д. Поскольку каждый автор может быть охарактеризован с этой стороны, с точки зрения длины слов и предложений, излюбленных слово­сочетаний и стилистических оборотов. В спорных случаях, когда авторство неизвестно или приписывается сразу нескольким ли­цам, такой анализ позволяет доказать принадлежность текста конкретному автору, если результаты контент-анализа совпа­дают с результатами анализа других текстов данного лица.

Существует категория текстов, которые называются науч­ными. Для них предлагается свой контент-анализ, называемый

189

цитационным. В научных текстах принято ссылаться на того, у кого автор позаимствовал что-нибудь (идею, метод, факт), с которыми он согласен или не согласен. Так как наука не делается на пустом месте и каждый ученый берет у кого-то эстафетную палочку и кому-то ее передает, ссылки во всех публикациях об­разуют сеть, раскрывающую логику развития науки. При уста­новлении общности выявленных связей между работами созда­ется карта определенной научной деятельности, совокупность которых складывается в научный атлас исследований в этой об­ласти на данный момент.

Этот метод позволяет определить «фронт исследований» -вычислить группу работ, текстов, авторов, цитируемых наибо­лее активно. Эти широко цитируемые работы определяются как «ядерные» для данной области исследования, по ним можно судить в целом об уровне, качестве, фундаментальности иссле­дований этой научной сферы.

Статический анализ цитирования позволяет вычислить «фак­тор влияния» отдельной работы на исследовательский процесс, который определяется как среднее годовое число ссылок на данную работу. Наибольшее число ссылок свидетельствует о высокой значимости работы и о серьезном ее влиянии на умо­настроение исследователей.

«Фактор оперативности» цитирования характеризуется ско­ростью цитирования работ, определяется как временной ин­тервал между выходом в свет работы и последующих работ, в которых она упоминается и цитируется. Чем этот временной интервал меньше, тем выше скорость научного взаимообме­на, выше интенсивность, темп развития данной научной об­ласти.

Анализируя цитируемые публикации, можно обнаружить такой временной отрезок, заключающий в себе максималь­ное количество ссылок, за пределами которого будут следо­вать все более длинные интервалы времени, разделяющие дату выхода в свет работы от дат источников, на которые авторы ссылаются. Как будто есть некоторая граница, за ко­торой интерес к более ранним публикациям утрачивается. В таком случае говорят о «полупериоде старения» информации, который вычисляется для каждой научной области путем ко­личественного подсчета частоты цитирования документов.

190