Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
0
Добавлен:
20.04.2023
Размер:
3.56 Mб
Скачать

1.Задачи преобразования неструктурированного ЕЯ-текста в ЕЯ-текст с разбиением на рубрики;

2.Задачи преобразования ЕЯ-текста с разбиением на рубрики в структурированный ЕЯ текст с элементами логического формализма;

3.Задачи преобразования структурированного ЕЯ текста с элементами логического формализма в символьную модель, использующую формализм теории графов с ЕЯ-

маркировкой вершин (узлов) и связей (дуг);

4. Задачи преобразования символьной модели, использующей формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг), в символьную модель,

использующую формализм теории графов с ИЯмаркировкой вершин (узлов) и связей (дуг);

5. Задачи преобразования символьной модели, использующей формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг), в строгую символьную ИЯ-модель.

В принципе, уже после решения задачи второго типа, может осуществляться переход от ЕЯ-представлений к некоторой промежуточной системе обозначений (имен), как это делается при разработке программ. Однако такой переход имеет смысл только при условии,

что уже произведена декомпозиция на элементарные термины, выражающие свойства и функции объектов, с тем, чтобы в дальнейшем для них не потребовалось осуществлять процедуру восстановления ЕЯ-представления. Если это условие выполняется, то становится возможен даже автоматизированный переход от промежуточной системы имен к ИЯ-

представлению (при условии существования тезауруса соответствующего уровня). В общем же случае, операция детальной декомпозиции осуществляется лишь при решении задачи четвертого типа. Впрочем, жесткий стандарт здесь установить трудно, да и не может он быть жестким, поскольку специфику алгоритма структуризации определяют цели деятельности.

Более того, в случае, когда достигнутая степень формализации не удовлетворяет требованиям, предъявляемым спецификой деятельности, полученное формальное описание может быть повторно подвергнута процедурам, которые ранее осуществлялись в отношении представления иного типа.

Заметим, что структурированию может подвергаться и информация, представленная в нетекстовом виде, однако и здесь могут быть выделены задачи, по своему содержанию равносильные перечисленным.

Например, рассматривая в качестве исходного массива данных массив графических изображений различных фрагментов некоторого объекта/процесса, относящихся к разным моментам времени и полученных с разных ракурсов, можно решить задачу структурирования, воспользовавшись теми же этапами/задачами. Для чего можно воспользоваться одной из двух стратегий:

-осуществить предварительную трансляцию в текстовую форму (составление подробных описаний изображений на ЕЯ с указанием пространственных и временных отношений между описываемыми объектами), после чего воспользоваться ранее описанными процедурами;

-интерпретировать изображение, как разновидность текста, с применением альтернативной знаковой системы, позволяющей осуществить процесс структуризации в другой знаковой системе.

В качестве теоретического основания для применения такого подхода выступает семиотика, интерпретирующая любой способ представления информации как разновидность текста, представленного средствами некоторой знаковой системы. Для графического представления информации разработан ряд методов, позволяющих перейти от обычного цветного тонального изображения к контурным и иным представлениям, упрощающим процедуры распознавания и трансляции к иным знаковым системам. Однако, поскольку графические модели, получаемые методом последовательной фиксации состояния объектов реального мира, способны отражать лишь пространственно-временные и атрибутивные характеристики наблюдаемых объектов/процессов, постольку извлечение из них системы причинно-следственных отношений становится возможным только с привлечением внешней

(чаще всего — экспертной) модели интерпретации.

Наиболее распространенным путем решения задач структуризации информации является привлечение эксперта-аналитика. В этом случае на него ложится вся нагрузка по преобразованию исходного текста: от поиска связных фрагментов до выявления системы логических, пространственных, временных отношений и дальнейших процедур синтеза формальной модели. Хотя в последнее время, благодаря развитию семиотики, лингвистики,

теории искусственных языков, теории систем искусственного интеллекта, нейрокибернетики и ряда других научных дисциплин, в эту отрасль стали все чаще вторгаться технологии если не автоматического, то автоматизированного анализа и структурирования информации.

Среди такого рода технологий можно выделить системы автоматизированного реферирования текста, предназначенные для извлечения фрагментов текста, наиболее ярко выражающих сущность текста или его основные положения. Как правило, эта операция осуществляется за счет применения статистических закономерностей, открытых Дж. Зипфом

(George Kingsley Zipf) и получивших название принципа экономии усилий в лингвистике или закона Зипфа (или, более общей формулировке, закона Зипфа-Мандельброта).

В зависимости от реализации статистические критерии могут применяться к тексту на раннем этапе (до грамматико-логической обработки текста), а могут и на завершающей стадии (после предварительной обработки, согласования словоформ и т. п.). Однако, в

настоящее время без поддержки интерактивного режима (диалога с экспертом) качество реферирования достаточно низко и не всегда удовлетворяет потребителя. Вне зависимости от спектра технологий, используемых при анализе словоформ (формальные ли грамматики,

нейросетевые ли технологии), результаты семантической обработки пока далеки от тех,

которые в состоянии обеспечить эксперт, что отчасти объясняется тем, что любая из созданных на сегодня баз знаний, в известном смысле, наивнее ребенка. Причиной такой

«наивности» является то, что механизмы обучения подобных систем и способы организации знаний в них несовершенны, а количество каналов приобретения знаний слишком мало.

Существуют прототипы самообучающихся интеллектуальных систем, но до уровня интеллекта разумных существ эти системы пока не могут дорасти.

Однако оставим подробное рассмотрение этих вопросов специалистам в области теории систем искусственного интеллекта. Заметим лишь, что работы в области теории систем искусственного интеллекта действительно заслуживают того, чтобы с ними ознакомились люди, занятые в «сфере информационного производства». Чрезвычайно интересны эти работы хотя бы потому, что представляют собой попытки осмыслить то,

каким образом человек осуществляет свою мыслительную деятельность, алгоритмизировать и упорядочить ее, что крайне важно и для эксперта-аналитика. Кроме того, нелишне хотя бы

вобщих чертах представлять, каким образом работает твой инструмент, каковы его параметры и особенности функционирования. Так, например, ряд направлений современной психологии выросли не из классической психологии, а из гибрида теории искусственного интеллекта, классической психологии и философской теории познания. И столь необычное происхождение этих психологических теорий, отнюдь, не мешает специалистам в этой области успешно решать задачи именно психологического плана.

Методы первичного структурирования информации широко используются при синтезе баз данных и подробно рассматриваются в разнообразных изданиях по информатике,

вчастности — тех, которые посвящены вопросам проектирования и разработки баз данных различного назначения. В наиболее популярном и, в то же время, профессиональном изложении эти проблемы рассматриваются в книге американского автора Дэвида Васкевича ,

написанной именно для тех людей, которые руководят деятельностью или формулируют задачи перед специалистами в области разработки программного обеспечения, но не обязаны вникать в технологические подробности процесса разработки. В частности, в книге Васкевича описываются различные способы организации и структурирования данных, виды отношений между ними, приведены наглядные примеры, что позволяет руководителю по ее прочтении квалифицированно руководить коллективом разработчиков и грамотно

организовать технологический процесс. Но подчеркнем еще раз: для нас в этой книге содержится информация, связанная именно с проблемой структурирования информации.

Нет ничего удивительного в том, что мы обращаемся к базам данных для того, чтобы проиллюстрировать процессы структурирования информации. Базы данных — это тоже модели, описывающие те или иные аспекты существования системы/процесса, поэтому при их создании и проектировании так же применяются методы структурирования информации,

отличающиеся от прочих методов лишь тем, что структурирование осуществляется уже с учетом ограничений, налагаемых технологической платформой. В общем случае при структурировании информации такие ограничения не всегда принимаются в расчет.

Так или иначе, но полученный массив описаний предметной области или проблемы на начальном этапе структурирования информации должен быть приведен к виду,

упрощающему его дальнейшую обработку. Если сведения получены в результате проведения информационно-поисковых процедур (например, в различного рода средствах массовой информации — от печатной прессы до сети Интернет), полученный исходный массив, как правило, не структурирован и разноформатен. В этом случае перед аналитиком встает задача первичного структурирования массива сообщений в ее наиболее сложном варианте (здесь требуется выделение из сообщений информации, релевантной задачам исследования, ее компоновка и т. п.).

Однако если речь идет о сборе информации методом опроса экспертов, первичное структурирование информации может быть проведено уже на предшествующем этапе за счет разработки системы опросников, анкет и иных средств упорядочивания информации.

Стратегия опроса экспертов (в том числе — проведения мозговых атак или деловых игр)

может быть организована таким образом, чтобы ввести экспертов в ситуацию, управляющую процессом высказывания суждений в той последовательности, при которой информация будет изначально структурирована некоторым образом, отвечающим потребностям последующей ее формализации. В некоторых случаях экспертам могут быть предъявлены на оценку заранее подготовленные варианты решения задач, массивы исходных данных и прочие материалы, нуждающиеся в оценивании и ранжировании с привлечением их опыта.

В одном случае (при анкетировании и управлении процедурой опроса или стратегией игры) информация извлекается в соответствии с заранее установленной рубрикацией. В

другом случае (при оценивании вариантов) структура организации информации не изменяется и остается в рамках заранее установленной формы любого уровня структурной организации. В частности, варианты, предложенные для оценивания, могут быть сформулированы на основе исследований, предварительно проведенных на имитационных

моделях, или полученных в результате собеседования с другими группами или с той же группой экспертов.

Для выделения логической структуры описаний, предварительно разделенных на рубрики (относящиеся к одним и тем же группам объектов, процессам, временным и пространственным областям) применяются различные методы, обеспечивающие возможности:

-выделения «дискретных» состояний (для текстовых описаний — это связано с определением множества терминов, используемых для описания некоторого, существенного для решаемой задачи, состояния);

-упорядочивания их во времени (построение сценариев типа «раньше — позже»);

-причинно-следственного связывания (построение сценариев типа «причина —

следствие»);

- пространственного связывания и иные.

На следующем этапе в зависимости от целей деятельности подобные модели могут быть подвергнуты процедуре декомпозиции (детализации) или агрегации (композиции или свертке), в результате чего формируется описание необходимого уровня абстракции/детализации.

Дальнейшие этапы выполняются за счет введения специальных систем именования элементов модели, приписывания им поименованных атрибутов, описания функциональных зависимостей и так далее. Например, в качестве функциональных зависимостей для ряда задач могут быть рассмотрены зависимости ресурс-время-результат и иные, которые на начальных этапах могут быть использованы для маркирования дуг графа, а впоследствии — воплощены в программные коды имитационных моделей. Особый класс составляют модели ситуаций, используемые для распознавания объектов, их состояний, тенденций и процессов.

В таких моделях может абсолютизироваться либо статический, либо динамический аспект существования/функционирования системы. Однако подробно рассматривать эти процедуры мы здесь не будем, тем более, что некоторые аспекты этой деятельности нами уже были описаны при рассмотрении соответствующих классов моделей.

МЕТОДЫ ПОЭТАПНОЙ СТРУКТУРИЗАЦИИ ЗАДАЧ И ГРУППА МОРФОЛОГИЧЕСКИХ МЕТОДОВ

Особый класс задач структурирования информации представляют собой задачи структурирования целей и задач в условиях, характеризующихся различным уровнем неопределенности. Для их решения существует ряд методов, к числу которых относятся

методы поэтапной структуризации задач и группа морфологических методов. Оба класса методов адаптированы к применению в условиях высокой неопределенности. Но те способы,

какими решается задача устранения неопределенности, различаются коренным образом:

первая группа методов ориентирована на управление процессом постепенного снижения неопределенности, а вторая — на решение задачи синтеза модели за одну итерацию (но в результате может быть получен целый массив альтернативных моделей). Характерно, что при использовании морфологического метода уровень неопределенности может сохраниться прежним, а исходная неопределенность будет перенесена на другой уровень формального описания (хотя, благодаря переходу к формальному представлению, решение задачи понижения неопределенности в некоторых случаях удается поручить средствам автоматизации).

Однако на этом различия не кончаются. Уровень формализации первичной модели, с

которой начинается работа каждого их классов методов, также является индивидуальным для разных групп методов. Для методов поэтапной структуризации этот уровень может быть произвольным, а для морфологических методов необходимо, чтобы детальная декомпозиция предметной области уже была произведена и были сгенерированы матричные модели специального строения. И, наконец, последнее различие: метод поэтапной формализации — это метод поэтапного приближения к формальной модели или этапу логически обоснованного выбора решения, а морфологический метод — это метод синтеза альтернатив,

подлежащих анализу и оценке. То есть первая группа методов связана с процедурами логического вывода решения, а вторая — с комбинаторным анализом, процедурами перебора решений, в общем случае, полученных без логического вывода.

Методы поэтапной структуризации задач нацелены на проведение процедуры постепенного повышения уровня абстракции и структурной организации описаний

(моделей). Этот класс методов широко распространен при решении задач различного типа

(от синтеза формальной модели до синтеза прогноза). Существует два толкования термина

«поэтапная структуризация задачи». В первом случае под задачей понимается задача синтеза модели, и внимание концентрируется на обеспечении и планировании процесса синтеза модели и схемы проведения исследования. В другом случае под задачей понимается некоторая цель управленческой деятельности (в этом случае речь идет именно о процессе структурирования совокупности задач, подлежащих решению в интересах достижения цели,

то есть о цели, как объекте формализации).

Поскольку проблему структурирования информации мы достаточно детально рассмотрели, постольку основное внимание сконцентрируем именно на проблеме синтеза и структуризации некоторой совокупности целей и задач.

Особо актуальны эти методы при проведении комплексных междисциплинарных исследований и проведении работ по синтезу планов и прогнозов. К числу этих методов могут быть причислены методы планирования экспериментов и иные методы, имеющие другую отраслевую специфику (например, методы планирования пропагандистских кампаний и т. п.). Еще раз подчеркнем: это не какие-то теоретические абстракции, а методы ведения самых разнообразных, и, прежде всего, прикладных исследований, методы,

актуальные в самых разных отраслях деятельности человека.

Процесс поэтапной структуризации задач можно сравнить с кропотливым процессом выращивания фруктового дерева — только в нашем случае дерево вырастает необычное — дерево целей и задач. Это дерево растет кроной вниз — корень (глобальная цель)

размещается вверху, а ветви, отображающие различные связи с подчиненными задачами,

функциями и т. д., растут вниз.

Действительно, процесс этот весьма сложен и состоит из многих этапов, из которых первым и наиважнейшим является выбор корректной формулировки глобальной цели.

Впрочем, и все дальнейшие процедуры, связанные с построением дерева целей не менее ответственны, но глобальная цель задает направление всей дальнейшей деятельности, а

значит, ее выбор и ясность формулировки определяют успех не только процедуры синтеза дерева целей и задач, но и всей последующей деятельности.

Перечислим наиболее существенные требования, предъявляемые к получаемой в результате работы древовидной иерархической модели. К числу этих требований относятся:

-полнота и достаточность для описания основных критериев принятия решения;

-компактность (минимальный уровень декомпозиции при заданной полноте);

-конкретная цель, функция, задача или объект, расположенные в узлах модели,

должна появляться в дереве только один раз;

- лицо, принимающее решение, должно быть в состоянии представлять и анализировать отдельные ветви дерева независимо.

Причины, по которым выдвинуты такие требования, очевидны: наличие дублирования модельных элементов препятствует однозначной интерпретации и способно привести к некорректному установлению количества потребных ресурсов и иным нежелательным последствиям. По своей идеологии модели типа деревьев целей и задач наследуют свойства классификаций, стратифицированных моделей и моделей иерархических систем.

Существует несколько подходов к построению дерева целей и задач или, как его часто называют в отечественной литературе, прогнозного графа. Одна часть подходов рассчитана на краткосрочную перспективу , то есть, разработчики исходят из предположения, что за период реализации замысла окружающая обстановка не претерпит существенных изменений,

либо эти изменения не затронут основных тенденций развития обстановки. Другая часть адаптирована к решению задач стратегического планирования, для которого интервал времени реализации замыслов существенно превышает интервал сохранения стабильной обстановки, а сохранение тенденций изменения обстановки не может быть гарантировано.

Кроме того, многое зависит от «направления» конструирования дерева (оно может строиться сверху вниз, снизу вверх, существует также и метод встречного проектирования).

В первом случае от глобальной цели вниз начинает последовательно развертываться древовидная структура, в которой с переходом от уровня к уровню поэтапно снижается неопределенность функционального, операционного и иных видов, в результате чего на самом нижнем уровне могут быть сформулированы конкретные требования к составу и количеству ресурсов, инструментальных средств и методик. Во втором случае речь идет о том, что состав ресурсов, инструментальных средств и методик не подлежит коррекции, а

дерево выстраивается снизу вверх с соблюдением введенных в качестве критериев приемлемости решений базовых ценностей. Для второго подхода характерно, что цель существует как некий идеал, а структура подзадач, задач и функций, а также методы их решения примерно установлены и могут претерпевать изменения в некоторых, достаточно жестко заданных, рамках. Строгие количественные критерии на начальном этапе, как правило, не заданы: числа появляются как результат постепенного подъема по иерархии, а

наибольшая неопределенность существует именно на верхнем уровне (как оценка степени близости к поставленной цели). Такой подход был характерен для осуществления планирования в СССР — он однозначно «экологичнее» рыночного и исключает кризисы перепроизводства, но мало способствует совершенствованию системы (она просто настраивается). Метод встречного проектирования пригоден для решения задач, связанных с разрешением ситуаций, вызванных изменением внешней ситуации, когда реконструкции

(реинжинирингу) подлежит средний слой иерархии (то, что в народе принято называть

«сведением концов с концами»).

Остановимся на подходе к построению дерева целей и задач, рассчитанных на краткосрочную перспективу. В этом случае условия полагаются известными, в результате чего глобальная цель подлежит декомпозиции на совокупность функций, задач и подзадач без учета многообразия вариантов обстановки, в которой они будут решаться. Для оценивания того, решена ли та или иная задача (подзадача) определяется перечень свойств,

которыми должны обладать те материальные объекты, посредством которых может быть получено решение задачи, а также вводятся мера качества решения задачи (например,

стоимостная эффективность) и функция оценивания (вычисления меры качества). Далее определяются потребности в ресурсах, инструментальных средствах и методиках,

обеспечивающих решение поставленных задач. В условиях действия системы ограничений и на случай непредвиденного перерасхода ресурсов в подобную модель вводятся весовые коэффициенты, отражающие систему приоритетов и соответствующие системе ценностей субъекта целеполагания.

В случае, когда синтезируется дерево целей и задач на период, превышающий период параметрической, структурной и функциональной стабильности системы, прибегают к приемам стратегического планирования. Отличием такого подхода является то, что этапу синтеза дерева целей и задач предшествует этап построения пространства альтернатив — то есть, пространства в котором некоторая группа избранных параметров образует «систему координат», определяющую топологию системы, функции и состояние ее элементов в некоторый момент времени. Достоинством такого подхода является то, что в такой системе координат могут быть выбраны экстремальные точки, в которые система может перейти в случае развития тех или иных тенденций — для таких точек с необходимой степенью детализации прописываются параметры системы, обеспечивающие разработчиков модели достаточной для синтеза дерева целей и задач информацией. Для каждой из точек

(альтернативных миров) выстраивается адекватная конфигурация дерева (по схеме,

аналогичной той, которая используется при синтезе дерева целей и задач, рассчитанных на краткосрочную перспективу). После этого предпринимается попытка сведения полученных деревьев к единой конфигурации, для каждого из узлов и операций оцениваются риски, как вероятность скатывания к негативным сценариям развития ситуации, а также назначаются веса элементов дерева, отражающие степень их важности для достижения поставленной глобальной цели.

Рисунок 8 — Фрагмент реального дерева целей и задач с весами, проставленными в результате экспертного опроса.

На рисунке 8 приведен фрагмент дерева целей и задач, на котором проставлены веса относительной важности достижения целей. Заметим, что сумма весов целей одного уровня иерархии равна 1 (в случаях же, когда веса выставляются в процентной мере, сумма будет равна 100 %). В нашем примере, где числа представлены в виде десятичных дробей,

очевидна вероятностная природа оценок. Веса могут быть как вычислены аналитически, так и получены в ходе экспертного опроса.

Чаще всего на этапе расстановки весовых коэффициентов прибегают к методам экспертной оценки, в том числе — с применением метода Дельфи. Заметим, что изначально метод Дельфи применялся именно для определения приоритетов, то есть, для расстановки весовых коэффициентов. Причем такой подход в равной степени применим как в отношении краткосрочных задач, так и в отношении задач перспективного планирования.

При синтезе дерева целей и задач методом встречного проектирования процедура состоит в согласовании верхнего и нижнего уровней иерархии целей, для чего рассматриваются варианты согласования целей и задач, перераспределения ресурсов и инструментов между субъектами деятельности. Этот подход представляет собой, пожалуй,

наиболее интересный вариант решения проблем в сфере, связанной с решением социальных проблем, организацией коллективной деятельности в интересах достижения корпоративной цели. Здесь целесообразно рассматривать различные подходы к социализации целей (их

Соседние файлы в папке из электронной библиотеки