Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методическое пособие 662

.pdf
Скачиваний:
5
Добавлен:
30.04.2022
Размер:
3.47 Mб
Скачать

УДК 004.853

С. В. Коноплёв

ПРОЕКТИРОВАНИЕ ТИПОВОГО РАБОЧЕГО ПРОЦЕССА НАУЧНОГО ИССЛЕДОВАНИЯ ДЛЯ СИСТЕМ ВИЗУАЛЬНОЙ АНАЛИТИКИ

Современные аналитические платформы позволяют решать сложные задачи исследования данных без непосредственного написания кода. Их преимущества очевидны – пользователи без специальной подготовки, не имеющие серьезных навыков программирования, могут использовать готовые шаблоны анализа данных и адаптировать их под свои нужды, создавая тем самым сложные аналитические модели, которые они не смогли бы сами создать. Кроме того, визуальные среды являются прекрасным инструментом для документирования. Нет необходимости читать код, потому что визуальное представление само по себе дает пользователю информацию о том, какие действия были или будут выполнены. Более того, конфигурация каждого модуля построена так чтобы быть интуитивно понятной. Эти особенности позволяют создавать широкий спектр удобных, многократно используемых средств обработки данных, заключающих в себе передовые достижения Data Science [1].

В настоящее время на рынке программного обеспечения присутствует большое количество продуктов анализа данных, похожих по своим возможностям и спектру решаемых задач, но для введения студенческой проектной деятельности главным требованиям к такой системе являются – доступность, простота освоения и использования. Анализ известного и доступного ПО позволил выбрать KNIME [2].

Knime Analytics Platform – открытая программная среда анализа данных. Она позволяет реализовывать полный цикл анализа данных – чтение данных из различных источников, преобразование и фильтрацию, собственно анализ, визуализацию и экспорт. KNIME позволяет пользователям визуально создавать потоки данных, выборочно выполнять некоторые или все этапы анализа, а затем проверять результаты, модель и интерактивные представления. KNIME написана на языке программирования Java на платформе Eclipse, что дополнительно делает возможным ее расширение путем добавления плагинов, обеспечивающих дополнительную функциональность. Это инструментальное средство анализа данных может быть максимально эффективно для проведения научных исследований студентов, поскольку позволяет наглядно отобразить процесс обработки данных, а также не требует специальных навыков программирования. Кроме того, студенты направлений информационного профиля могут изучать реализацию существующих узлов, дописывать свои компоненты (узлы), дополнять существующие библиотеки и создавать новые [3].

110

Несмотря на удобство использования и широкие возможности, работа с KNIME требует хорошего владения информационными технологиями анализа данных и знания особенностей использования разнообразных методов машинного обучения, что изучают не на всех инженерных специальностях. Преодолеть эту проблему и облегчить вхождение в Data Science можно путем создания простых шаблонов часто решаемых задач исследования данных с интерактивной навигацией. Для этого необходимо создание типового процесса научного исследования, который мог бы быть использован на платформе KNIME исследователями любого уровня квалификации.

В информационных системах под рабочим процессом понимается описание потока задач для получения конечного результата. Самая простая структура такого процесса работает с некоторыми входными данными для получения выходных данных. Несколько таких заданий обработки данных могут быть объединены последовательно для создания структуры типа конвейер, где каждое задание с выхода одного этапа обработки (задания) передается на вход следующего.

Рабочий процесс в KNIME состоит из узлов и направленных ребер, образующих направленный ациклический граф (DAG) [4]. В нем отсутствуют направленные циклы, но могут быть параллельные пути, выходящие из одного узла, и разными путями приходящие в конечный узел. Каждый узел является процессором обработки данных с одним или несколькими входными и/или выходными портами. Возможно использование портов трех типов: плоские таблицы данных, модели данных и базы данных. Тип обработки варьируется от базовых операций с данными – вычисление среднего, регрессионный анализ и другие методы статической обработки или машинного обучения, до создания отчетов и моделирования данных с интенсивными вычислениями. Все категории доступных узлов перечислены в репозитории узлов. Вдоль направленных ребер данные или модели передаются из выходного порта во входной порт другого узла.

Для представления научного исследования в виде рабочего процесса вычислительной системы можно ввести понятие жизненного цикла по аналогии с информационной технологией обработки данных [5], где каждая фаза (этап обработки) имеет независимый цикл и производит явные метаданные.

Жизненный цикл исследования начинается с определения протокола эксперимента. На этом этапе ученые формулируют гипотезу, планируют эксперимент, определяют необходимые ресурсы и данные. В рабочем процессе KNIME его можно представить, как выбор источника данных, например, данные будут сгруппированы в таблицу, столбцы которой – параметры эксперимента, каждая строка – одно наблюдение (Table Reader на рис. 1).

На втором этапе происходит само экспериментальное исследование, когда исследователь выполняет экземпляры конкретных рабочих процессов в соответствии со своими потребностями, используя реальные параметры и наборы данных в производственной среде или полевых условиях.

111

Рис. Типовой рабочий процесс научного исследования

Естественно, аналитическая платформа не будет сама проводить эксперимент, но сможет проводить мониторинг получаемых данных в соответствии с заданным фильтром (Column Filter). Такой фильтр может быть настроен на удаление выбросов, поиск повторяющихся значений и другие методы «очистки» данных. Второй фильтр (Row Filter) на схеме предназначен для поиска и/или заполнения пропущенных параметров каждого наблюдения, что требуется в статическом анализе.

На этапе анализа могут быть использованы методы машинного обучения, такие как Нейронные сети, Деревья решений, Метод опорный векторов, Баессовская сеть, Генетические алгоритмы, а также средства интеллектуального анализа данных. Также для удобства исследователя включены средства визуальной аналитики (два вида Chart на рис. 1). Запрос результатов и их актуализации облегчает понимание эксперимента, а также позволяет увидеть новые и интересные гипотезы и факты, поэтому он был вынесен в отдельный этап типового процесса.

Таким образом, предложенная схема проведения научного исследования в системе KNIME обеспечивает молодого исследования требованиями к проведению эксперимента, показывает возможности включения разнообразных методов анализа данных для получения новых научных знаний и актуализирует полученные результаты в наглядной форме.

Литература

1.Vicario G., Coleman S. A review of data science in business and industry and a future view //Applied Stochastic Models in Business and Industry. – 2019.

2.Коноплёв С. В. Выбор программных инструментов анализа данных для студенческого научного исследования // Информационные технологии в строительных, социальных и экономических системах, 2019. – С 157-161.

3.Meinl T., Jagla B., Berthold M. R. Integrated data analysis with KNIME //Open Source Software in Life Science Research. – Woodhead Publishing, 2012. – С. 151-171.

112

4.Goble C., Missier P., De Roure D. Scientific workflows. – 2008.

5.Львович И. Я., Минакова О. В., Ситникова В. П. Информационная технология интеллектуализации процесса диагностики физического развития детей// Вестник Воронежского института высоких технологий. – 2008. – № 3. –

С. 112-115.

Воронежский государственный технический университет

УДК 378.147

О. В. Минакова, О. В. Курипта

ОРГАНИЗАЦИЯ ИНФОРМАЦИОННО-ОБРАЗОВАТЕЛЬНОЙ СРЕДЫ ВУЗА НА ОСНОВЕ МИКРОСЕРВИСОВ

Постоянное развитие информационно-образовательной среды (ИОС) ВУЗа закреплено в требованиях Федерального закона №273-ФЗ «Об образовании в Российской Федерации», а в условиях реализации Федеральных государственных образовательных стандартах высшего образования нового поколения (ФГОС ВО) отдельно указаны требования к электронной информационно-образовательной среде [1].

В настоящее время во многих ВУЗах развернут информационный портал, включающий типовые компоненты учебного заведения: электронная библиотека, электронный отдел кадров, приемная комиссия, электронный деканат, подсистема контроля знаний, подсистема интерактивного взаимодействия, подсистема авторизации, а также информационно-справочная система по всем направлениям деятельности – образовательная, научная, воспитательная и прочие, включая текущие события и новости.

Этот принцип построения ИОС базируется на предоставлении пользователям продукта – образовательной услуги, как в широком смысле – получение профессиональных компетенций, так и в узком – знакомство с научной статьей, инновационной разработкой и другими достижениями [2].

Личностно-ориентированная образовательная парадигма [3] определяет систему образования как совокупность условий для развития человека, что переводит образовательные системы от механизмов передачи обучающемуся суммы знаний, умений, навыков в сторону комплексного развития обеспечивает соответствие интересов развития общества и индивида. Сегодня ИОС – «стратегическая модель образовательного процесса образовательной организации, которая реализуется через систему средств коммуникации коллективных и индивидуальных субъектов, и систему средств фиксации, хранения и трансляции учебного материала и взаимодействия с ним» [4]. Кроме того, «цифровая образовательная среда» как вариант социального пространства должна учитывать социальные механизмы – конкуренцию, кооперацию,

113

взаимообучение и взаимооценивание: «лишь в режиме совместной деятельности можно преодолеть отчуждение, научиться вести конструктивную дискуссию, реагировать на критику, устанавливать и поддерживать общение» [5].

Обучающиеся, начиная действовать в информационно-образовательной среде, видоизменяют ее, подстраивают под собственные потребности, одновременно сами интегрируются в нее. Обучение в ИОС требует от учащихся умения самостоятельно организовать работу с ее ресурсами, т.е. находить, перерабатывать, использовать и создавать информацию, ориентироваться в информационном пространстве. Это требует изменения концепции построения всей ИТ-инфраструктуры ВУЗа, предоставляющей образовательную услугу к среде, которая “структурируется”, “культивируется” субъектами и динамической сетью их взаимодействий [4].

Наиболее отвечает этим задачам микросервисная архитектура информационных систем, которая представляет набор микросервисов из которых можно в любом сочетании построить систему, ориентированную на конкретную цель.

Модель микросервисов имеет разную трактовку. В широком смысле, это разновидность сервис-ориентированной архитектуры программного обеспечения, в которой приложения на стороне сервера строятся путем объединения множества однозадачных, минимальных сетевых сервисов. Более точно – это архитектура приложения, полностью состоящего из множества взаимодействующих через внутренний интерфейс компонентов. Полностью независимые микросервисные компоненты обеспечивают абсолютно автономное функционирование, что в результате обеспечивают максимальную гибкость и масштабируемость, упрощение тестирования, эффективную функциональную композицию, изоляцию окружения и возможность полностью автономной разработки. Именно автономность позволит каждому студенту строить свою собственную, удобную и целенаправленную среду. Огромным плюсом такого подхода является и то, что отдельные сервисы могут быть разработаны самостоятельно – для себя, коллег и для новых возникших потребностей, что делает ИОС адаптируемой под каждого студента и станет, действительно, средой для получения и развития общекультурных и профессиональных компетенций.

Идеальный микросервис должен полностью изолировать свои данные от внешнего мира и предоставлять их только с помощью API (интерфейс программных приложений). Такой интерфейс пользователя обеспечивает доступ к функциям информационной системы, но в роли пользователя выступает другое приложение. API – это средство для распределения ключевого функционала в таком виде, чтобы им могли пользоваться потребители сервисов, чья задача – создавать важные механизмы взаимодействия с пользователем на самых разных аппаратных платформах [6].

114

По сути API – это промежуточный слой, через который взаимодействуют внутренние сервисы и внешние потребители сервисов.

Создание общедоступных API к ИС Университета позволит посетителям заходить в систему из браузера, преподавателям и обслуживающему персоналу

– из приложений для ПК, а обучающимся использовать мобильные приложения со смартфонов и планшетов.

Типичная микросервисная архитектура представлена на рисунке. В ее состав входят Поставщики удостоверений, API-шлюз и сами Микросервисы.

Поставщики удостоверений (Identity Providers) аутентифицируют запросы клиентов и передают запросы в API Gateway.

 

Поставщик

сервис

 

 

 

удостверени

сервис

 

й

 

 

клиенты

 

сервис

 

 

 

 

Управление

 

 

API-

 

 

шлюз

 

 

Доставка

CDN Статический контент

Рис. Микросервисная архитектура информационных систем

API-шлюз выступает в качестве точки входа для клиентов для пересылки запросов соответствующим микросервисам. Необходимость использования API-шлюза обусловлена необходимостью автономного обновления услуг, а также позволяет использовать различные протоколы обмена сообщениями и выполнять такие служебные функции, как обеспечение безопасности, балансировка нагрузки и т. д.

Каждый микросервис предназначен для обслуживания конкретных запросов и имеет собственную базу данных для реализации соответствующих бизнес-функций. Кроме того, базы данных микросервисов обновляются только через сервис API. Услуги, предоставляемые микросервисами, передаются на любую удаленную службу, которая поддерживает межпроцессное взаимодействие для различных технологических стеков.

115

После того как микросервисы обменяются данными внутри себя, они развертывают статический контент в облачной службе хранения, которая может доставлять их напрямую клиентам через сети доставки контента (CDN). Помимо вышеупомянутых компонентов, в типичной архитектуре микросервисов обычно присутствуют управляющий компонент (Management), который отвечает за балансирование сервисов на узлах и выявление сбоев, и сервис доставки (Service Discovery), необходимый для поиска маршрут связи между ними и содержащий список служб, на которых расположены узлы.

Если ИОС строится с нуля, то ее следует разрабатывать в соответствии с принципами микросервисной архитектуры. Но поскольку в ВУЗе уже работает портал то имеет смысл обеспечить доступ через API к имеющимся функциям и сформулировать принципы построения новых.

В этой связи возникают две актуальные задачи:

выделение имеющегося функционала в отдельный сервис, путем разработки API и создания его описания;

выявление потребностей заинтересованных лиц и создание новых сервисов.

Предложенный подход к организации информационной системе ВУЗа позволит создать для каждого студента уникальную личностно ориентированную среду для получения и развития общекультурных и профессиональных компетенций. Общедоступность API позволит студентам ИТ-специальностей разрабатывать собственные мобильные приложения для управления информацией, предоставляемой университетом, а всем остальным обучающимся найти удобные, полезные и интересные ему сервисы, чтобы построить индивидуальную образовательную траекторию или просто быть частью цифрового университетского сообщества.

Литература

1.Приказ Министерства образования и науки РФ от 19 сентября 2017 г. N 926 "Об утверждении федерального государственного образовательного стандарта высшего образования - бакалавриат по направлению подготовки 09.03.02 Информационные системы и технологии".

2.Цуканова Е. В. Нормативные требования к созданию электроннообразовательной среды вуза // «СОВРЕМЕННЫЕ ОБРАЗОВАТЕЛЬНЫЕ ТЕХНОЛОГИИ В МИРОВОМ УЧЕБНО-ВОСПИТАТЕЛЬНОМ ПРОСТРАНСТВЕ» 2016, №9.

3.Саникович В. В. Принципы проектирования информационнообразовательной среды учреждений профессионального образования / В. В. Саникович // Инновационные образовательные технологии. — 2014. — № 2

(38). — С. 13—17.

116

4.Осмоловская И. М., Шалыгина И. В., Шабалин Ю. Е. Информационнообразовательная среда как стратегическая модель образовательного процесса //Совет ректоров. – 2016. – №. 5. – С. 65-75.

5.Иванцова Н. А., Гуров В. Н. Информационно-образовательная среда современной инновационной школы в контексте повышения качества образования //Современные проблемы науки и образования. – 2015. – №. 2-3. –

С. 294-294.

6.Pautasso C. et al. Microservices in practice, part 1: Reality check and service design //IEEE Software. – 2017. – №. 1. – С. 91-98.

Воронежский государственный технический университет

УДК 681.3

Е. И. Новикова, Е. Н. Коровин, Е. В. Кондаурова

РАЗРАБОТКА ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ ДЛЯ ДИАГНОСТИРОВАНИЯ ЗАБОЛЕВАНИЙ ЩИТОВИДНОЙ ЖЕЛЕЗЫ

В настоящее время для выявления и диагностики многих сложных проблем в медицине требуются дорогостоящие и длительные методы. Это связано с тем, что медицинские знания по симптоматике, а также диагноз и оценка экспертов являются источниками неопределенности. Многие методы математического анализа и моделирования, а также вычислительного интеллекта внесли свой вклад в диагностику заболеваний и терапевтические методы лечения.

Перспективным направлением развития средств диагностирования заболеваний щитовидной железы – является применение искусственных нейронных сетей (ИНС). Главное отличие и преимущество нейронных сетей от других систем для обработки и анализа данных – способность к обучению на примерах и исправлению ошибок в случае необходимости.

Результатом построения таких нейросетей служат математические модели нейронов, которые позволяют с некоторой степенью точности определять наличие заболевания у пациента.

Вследствие этого, разработана и построена ИНС, позволяющая диагностировать одну из болезней: гипотиреоз, подострый тиреоидит, тиреотоксикоз.

На начальном этапе, был произведен анализ данных эндокринных заболеваний, после чего сформирована матрица исходных классификационных признаков, включающая 80 пациентов и имеющая 49 входных вектора (признаков заболеваний).

117

Построен ансамбль из 21 нейросети на основе имеющейся выборки. Она была разбита на 3 группы:

1)обучающая группа – 63 пациента,

2)контрольная группа - 9 случаев,

3)тестовая группа – 8 случаев.

Обучение сетей осуществлялось с использованием синаптической линейной функции на входном слое, гиперболической функцией на первом и втором скрытых слоях и логистической функцией на выходном слое.

Из 21 полученной нейросети была выбрана сеть с наибольшей достоверностью и оптимальным количеством оставленных признаков: достоверность обучения ИНС в тестовой группе – 100 %, в контрольной группе 1 пациенту поставлен неверный диагноз, из-за чего достоверность классификации составила 88,89 %. Таким образом, общая достоверность НС составила 94,12 %. Архитектура сети, представляющая собой четырехслойный персептрон, показана на рисунке. Сеть состоит из 49 входов (X1, X2, … , X49), и 4 выходов, соответствующим классам заболевания, и двух скрытых слоев, состоящих из 15 нейронов в каждом.

Рис. Структура четырехслойного персептрона

X1, …, X49 – нейроны входного слоя; ǡǥǡ – нейроны первого скрытого слоя;

ǡǥǡ – нейроны первого скрытого слоя; Y1, Y2, Y3, Y4 – выходные нейроны.

Математическая модель сети для диагностики заболеваний щитовидной железы имеет вид:

Нейроны первого скрытого слоя:

118

Ǥʹ ͻכ Ǥ ͺͻכ Ǥכ ڮ Ǥʹʹכ Ǥ ʹ

Ǥ ʹכ Ǥכ Ǥ ʹͺכ ڮ Ǥכ Ǥ

Нейроны второго скрытого слоя:

Ǥʹכ Ǥ ͻ͵כ Ǥכ ڮǤ ʹכ Ǥͻ

Ǥכ Ǥʹͺכ Ǥ ͻכ ڮǤ͵ ͺכ Ǥ ͵ͻ.

Нейроны выходного слоя:

Ǥͺכ Ǥʹכ Ǥכ ڮǤ ͵ͻכ Ǥ ʹǤͻͻכ Ǥ ͻ͵כ Ǥ ͺכ ڮ ͵Ǥ͵͵ʹכ ʹǤʹ ͻǤכ Ǥ ͻכ Ǥכ ڮǤ ͺͻכ ǤǤ ʹכ Ǥʹ ʹכ Ǥ ͻכ ڮǤʹ ʹכ Ǥ ͻ

Таким образом, при помощи построенной математической модели данной нейросети можно поставить один из диагнозов: гипотиреоз, подострый тиреоидит, тиреотоксикоз, другая патология, с достоверностью 94,12 %.

Литература

1.Новикова Е. И. Моделирование биомедицинских систем / Е. И. Новикова, О. В. Родионов, Е. Н. Коровин // Учебное пособие.; Воронеж: ВГТУ,

2008. – 196 с.

2.Новикова Е. И. Разработка логической модели на основе методов распознавания образов и добычи данных для диагностики внутреннего эндометриоза, миомы матки и опухолей яичников / Новикова Е. И., Родионов О. В. // Вестник Воронежского государственного технического университета. 2008. Т. 4. № 12. С. 108-111.

3.Новикова Е. И. Нейросетевая классификация инфекционных желудочно-кишечных заболеваний / Е. И. Новикова, В. Ю. Калиничев // Системный анализ и управление в биомедицинских системах. – 2016. Т. 15. №

3.С. 448-451.

4.Новикова Е. И. Анализ, алгоритмизация и управление процессом диагностики гинекологических заболеваний на основе многовариантного моделирования / Новикова Е. И. диссертация на соискание ученой степени

119