Доклад 1

Анализнабораданных

Выполнили:

Заболотников М., Петрова С.

Общая информация по данным: источник


Источник:	Департамент		компьютерных
технологий,	Техасский	технологический институт,
Соединённые штаты (Ахмад О. Асеери, Ю Жанг);
Факультет	компьютерных и		информационных
технологий,	Джидский	университет, Саудовская
Аравия (Мохамед Саид Алкатеири).

Общая информация по данным: источник, когда предоставлены и для каких задач могут использоваться

Набор данных генерируется на основе моделирования физических неклонируемых функций (PUFs), в частности PUFS арбитра XOR. PUF используются для целей аутентификации.

Предоставлены данные 8 октября 2018 года.

Могут использоваться для классификации.

Описание целевой задачи анализа данных исходя из данных

Исходя из данных, целевой задачей была выбрана классификация векторов данных, для предсказания того, какой результат выдает PUF функция.

Метаинформация: формат, количество атрибутов и векторов, типы атрибутов, классы и т.п

•Формат: dataset был предоставлен в виде файла csv;

•Количество атрибутов: 65;

•Количество векторов: 400 тыс. и 2 млн.;

•Тип данных: integer;

•Данный dataset уже был разбит на два класса 1 и -1;

•Аномалий/пропущенных данных в наборе не обнаружено.

Система хранения данных и язык программирования

•Системой хранения данных выступает YandexCloud

•Язык программирования – Python

Предлагаемый ML алгоритм для решения целевой задачи

Для решения поставленной задачи классификации был выбран метод MLP. Метод многослойных персептронов показал, что может находить приближённые решения для чрезвычайно сложных задач. В частности, этот метод является универсальным аппроксиматором функций, поэтому с успехом используется в построении регрессионных моделей. Поскольку классификацию можно рассматривать как частный случай регрессии, когда выходная переменная категориальная, на основе MLP можно строить классификаторы.

Необходимые настройки данных для каждого алгоритма

Для выполнения алгоритма необходимо входные результаты преобразовать из -1 и 1 в 0 и 1.

Ожидаемые модели знаний, построенные алгоритмами

В результате работы алгоритма планируется обучить сеть «предсказывать» результат, выдаваемый XOR PUF. Или, условно, проверить насколько устойчивы такие PUF ко взлому при помощи MLP метода.

Спасибо за внимание

Соседние файлы в предмете Большие данные

#
20.06.202363.68 Кб2Петрова_Заболотников_БД_Д1_9373.pptx
#
20.06.20232.1 Mб4Петрова_Заболотников_БД_Д2_9373.pptx