Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Активне ОПК з використанням моделі інтелектуаль....docx
Скачиваний:
0
Добавлен:
19.07.2019
Размер:
54.65 Кб
Скачать

II. Поэднання роботи

Оптимальне планування траєкторії для автономних роботів давно вивчені. Розенблатт [6], розробив реактивну навігаційну систему для об`єднання декількох намірів. Кожна мета вивчає поведінку, і їх завдання полягає у зваженні набору дискретних рухів контролю на основі очікуваної корисності. Користь з кожної поведінки також зважені центральним арбітром в залежності від поточної місії системи. Варінт контролю з найвищою очікуваною користю виконується. Ця технологія реалізована для простих реактивних поведінок.

Frew [2], використовує відступаючу стратегію тимчасового горизонту (схожу на МІУ) для оптимального планування та управління БПЛА. Це вимагає обмежених обчислювальних ресурсів і пропонує явний механізм для реагування на динамічні середовища з перешкодами. Вони виконують геолокацію, включаючи динамічні обмеження, хоча ОПК і охоплення не розглядаються.

Кілька робіт були присвячені проблемі ОППК. В

[11], Stachniss проводиться межа заснована розвідку з

SLAM????. За допомогою двох карт, розміщення сітки і топологічні, За допомогою двох карт, розміщення сітки і топологічної, активний цикл закриття був виконаний. Тим не менш, максимізація приросту інформації по шляху не розглядався.

Федер [1], вирішує проблеми активного ОПК. Жадібний

підхід був застосований там, де дія вибирається з урахуванням сучасних знань, щоб максимізувати приріст інформації в наступному вимірюванні. Тут слід зазначити, що планування з довшим горизонтом може поліпшити результати.

Макаренко [5], розглядав локалізування протягом дослідження процесу ОПК як одну з форм корисності. Локалізування і потенційний приріст інформації були розглянуті в пункті призначення. Вони можуть бути поліпшені шляхом розгляду цих чинників через кожний крок.

Сім, виконав велику роботу по активному ОПК. В роботі [8], охоплення було натхненне властивостями випадково розміщенних макетів в нерозвіданих областях. Граф Воронний використовував для планування шляху; з припущеннями об’єднання досконалих даних та необмежених чуттєвостей поля зору. Тим не менш, ця стратегія не є ефективною для систем з коротким плануванням горизонтів і обмеженою чуттєвістю, як макет властивостей,які не будуть впливати на рішення робота, якщо їх не видно без планування горизонту .

У [10], Сім ввів активне ОПК з підходом,який заснований на сітці і показав, що оптимізація з використанням залишків ковариаціонної матриці від РФК працює краще, ніж при використанні визначника. Однак передбачається, що робот квазі голономний з необмеженою чуттєвістю і обмеження руху робота не розглядаються в процесі планування. В роботі [9], Сім адресується на проблему стабільності. Особливості, які дуже близькі до робота, які можуть привести до нестабільності фільтру блокуються використанням датчика віртуального діапазону мінімуму.

III. Оптимальне планування траєкторії

Мета цієї статті полягає в плануванні траєкторій, щоб автономний робот міг виконувати ОПК, для повного покриття недослідженої області даного обмеження.Мета Робота максимізувати точність побудованої карту в межах встановленого термінального часу. Це досягається в два етапи: I) максимізація покриття, зберігаючи при цьому карту на певному рівні точності, II), як тільки середовище буде повністю покрите, тоді мінімізувати невизначеність карти.

Оптимальна стратегія планування траєкторії представлена в цій роботі, МІУ реалізована для проведення планування, оскільки ця стратегія довела хороші результати [3] [7], особливо в задачах таких як: обхід перешкод, розгляд контролю обмеження, визначення найбільш інформативних шляхів, заснованих на сенсорних моделях і місцевих знаннях про стан системи.

МІУ в основному є місцевою стратегією планування, інформація за межами горизонту планування, як правило, ігноруються, що видно на Мал. 2 (г). Тут робот даний на області 400м2 для вивчення використання РФК-ОПК і МІУ. Властивості виявлені роботом добре локалізовані за рахунок оптимізації карти навіть після 3000 кроків 6 особливостей залишаються непоміченими. Методи подолання цього обмеження, такі як розширення горизонту планування може дозволити роботу бачити довгострокові відзнаки, але це обчислювально дорого і питання дослідження залишається невирішеним. Зважування функціональної мети може забезпечити стимули для розвідки і довгострокові відплати, однак важко висловити значення довгострокових відплат в горизонтах короткого планування і налаштування ваг є важкими.

Пропонується новий метод використання аттрактора для полегшення МІУ в процесі планування. З аттрактором, робот здатний виконувати вибори цілей, засновані на поточному стані системи і визначати зразки для переходу цілей. Вона також дозволяє глобальній інформації, такій як напрям точок або особливості інтересів, бути включеною. Ця стратегія застосовується для активного ОПК з використанням РФК. Зверніть увагу, що система описується при цьому як дискретна модель часу, де дії і спостереження проводяться на кожному часовому кроці k.

А. Модель процесу

Рухи автономного робота, що проводить активне ОПК моделюється за допомогою

xr (k +1) = f (xr(k), u(k), dx), (1)

де F - нелінійна функція, що залежить від динамічної моделі робота, xr - поза робота, u(k)- керуючий вхід в момент часу u(k), і вважається постійними від k до k+1 , dx - середній нульовий шум процесу Гауса з коваріацією Σ.

В. Спостереження

На кожному кроці k, робот проводить спостереження. Нехай J(k+1) позначимо набір індексів функцій, які робот може відчути за час k+1,

J(k+1) = {j1, … ,jq }, (2)

де ціле число q залежить від пози робота у час k + 1, діапазон чуттєвості і особливості розподілу в середовищі. Особливості q можуть містити обидві раніше розглянуті та нові властивості.

Модель спостереження робота у час k + 1

z (k+1)=[zj1(k+1), … , zjq(k+1)] (3)

де для кожної властивості j∈ J(k +1),

zj(k+1)=h(xr(k+1),xfj)+dz , (4)

де xfj позначає стан властивості j, h нелінійна функція, що залежить від моделі сенсора, dz середній нульовий шум процесу Гауса з коваріацією матриці R.

С. Еволюція інформації

У час k +1, поєднання прогнозування та модернізація РФК можна резюмувати:

x̂(k+1) = F̂(x̂(k), P(k), u(k), J(k+1), z(k+1))

P(k+1) = Ĝ(x̂(k), P(k), u(k), J(k+1)) , (5)

де х позначає оцінку вектора стану (х , що містить позицію робота і особливості відсотків), P є асоційована коваріаційна матриця. Функції F̂ і Ĝ визначаються процесом та моделями спостереження і прогнозування та оновленими формулами у РФК(подробиці у [4]розділі).

IV. Модель Інтелектуального Управління

А. Поступово виявлені моделі

Оптимізація збору інформації вимагає знання моделі сенсора, поточного стану світу і як він змінюється. Функції в цій системі мають бути стаціонарним. Однак в активному ОПК, стан світу невідомий. Відомості світу збираються шляхом проводження спостережень. Вектор стану, що містить функції поступово зростає,так як і нові можливості виявляються. Як тільки подальші спостереження будуть взяті, оціночне місцеположення функцій також стає все більш точним.

B. Багатоступінчате Прогнозування

МІУ застосовується як ця поступово ідентифікована система. Принцип МІУ – «дивитися вперед на кілька кроків, але виконувати тільки один крок ". Планування рекурсивно обчислюється на кожному кроці k, так що найбільш недавньо- оцінена модель може бути включена в планування, даючи постійний зворотній зв'язок з навколишнього середовища.

У стратегії МІУ, в кожен момент часу k, проблема оптимального керування з фіксованим горизонтом планування Кроків N вирішена і послідовність дій N

u(k), u(k+1), …, u(k+N-1) (6)

обчислюється і застосовується u(k) з тільки одною контрольною дією.

Під час кожного кроку N процесу планування, зроблені два припущення: а) Немає ніяких нових властивостей, і б) інновації дорівнюють нулю. Це необхідно тому, що оцінка стану x̂ залежить від спостереження z, як показано у (5) виразі. Через припущення можна прогнозувати декілька кроків вперед таким чином, щоб обчислити розсудливий план швидко. Подробиці і обгрунтування цих припущень можна знайти в нашій попередній роботі [3] [4].

С. Дійсна функція

В задачі оптимального управління кроків N в момент часу k, мета полягає в максимізації приросту інформації від часу k до часу k+N.

У РФК невелика коваріаційна матриця прирівнюється до великої кількості інформації. Звідси завдання оптимального контролю кроків N полягає у мінімізації особливої кількісної міри коваріаційної матриці P(k+N). У даній роботі вибрана ціль, вважається ефективною за [10], зведення до мінімуму

trace(P(k+N) (7)

Д. Техніка пошуку

Пошук оптимального варіанту управління кроків N виконується за допомогою вичерпного пошуку дерева розширення (ВПДР). У принципі, приріст інформації набору допустимих функціональних можливостей оцінюються для N кроків. Кращі функціональні можливості вибираються згідно з метою. Наступні деталі можна знайти в нашій попередній роботі [4].

Є. Динамічні обмеження та обмеження на управління

Обмеження системи включають в себе як обмеження на управління так і обмеження стану. Як і в техніці діапазону стробування, яка використовувалася Сімом [9], межа безпеки накладається навколо функцій так, щоб робот не отримував спостережень, які занадто близькі і можуть викликати нестабільність в оновленні РФК.

Обмеження фізичного руху вводяться у ВПДР тільки для вибору з набору дискретних варіантів контролю в межах діапазону допустимих рухів (тобто протягом максимальної швидкості повороту та швидкісті).Обмеження заборонених зон забезпечуються в процесі планування шляхом видалення гілки з ВПДР,що порушують їх.

Нові обмеження, такі як поява нової функції, можуть бути легко включені в наступний етап планування.