Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекція6.doc
Скачиваний:
12
Добавлен:
02.05.2019
Размер:
218.11 Кб
Скачать

5. Задача візуалізації

Візуалізація це інструментарій, що дозволяє побачити кінцевий результат обчислень, організувати керування обчислювальним процесом і навіть повернутися назад до вихідних даних, щоб визначити найбільш раціональний напрямок подальшого руху [25].

Із задач візуалізації можна докладно ознайомитися за матеріалами конференцій, серед яких, наприклад, CHI і ACM-SIGGraph, а також у періодичній літературі, зокрема, за матеріалами журналу "IEEE Trans. visualization and computer graphics".

У результаті використання візуалізації створюється графічний образ даних. Застосування візуалізації допомагає в процесі аналізу даних побачити аномалії, структури, тренди. При розгляді задач прогнозування ми використали графічне подання тимчасового ряду і побачили, що в ньому є присутній сезонний компонент. У попередній лекції ми розглядали задачу класифікації і кластеризації, і для ілюстрації розподілу об'єктів у двомірному просторі також використали візуалізацію.

Можна говорити про те, що застосування візуалізації є більше економічним: лінія тренда або скупчення крапок на діаграмі розсіювання дозволяє аналітикові набагато швидше визначити закономірності і прийти до потрібного рішення. Таким чином, тут мова йде про використання в Data Mining не символів, а образів.

Головна перевага візуалізації – практично повна відсутність необхідності в спеціальній підготовці користувача. За допомогою візуалізації ознайомитися з інформацією дуже легко, досить усього лише кинути на неї погляд.

Хоча найпростіші види візуалізації з'явилися досить давно, її використання зараз тільки набирає силу. Візуалізації не спрямована винятково на вдосконалювання техніки аналізу – за словами Скотта Лейбса, у деяких випадках візуалізація може навіть замінити його.

Візуалізації даних може бути представлена у вигляді: графіків, схем, гістограм, діаграм і т.д.

Коротко роль візуалізації можна описати такими її можливостями:

  • підтримка інтерактивного і погодженого дослідження;

  • допомога в представленні результатів;

  • використання очей (зору), щоб створювати зорові образи і осмислювати їх.

Погана візуалізація

Результати візуалізації іноді можуть приводити користувача в оману. Приведемо простий приклад поганої візуалізації. Припустимо, ми маємо базу "Прибуток компанії А" за період з 2003 по 2008 рік, вона представлена в табличному виді в таблиці 6.1.

Таблиця 6.1. Прибуток компанії А

Рік

Прибуток

2003

1100

2004

1101

2005

1104

2006

1105

2007

1106

2008

1107

Побудуємо гістограму в Excel за цим даними.

Гістограма являє собою візуальне зображення розподілу даних.

Ця інформація відображається за допомогою серії прямокутників або смуг однакової ширини, висота яких вказує кількість даних у кожному класі.

Використовуючи всі значення побудови графіка, прийняті за замовчуванням, одержуємо гістограму, наведену на мал. 6.4.

Рис. 6.4. Гістограма, мінімальне значення осі y дорівнює 1096

Даний малюнок демонструє значне зростання прибутку компанії А за період з 2003 по 2008 рік. Однак, якщо ми звернемо увагу на вісь y, що показує величину прибутку, то побачимо, що ця вісь перетинає вісь x у значенні, рівному 1096. Фактично, вісь y зі значеннями від 1096 до 1108 вводить користувача в оману. Змінивши значення параметрів, відповідальних за формат осі y, одержуємо графік, наведений на рис. 6.5.

Рис. 6.5. Гістограма, мінімальне значення осі y дорівнює 0

Вісь у зі значеннями від 0 до 2000 дає користувачеві правильну інформацію про незначну зміну прибутку компанії.

Якщо мова йде про велику розмірність і складність вихідних даних, засоби візуалізації забезпечують їх різке зменшення, конденсуючи, мільйони записів даних у прості, легкі для розуміння і маніпулювання подання [26]. Такі подання називають візуальним або графічним способом подання інформації. Візуалізацію можна вважати ключовим фактором у дослідженні даних, отриманих за допомогою інструментів Data Mining. У таких випадках говорять про візуальний Data Mining.

Методи візуалізації, серед яких подання інформації в одно-, дво-, тривимірному і більше вимірах, а також інші способи відображення інформації, наприклад, паралельні координати, "лице Чернова", будуть розглянуті в наступному розділі курсу.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]