Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Вопросы для подготовки к зачету по дисциплине.doc
Скачиваний:
12
Добавлен:
24.12.2018
Размер:
130.56 Кб
Скачать

Вопросы для подготовки к зачету по дисциплине «Информационные технологии в статистике»

  1. Что такое операционная обработка информации?

  2. Приведите примеры систем операционной обработки информации.

  3. Что такое системы поддержки принятия решений?

  4. Почему нельзя эффективно проводить анализ в системах операционной обработки информации?

  5. Перечислите технологии, ориентированные на аналитическую обработку информации.

Хранилища данных

Контрольные вопросы:

  1. В чем состоит концепция хранилища данных?

  2. Как определяется хранилище данных?

  3. Что такое предметная ориентированность хранилища данных?

  4. Что такое интегрированность хранилища данных?

  5. Что такое привязка ко времени данных в хранилище?

  6. В чем отличие характеристик типичных систем операционной обработки и хранилищ данных.

Контрольные вопросы:

  1. Из каких источников поступают данные в хранилище?

  2. Что такое Менеджер загрузки данных в хранилище и какие у него функции?

  3. Что такое Менеджер хранилища и какие у него его функции?

  4. Для чего нужна очистка данных?

  5. Какие этапы очистки данных?

  6. В чем отличие детальных данных от частично и глубоко обобщенных данных?

  7. Какие существуют средства доступа к данным хранилища для конечного пользователя?

  8. Как классифицируются средства доступа к данным хранилища с точки зрения возможностей анализа?

Контрольные вопросы:

  1. Перечислите проблемы создания хранилищ данных.

  2. В чем состоят скрытые проблемы источников данных? Скрытые проблемы, связанные с источниками данных, поставляющими информа­цию в хранилище, могут быть обнаружены только после начала их эксплуатации. При этом разработчику придется принять решение об устранении возникших проблем в хранилище данных и/или в источниках данных.

  1. Что такое гомогенизация данных? Приведите примеры из близкой для Вас прикладной области.

Создание крупномасштабного хранилища данных может быть связано с решением серьезной задачи гомогенизации данных, что в итоге способно уменьшить ценность соб­ранной информации. Например, таможенная и продажная стоимость товара могут существенно отличаться. Внесение одного поля стоимости товара в хранилище данных не даст далее возможности анализировать те или иные аспекты деятельности.

  1. В чем состоит проблема владения данных? потребуется сделать доступными и другим сотрудникам организации.

  2. Что такое витрина данных? подмножество хранилища данных, которое поддерживает требования отдельного подразделения или деловой сферы организации.

Контрольные вопросы:

  1. Перечислите требования к СУБД для хранилища данных. Высокая производительность загрузки данных, Возможность обработки данных во время загрузки, Наличие средств управления качеством данных, Высокая производительность запросов, Широкая масштабируемость по размеру (до терабайт), Масштабируемость по количеству пользователей, Возможность организации сети хранилищ данных, Наличие развитых средств администрирования хранилища, Расширенный набор средств запросов, Широкий набор функциональных средств доступа и анализа данных

  1. Что такое набор данных, объекты, атрибуты, переменная, значение? Набор данных - По горизонтали таблицы располагаются атрибуты объекта или его признаки. По вертикали таблицы - объекты. Объект описывается как набор атрибутов. Объект также известен как запись, случай, пример, строка таблицы и т.д. Атрибут - свойство, характеризующее объект. Переменная - свойство или характеристика, общая для всех изучаемых объектов, проявление которой может изменяться от объекта к объекту. Значение переменной является проявлением признака.

  2. Что такое генеральная совокупность, параметры, выборка, статистики? Генеральная совокупность - вся совокупность изучаемых объектов, интересующая исследователя. Выборка - часть генеральной совокупности, определенным способом отобранная с целью исследования и получения выводов о свойствах и характеристиках генеральной совокупности. Параметры - числовые характеристики генеральной совокупности. Статистики - числовые характеристики выборки.

  3. Что такое гипотеза, зависимая переменная, независимые переменные? Приведите примеры. Гипотеза - частично обоснованная закономерность знаний, служащая либо для связи между различными эмпирическими фактами, либо для объяснения факта или группы фактов. Пример гипотезы: между показателями продолжительности жизни и качеством питания есть связь. В этом случае целью исследования может быть объяснение изменений конкретной переменной, в данном случае - продолжительности жизни. Допустим, существует гипотеза, что зависимая переменная (продолжительность жизни) изменяется в зависимости от некоторых причин (качество питания, образ жизни, место проживания и т.д.), которые и являются независимыми переменными.

  1. Что такое непрерывные данные и дискретные данные? Приведите примеры. Дискретные данные являются значениями признака, общее число которых конечно либо бесконечно, но может быть подсчитано при помощи натуральных чисел от одного до бесконечности. Пример дискретных данных. Продолжительность маршрута троллейбуса (количество вариантов продолжительности конечно): 10, 15, 25 мин. Непрерывные данные - данные, значения которых могут принимать какое угодно значение в некотором интервале. Измерение непрерывных данных предполагает большую точность. Пример непрерывных данных: температура, высота, вес, длина и т.д.

  2. Какие бывают шкалы измерений? номинальная, порядковая, интервальная, относительная и дихотомическая.

  3. Что такое Номинальная шкала? Какие возможны операции? Приведите примеры. Номинальная шкала - шкала, содержащая только категории; данные в ней не могут упорядочиваться, с ними не могут быть произведены никакие арифметические действия. Пример такой шкалы: профессии, город проживания, семейное положение. Для этой шкалы применимы только такие операции: равно (=), не равно ().

  4. Что такое Порядковая шкала? Какие возможны операции? Приведите примеры.

Порядковая шкала - шкала, в которой числа присваивают объектам для обозначения относительной позиции объектов, но не величины различий между ними. Пример такой шкалы: место (1, 2, 3-е), которое команда получила на соревнованиях, номер студента в рейтинге успеваемости (1-й, 23-й, и т.д.), при этом неизвестно, насколько один студент успешней другого, известен лишь его номер в рейтинге. Для этой шкалы применимы только такие операции: равно (=), не равно (), больше (>), меньше (<).

  1. Что такое Относительная шкала? Какие возможны операции? Приведите примеры. Относительная шкала - шкала, в которой есть определенная точка отсчета и возможны отношения между значениями шкалы. Пример такой шкалы: вес новорожденного ребенка (4 кг и 3 кг). Первый в 1,33 раза тяжелее. Для этой шкалы применимы только такие операции: равно (=), не равно (), больше (>), меньше (<), операции сложения (+) и вычитания (-), умножения (*) и деления (/).

  2. Что такое Интервальная шкала? Какие возможны операции? Приведите примеры. Интервальная шкала - шкала, разности между значениями которой могут быть вычислены, однако их отношения не имеют смысла. Пример такой шкалы: температура воды в море утром - 19 градусов, вечером - 24, т.е. вечерняя на 5 градусов выше, но нельзя сказать, что она в 1,26 раз выше. Для этой шкалы применимы только такие операции: равно (=), не равно (), больше (>), меньше (<), операции сложения (+) и вычитания (-).

  3. Что такое Дихотомическая шкала? Какие возможны операции? Приведите примеры. Дихотомическая шкала - шкала, содержащая только две категории. Пример такой шкалы: пол (мужской и женский). Операции: присваивать типа да, нет - 1,0.

  4. Что такое транзакционные данные? представляют собой особый тип данных, где каждая запись, являющаяся транзакцией, включает набор значений.

  5. В чем отличие моделирования времени в хранилищах данных и системах операционной обработки данных? В системах операционной обработки используются снимок данных.

  6. Что такое снимок данных? это представление данных в определенный момент времени

  7. Что такое событийная модель? используется для моделирования данных о наступлении событий в определенные моменты времени ( для транзакций).

  8. Что такое статусная модель? используется для моделирования состояния объектов во времени. Она хорошо подходит для представления данных, имеющий нетранзакционный характер

  9. Какие существуют способы моделирования изменяющихся во времени статусов?

Существует три способа моделирования изменяющих ся во времени статусов:

  • непрерывная модель — для хранения промежутков времени используется одно поле даты. Дата начала следующего периода совпадает с датой окончания предыдущего;

  • начало и конец — для хранения промежутков времени используется два поля — дата начала и дата окончания периода действия статуса;

  • начало и длительность — для хранения промежут ков времени используется одно поле даты (дата начала) и поле длительности периода. Большее распространение при создании статусных моделей получил способ "начало и конец

  1. Как статусная и событийная модели могут дополнять друг друга?

  2. Что такое специальные атрибуты времени?

  3. Что такое размерности или измерения? Приведите примеры типичных размерностей.

  4. Что такое иерархическая структура размерностей?

  5. Что такое факты?

  6. Как связаны понятия размерности и факты? Приведите примеры.

  7. Что такое аддитивные, полуаддитивные и неаддитивные факты?

  8. Какие специальные модели данных чаще всего используются в хранилищах?

  9. Что такое схема данных "звезда"?

  10. Что такое схема данных "снежинка"?

  11. Что такое метаданные?

Data Mining

Контрольные вопросы:

  1. Что такое Data Mining? В чем отличие Data Mining от традиционных средств обработки информации?

  2. Приведите примеры приложений Data Mining.

  3. Какие проблемы возникают при использовании Data Mining?

Контрольные вопросы:

  1. Какие задачи или закономерности относятся к Data Mining?

  2. Что такое классификация? Приведите примеры.

  3. Что такое кластеризация? Приведите примеры.

  4. Что такое ассоциация? Приведите примеры.

  5. Что такое последовательность? Приведите примеры.

  6. Что такое анализ связей?

  7. Что такое определение отклонений или выбросов?

  8. Какие основные этапы выделяются при решении задач Data Mining?

  9. Поясните термины набор исходных данных, обучающее множество данных, тестовое множество?

  10. Что такое обучение с учителем?

Контрольные вопросы:

  1. Что такое бинарная классификация?

  2. Что такое многомерная классификация?

  3. Что такое классификация на основе линейной регрессии?

  4. Как строится классификация на основе деревьев решений?

  5. Назовите основные элементы дерева решений.

  6. Что такое бинарное дерево?

  7. Как формулируются условия в узле проверки дерева решений?

  8. Какие достоинства имеет классификация на основе деревьев решений?

  9. Какие стратегии используются при конструировании деревьев решений?

  10. Как различаются алгоритмы построения деревьев решений?

Контрольные вопросы:

  1. Что такое кластеризация?

  2. В чем смысл применения кластерного анализа для временных рядов?

  3. Какие группы задач выделяются в кластерном анализе?

  4. Что является критерием для определения схожести и различия кластеров?

  5. Как вычисляется евклидово расстояния между объектами?

  6. Какие математические характеристики имеет кластер?

  7. Что такое центр кластера?

  8. Что такое радиус кластера?

  9. Что такое размер кластера?

  10. Что такое спорный объект?

  11. Для чего необходимо нормирование исходных данных в кластерном анализе?

  12. Какие существуют способы нормирования исходных данных?

  13. Какие существуют группы методов кластерного анализа?

  14. Что такое иерархическая кластеризация? Когда целесообразнее применять иерархическую кластеризацию?

  15. Что такое агломеративная иерархическая кластеризация?

  16. Что такое дивизимная иерархическая кластеризация?

  17. Что такое итеративная кластеризация? Когда целесообразнее применять итеративную кластеризацию?

  18. Какие преимущества и недостатки методов итеративной кластеризации?

  19. Какие имеются общие проблемы кластерного анализа?

Контрольные вопросы:

  1. Что такое ассоциация?

  2. Приведите примеры бизнес-приложений, для которых могут применяться ассоциативные правила.

  3. Что такое транзакция?

  4. Какая структура транзакционной базы данных?

  5. Основные характеристики ассоциативного правила?

  6. Что такое поддержка правила?

  7. Что такое достоверность правила?

  8. Зачем заранее устанавливать минимальные и максимальные значения поддержки и достоверности?

Контрольные вопросы:

  1. Для чего используются гистограммы?

  2. Что такое гистограммы с двойной осью?

  3. Что такое категоризованные графики?

  4. Что такое матричные графики? Как могут масштабироваться матричные графики?

  5. Что такое диаграммы рассеяния? Как они могут помочь для оценки корреляции?

  6. Что такое категоризованные диаграммы рассеяния?

  7. Что такое диаграмма рассеяния Вороного?

  8. Когда применяются линейные графики и категоризованные линейные графики?

  9. Что такое диаграммы размаха?

  10. Что такое категоризованные круговые диаграммы?

  11. Когда применяются графики пропущенных значений и данных вне диапазона?

  12. Что такое закрашивание?

  13. Для чего применяется послойное сжатие двумерных графиков?

  14. Что такое пиктографики?

Контрольные вопросы:

  1. Назначение системы PolyAnalyst?

  2. Какие модули входят в состав системы PolyAnalyst?

  3. Назначение модуля Core PolyAnalyst?

  4. Назначение модуля ARNAVAC?

  5. В чем состоит особенность модуля Линейная Регрессия?

  6. Назначение модуля «Поиск Зависимостей»?

  7. Какие варианты алгоритмов использует модуль «Поиск Зависимостей»?

  8. В чем состоит результат работы модуля Классификация?

  9. Назначение модуля Дискриминация?

  10. В чем состоит результат работы модуля Кластеризация?

  11. Какие существуют требования к количеству записей в исследуемой таблице?

  12. Назначение модуля PolyNet Predictor?

Контрольные вопросы:

  1. Для каких экономических процессов целесообразно применять моделирование на основе нейронных сетей?

Применение нейрокомпьютеров на российском финансовом рынке. Прогнозирование временных рядов на основе нейросетевых методов обработки. Определение курсов облигаций и акций предприятий. Применение нейронных сетей к задачам анализа биржевой деятельности.

  1. Приведите примеры экономических процессов, которые можно описать заданной выше системой уравнений. (???) какая на хер система уравнений? Где она, или я слепой? :D

Контрольные вопросы:

  1. Из каких основных элементов состоит нейрон? Назначение элементов?

Каждый нейрон характеризуется своим текущим состоянием по аналогии с нервными клетками головного мозга, которые могут быть возбуждены или заторможены. Он обладает группой синапсов - однонаправленных входных связей, соединенных с выходами других нейронов, а также имеет аксон - выходную связь данного нейрона, с которой сигнал (возбуждения или торможения) поступает на синапсы следующих нейронов

  1. Вид математической модели нейрона?

(???)

  1. Какие бывают функции активации нейрона?

Наиболее часто используются следующие функции активации.