Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IMG.docx
Скачиваний:
6
Добавлен:
04.02.2016
Размер:
554.56 Кб
Скачать

Глава 18

ГРАФИКИ ПРОИЗВЕДЕНИЙ-ОТНОШЕНИЙ - ОБРАБОТКА БЕЗ ИСПОЛЬЗОВАНИЯ ЯЧЕЕК

УКАЗАТЕЛЬ К ГЛАВЕ 18

Обзорные вопросы

18 А.

Размеры и подсчеты

592

«закон Зипф-а»

593

п-ранг

593

Возможный подход

597

Обзорные вопросы

598

185.

Анализ произведений-отношений

598

Вычисления на полуоктавах

600

Графическое изображение

601

Обзорные вопросы

601

18В.

Выделение необычного, требующего внимания

601

Обзорные вопросы

605

18Г. Сравнение различных совокупностей данных

605

Обзорные вопросы

607

18Д. Особенности наименьшего базисного подсчета

607

Обзорные вопросы

608

18Е.

Пулевые базисные подсчеты

608

Обзорные вопросы

611

18Ж.

, «Под микроскопом» (анализ остатков)

613

Обзорные вопросы

616

18 И.

Чего мы достигли?

616

Комментарии

616

Анализ множеств базисных подсчетов (или количеств), распре­деления которых имеют длинные хвосты,— проблема, с которой при­ходится сталкиваться в самых различных областях. Размеры городов и поселков в данном районе, частота появления различных слов в пьесе, повести или специальном тексте, число видов в каждом из родов некоторого класса растений или животных — вот примеры, которые можно было бы продолжить.

В связи с подобными распределениями возникают две задачи:

О мы хотели бы иметь способ графического изображения этих распределений, который позволил бы нам судить об их форме и срав­нивать между собой;

<> было бы полезно найти некоторый простой способ описания главных особенностей кривой распределения.

(Конечно, найдя такой способ, мы станем интересоваться и остав­шимися вне описания деталями.)

Такого рода задачи нам хорошо знакомы, однако методы, кото­рыми мы уже владеем, лишь в малой степени подходят для графиче­ского изображения подобных распределений. Ячейки в виде октав на шкале базисных подсчетов помогают «справиться» с многими рас­пределениями, имеющими длинные хвосты. Но при этом теряются многие детали, часто имеющие большое значение. Это не удивительно: факт, что «величина, равная 1647, встречается столько-то раз», со­держит гораздо больше информации, чем сообщение, что «столько-то раз встречается величина, заключенная между 1024 и 2047».

Поэтому в данной главе мы рассмотрим методы, основанные не на ячейках, а непосредственно на отдельных подсчетах (по крайней мере для самых больших подсчетов) и ориентированные, во-первых, на построение графиков распределений, которые можно легко срав­нивать между собой, и, во-вторых, на получение простых описаний и соответствующих им остатков.

Эти методы могут быть полезны и для других распределений с длинными хвостами, не основанных на подсчетах, например для рас­пределения площадей озер и прудов (в стране или на континенте). Примеры подобных распределений мы оставляем читателю.

ОБЗОРНЫЕ ВОПРОСЫ

Какая проблема возникает в связи с анализом распределений? Какие задачи естественно здесь ставить? Знакомы ли они нам? На­сколько полезны уже известные нам методы? Будем ли мы в этой главе использовать ячейки?

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]