- •Раздел I
- •Глава 1. Статистика как наука
- •1.1. Понятие статистики и краткие сведения из ее истории
- •1.2. Предмет статистики
- •1.3. Метод статистики
- •1.4. Основные категории статистики
- •1.5. Задачи статистики и основные направления ее реформирования
- •Контрольные вопросы
- •Глава 2. Источники статистической информации
- •2.2. Статистическое наблюдение
- •2.2.1. Понятие о статистическом наблюдении
- •2.2.2. Программно-методологические вопросы статистического наблюдения
- •2.2.3. Формы, виды и способы наблюдения
- •Глава 3. Сводка и группировка материалов статического наблюдения
- •3.1. Сводка статистических данных
- •3.2. Задачи и виды группировок
- •3.3. Выполнение группировки по количественному признаку
- •Группировка акционеров по размеру выплаты дивидендов на одну акцию
- •Вторичная группировка акционеров по размеру дивидендов на одну акцию (группировка единая)
- •3.4. Статистические ряды распределения
- •Контрольные вопросы
- •Глава 4. Абсолютные и относительные статистические величины
- •4.1. Абсолютные статистические величины
- •4.2. Относительные статистические величины
- •Контрольные вопросы
- •Глава 5. Средние величины и показатели вариации
- •5.1. Понятие о средних величинах
- •5.2.1. Средняя арифметическая
- •Распределение рабочих по среднему стажу работы
- •5.2.2. Расчет средней арифметической в рядах распределения
- •Распределение рабочих ао по уровню оплаты труда
- •Распределение предприятий региона по стоимости основных производственных фондов (опф)
- •5.2.3. Средняя гармоническая
- •Цена и выручка от реализации по трем коммерческим магазинам
- •Информация о вкладах в банке для расчета средних значений
- •5.2.4. Средняя геометрическая
- •5.2.5. Средняя квадратическая и средняя кубическая
- •5.2.6 Структурные средние
- •5.3.Показатели вариации
- •Распределение рабочих по сменной выработке изделия а и расчетные значения для исчисления показателей вариации
- •5.3.1 .Правило сложения дисперсий
- •Распределение рабочих по среднечасовой выработке изделий
- •Контрольные вопросы
- •Глава 6. Выборочный метод в статистике
- •6.1. Понятие о выборочном наблюдении, его задачи
- •6.2. Ошибки выборки
- •6.3. Распространение выборочных результатов на генеральную совокупность
- •Распределение урожайности по хозяйствам региона, имеющим различную форму собственности
- •Контрольные вопросы
- •Глава 7. Статистическое изучение динамики
- •7.1. Понятие о рядах динамики
- •Добыча нефти в Российской Федерации, млн. Т:
- •7.2. Правила построения рядов динамики
- •Динамика объема реализации продукции фирмы «Весна» в сопоставимых ценах, млн. Руб. (по годам)
- •7.3. Показатели анализа ряда динамики
- •Динамика производства электроэнергии в Российской Федерации
- •Динамика объемов производства продукции машиностроения и металлообработки (в сопоставимых ценах 1990 г., млн. Руб.), и базисные темпы изменения объемов производства
- •Остатки вкладов в сберегательных банках на начало месяца, млн. Руб.
- •Динамика промышленного производства отрасли
- •7.4. Методы анализа основной тенденции развития в рядах динамики
- •Объем производства продукции предприятия (по месяцам) в сопоставимых ценах, млн. Руб.
- •Объем производства продукции предприятия (по кварталам) в сопоставимых ценах, руб.
- •Исходные данные и результаты расчета скользящей средней, ц/га
- •Выравнивание по прямой ряда динамики урожайности зерновых культур
- •7.5. Методы изучения сезонных колебаний
- •Яйценоскость по месяцам года и расчет индексов
- •7.6. Экстраполяция в рядах динамики и прогнозирование
- •Контрольные вопросы
- •Глава 8. Экономические индексы
- •8.1. Индексы и их классификация
- •8.2. Общие индексы количественных показателей
- •Выработка продукции на предприятии
- •8.3. Общие индексы качественных показателей
- •Продажа товаров на рынке
- •Данные о продаже товаров
- •8.4. Индексы средних величин
- •Среднемесячная заработная плата и число работников
- •8.5. Базисные и цепные индексы
- •Контрольные вопросы
- •Глава 9. Статистические методы изучения взаимосвязи социально-экономических явлений
- •9.1. Стохастико-детерминированный характер социально-экономических явлений и виды связей между ними
- •9.1.1. Функциональные
- •9.2. Статистические методы моделирования связи
- •9.2.1. Простейшие методы изучения стохастических связей
- •9.2.2. Статистическое моделирование связи методом корреляционного и регрессионного
- •9.2.2.1 Корреляционный и регрессионный анализ
- •9.2.2.2. Двухмерная линейная модель
- •Распределение рабочих бригады по выработке и стажу работы
- •От стажа работы х (по данным табл. 9.1)
- •9.2.2.3 Проверка адекватности
- •Расчетные значения, необходимые для исчисления дост, дx
- •9.2.2.4. Экономическая интерпретация параметров регрессии
- •9.2.2.5. Многофакторный корреляционный и регрессионный анализ
- •9.2.2.6. Построение и статистический анализ
- •9.2.2.7. Трехфакторные линейные регрессионные модели
- •Стохастическая связь между производительностью труда, внутрисменными простоями и квалификацией рабочих
- •К расчету параметров и оценке линейной двухфакторной регрессионной модели
- •9.2.2.8. Парные коэффициенты корреляции
- •9.2.2.9. Частные коэффициенты корреляции
- •9.2.2.10.Совокупный коэффициент множественной
- •9.2.2.11. Совокупный коэффициент множественной детерминации
- •9.2.2.12. Многошаговый регрессионный анализ
- •9.2.2.13. Экономическая интерпретация многофакторной регрессионной модели
- •9.3. Непараметрические методы
- •Распределение отцов и сыновей по росту, чел.
- •Распределение семей по уровню образования мужа и жены
6.3. Распространение выборочных результатов на генеральную совокупность
Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов.
Выборочные средние и относительные величины распространяют на генеральную совокупность с учетом предела их возможной ошибки.
В каждой конкретной выборке расхождение между выборочной средней и генеральной, т.е. может быть меньше средней ошибки выборки , равно ей или больше ее.
Причем каждое из этих расхождений имеет различную вероятность (объективную возможность появления события). Поэтому фактические расхождения между выборочной средней и генеральной можно рассматривать как некую предельную ошибку, связанную со средней ошибкой и гарантируемую с определенной вероятностью Р.
Предельную ошибку выборки для средней ( ) при повторном отборе можно рассчитать по формуле:
, (6.20)
где t— нормированное отклонение — «коэффициент доверия», зависящий от вероятности, с которой гарантируется предельная ошибка выборки; — средняя ошибка выборки.
Аналогичным образом может быть записана формула предельной ошибки выборки для доли при повторном отборе:
. (6.21)
При случайном бесповторном отборе в формулах расчета предельных ошибок выборки (6.20) и (6.21) необходимо умножить подкоренное выражение на 1 - (n / N).
Формула предельной ошибки выборки вытекает из основных положений теории выборочного метода, сформулированных в ряде теорем теории вероятностей, отражающих закон больших чисел.
На основании теоремы П.Л. Чебышева (с уточнениями A.M. Ляпунова) с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной генеральной дисперсии выборочные обобщающие показатели (средняя, доля) будут сколь угодно мало отличаться от соответствующих генеральных показателей.
Применительно к нахождению среднего значения признака эта теорема может быть записана так:
, (6.22)
а для доли признака:
, (6.23)
где . (6.24)
Таким образом, величина предельной ошибки выборки может быть установлена с определенной вероятностью.
Значения функции Ф (t) при различных значениях t как коэффициента кратности средней ошибки выборки, определяются на основе специально составленных таблиц. Приведем некоторые значения (которые впоследствии будем использовать при решении задач), применяемые наиболее часто для выборок достаточно большого объема (п ≥30):
t 1,000 1,960 2,000 2,580 3,000
Ф(t) 0,683 0,950 0,954 0,990 0,997
Предельная ошибка выборки отвечает на вопрос о точности выборки с определенной вероятностью, значение которой определяется коэффициентом t (в практических расчетах, как правило, заданная вероятность не должна быть менее 0,95). Так, при t = 1 предельная ошибка составит , Следовательно, с вероятностью 0,683 можно утверждать, что разность между выборочными и генеральными показателями не превысит одной средней ошибки выборки. Другими словами, в 68,3% случаев ошибка репрезентативности не выйдет за пределы ±1 . При t =2 с вероятностью 0,954 она не выйдет за пределы ±2 , при t=3 с вероятностью 0,997 - за пределы ±3 и т.д.
Как видно из приведённых выше значений функции Ф (t) (см. последнее значение), вероятность появления ошибки, равной или большей утроенной средней ошибки выборки, т. е. , крайне мала и равна 0,003, т. е. 1—0,997. Такие маловероятные события считаются практически невозможными, а потому величину можно принять за предел возможной ошибки выборки.
Выборочное наблюдение проводится в целях распространения выводов, полученных по данным выборки, на генеральную совокупность. Одной из основных задач является оценка по данным выборки исследуемых характеристик (параметров) генеральной совокупности.
Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы:
для средней ; (6.25)
для доли ; (6.26)
Это означает, что с заданной вероятностью можно утверждать, что значение генеральной средней следует ожидать в пределах от до .
Аналогичным образом может быть записан доверительный интервал генеральной доли: ; .
Наряду с абсолютным значением предельной ошибки выборки рассчитывается и предельная относительная ошибка выборки, которая определяется как процентное отношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности:
для средней, %: ; (6.27)
для доли, %: . (6.28)
Рассмотрим нахождение средних и предельных ошибок выборки, определение доверительных пределов средней и доли на конкретных примерах.
Задача 1. Для определения скорости расчетов с кредиторами предприятий корпорации в коммерческом банке была проведена случайная выборка 100 платежных документов, по которым средний срок перечисления и получения денег оказался равным 22 дням ( = 22) со стандартным отклонением 6 дней (S= 6).
Необходимо с вероятностью Р = 0,954 определить предельную ошибку выборочной средней и доверительные пределы средней продолжительности расчетов предприятий данной корпорации.
Решение. Предельную ошибку определяем по формуле повторного отбора (6.20), так как численность генеральной совокупности N неизвестна. Из представленных значений Ф (t) (см. п. 6.3) для вероятности Р= 0,954 находим t = 2.
Следовательно, предельная ошибка выборки, дней:
Предельная относительная ошибка выборки, %:
Генеральная средняя будет равна , а доверительные интервалы (пределы) генеральной средней исчисляем, исходя из двойного неравенства:
; .
Таким образом, с вероятностью 0,954 можно утверждать, что средняя продолжительность расчетов предприятий данной корпорации колеблется в пределах от 20,8 до 23,2 дней.
Задача 2. Среди выборочно обследованных 1000 семей региона по уровню душевого дохода (выборка 2%-ная, механическая) малообеспеченных оказалось 300 семей.
Требуется с вероятностью 0,997 определить долю малообеспеченных семей во всем регионе.
Решение. Выборочная доля (доля малообеспеченных семей среди обследованных семей) равна:
; или 2% (по условию).
По представленным ранее данным Ф(t) для вероятности 0,997 находим t = 3 (см. п. 6.3). Предельную ошибку доли определяем по формуле бесповторного отбора (механическая выборка всегда является бесповторной):
.
Предельная относительная ошибка выборки, %:
.
Генеральная доля р = w ± ∆w , а доверительные пределы генеральной доли исчисляем, исходя из двойного неравенства: w-∆w≤p≤w +∆ w.
В нашем примере:
0,3-0,014≤ p≤ 0,3+0,014;
0,286≤ p≤ 0,314 или 28,6%≤ p≤ 31,4%
Таким образом, почти достоверно, с вероятностью 0,997 можно утверждать, что доля малообеспеченных семей среди всех семей региона колеблется от 28,6 до 31,4%.
Задача 3. Для определения урожайности зерновых культур проведено выборочное обследование 100 хозяйств региона различных форм собственности, в результате которого получены сводные данные (табл.6.1). Необходимо с вероятностью 0,954 определить предельную ошибку выборочной средней и доверительные пределы средней урожайности зерновых культур по всем хозяйствам региона.
Таблица 6.1