Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
statistika.docx
Скачиваний:
9
Добавлен:
15.04.2019
Размер:
89.78 Кб
Скачать

Вариация альтернативного признака

Признаки, которыми обладают одни единицы совокупности и не обладают другие, носит название АЛЬТЕРНАТИВНЫЕ.

Пусть р - доля единиц, обладающих данным признаком, q – доля единиц, не обладающая данным признаком, причем p+q=1. Альтернативный признак принимает всего 2 значения (0 и 1) с весами соответственно (q и p). Найдем

Теперь найдем дисперсию альтернативного признака:

Обобщенной характеристикой внутри ряда может служить ЭНТРОПИЯ РАСПРЕДЕЛЕНИЯ, и эта мера неопределенности данных наблюдения зависит от числа градаций признака и от вероятности каждой из них. Она показывает, имеется ли закономерность в сосредоточении отдельных градаций. Обозначается H(x), измеряется в битах

Н(х)= -∑pi*log2pi

Если все варианты равновероятны, то энтропия максимальна, если все варианты, за исключением первого, равны 0, то и энтропия = 0. Энтропия при признаке n=2 при равновероятном распределении р=0,5 будет находиться:

Н(х)= -(0,5log0,5+0,5log0,5)=1

Виды дисперсий и правило их сложения.

  1. Общая

Измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию.

  1. Межгрупповая дисперсия

; - средняя по отдельным группам

Характеризует систематическую вариацию, т.е. различие величины изучаемого признака, возникающее под влиянием признака фактора, положенного в основание группировки.

  1. Внутригрупповая дисперсия.

Отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов.

  1. Средняя из групповых дисперсий.

Существует закон: - правило сложения дисперсий.

Коэффициент детерминации

→1 корреляционное отношение (показывает тесноту связи между предметами).

Чем ближе к 1, тем теснее связь между изучаемыми признаками.

Для качественной оценки тесноты связи на основе показателя эмпирического корреляционного отношения была предложена таблица Чэддока.

ι

0,1 – 0,3

0,3 – 0,5

0,5 – 0,7

0,7 – 0,9

0,9 – 0,99

Сила связи

Слабая

Умеренная

Заметная

Тесная

Свойства дисперсии:

  1. Дисперсия постоянной величины = 0

  2. Снижение значений признака в k раз уменьшает дисперсию в k2 раз, а среднее квадратическое отклонение в k раз.

  3. Уменьшение всех значений признака на одну и ту же величину α не меняет величину дисперсии.

  4. Дисперсия от средней всегда с дисперсией, исчисленных от любых других величин, т.е. имеет свойства минимальности.

Лекция №5 28.09.11

Выборочное наблюдение

Выборочное наблюдение – несплошное наблюдение, при котором статистическому обследованию подвергаются единицы изучаемой совокупности, отобранные случайным способом.

Задача выборочного наблюдения: по обследуемой части дать характеристику всей совокупности при условии соблюдения всех правил и принципов проведения статистического наблюдения.

Используется выборочное наблюдение в целях уточнения и для разработки данных сплошного наблюдения.

Выборочный метод позволяет получить необходимые сведения приемлемой точности, когда факторы времени и стоимости делают сплошную разработку нецелесообразной.

Совокупность отобранных для обследования единиц в статистике принято называть выборочной. Совокупность единиц, из которых производят отбор, называется генеральной.

Символы основных параметров генеральной и выборочной совокупности.

Характеристика

Генеральная совокупность

Выборочная совокупность

1 Объем совокупности (численность единиц)

N

n

2 Численность единиц, обладающих обследуемым признаком

M

m

3 Доля единиц, обладающих обследуемым признаком

p=

w=

4 Средний размер признака

5 Дисперсия количественного признака

6 Дисперсия доли

Средняя и предельная ошибки выборки.

Виды ошибок:

  1. Ошибки регистрации. Могут иметь случайный и систематический характер. Случайные ошибки обычно уравновешивают друг друга, т.к. не имеют преимущественного направления в сторону уменьшения или увеличения значений признака. Систематические ошибки направлены в одну сторону вследствие преднамеренного нарушения правил отбора. Избежать их можно при правильной организации и проведении наблюдения.

  2. Ошибки репрезентативности. Возникают только в выборочном наблюдении в силу того, что выборочная совокупность неполно воспроизводит генеральную.

Ошибка выборочного наблюдения – разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения.

Для среднего значения ошибка выборки будет определяться по формуле:

Δ – предельная ошибка выборки. Величина случайная и ей посвящено несколько теорем.

  1. Теорема Чебышева. При достаточно большом числе независимых наблюдений можно с вероятностью близкой к единице утверждать, что отклонение выборочной средней ( ) от генеральной средней ( ) будет сколь угодно малой. В теореме доказано, что величина ошибки не должна превышать значение tµ. В свою очередь µ выражает отклонение выборочной средней от генеральной средней и зависит от колеблемости признака генеральной совокупности, от среднеквадратического отклонения и от числа отобранных единиц.

t – критерий Стьюдента.

µ - средняя ошибка выборки.

– генеральная дисперсия

n – объем выборочной совокупности

Соотношение между генеральной и выборочной дисперсией:

Т.к. при достаточно больших n близка к единице, то принято считать, что генеральная дисперсия приблизительно равна выборочной. Из этого следует, что µ показывает какие возможны отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности.

  1. Теорема Ляпунова.

…………………………………………….

………………………………………….

………………………………………..

Будет стремиться к единице

Из теоремы следует, что величина расхождения между долей признака выборочной совокупности и долей признака генеральной зависит как и в расхождениях средних от средней ошибки выборки. Т.к. , а среднее квадратическое отклонение для доли альтернативного признака , где q=1-p, то средняя ошибка выборки для альтернативного признака будет находиться по формуле:

Т.к. доля признака в выборочной совокупности нам неизвестна, то заменяем ее через долю того же признака генеральной совокупности, т.е. принимаем, что w=p. Тогда ошибка выборки будет находиться по формуле (9).

Предельная величина разности между частостью и долей называется предельной ошибкой выборки. Зная выборочную долю признака (w) и предельную ошибку (дельта w) можно определить границы, в которых заключена генеральная доля.

(10)

Методы формирования выборочной совокупности.

В каждом конкретном случае в зависимости от ряда условий выбирают наиболее предпочтительную систему организации отбора, которая определяется видом, методом и способом отбора.

По виду различают

  1. индивидуальный отбор – отбираются отдельные единицы генеральной совокупности

  2. групповой отбор – отбираются отдельные группы единиц

  3. комбинированный отбор – сочетание индивидуального и группового

Метод отбора: определяет возможность продолжения участия отобранной единицы в дальнейшей процедуре отбора. Существуют 2 метода:

  1. повторный (попавшая в выборку единица после регистрации наблюдаемых признаков возвращается в исходную генеральную и участвует в дальнейшей процедуре отбора)

  2. неповторный (попавшая в выборку единица не возвращается в исходную совокупность, из которой происходит отбор)

вносится поправка: (11)

(12)

Способ отбора определяет конкретный механизм (процедуру выборки единиц из генеральной совокупности):

  1. Собственно случайная выборка. Отбор единиц из генеральной совокупности наугад (без каких-либо элементов системности). Технически собственно случайный отбор проводят методом жеребьевки или по таблице случайных чисел. Может быть как повторным, так и бесповторным.

(13) и (12)

  1. Механическая выборка. Применяется когда генеральная совокупность каким-либо образом упорядочена. Для определения средней ошибки механической выборки используется формула средней ошибки как при собственно случайном бесповторном отборе.

(12)

  1. Серийный отбор (гнездовой). Удобен, когда единицы совокупности объединены в небольшие группы или серии. Т.к. внутри групп или серий обследуются все единицы, то средняя ошибка серийной выборки µ зависит от величины только межгрупповой дисперсии. Так определяется средняя величина ошибки для повторного.

(14)

(15)

(16) для бесповторного

  1. Типический. Используется когда все единицы генеральной совокупности можно разбить на несколько типических групп. Такой отбор может быть организован, либо пропорционален объему типических групп, либо пропорционален внутригрупповой дифференциации признака.

При выборке пропорциональной объему типических групп число единиц, подлежащих отбору из каждой группы определяется по формуле:

Ni – объем i-той группы

ni – объем выборки i-той группы

для повторного

///////////

При выборке пропорциональной дифференциации признака число наблюдений по каждой группе определяется:

σi – среднее квадратическое отклонение i-й группы.

Комбинированный способ отбора.

Можно комбинировать циклическую выборку и серийную когда серии отбираются в установленном порядке из нескольких типических групп.

Серийный и собственно случайный отбор. Когда отдельные единицы отбираются внутри серии в собственно случайном порядке. Ошибка такой выборки определяется ступенчатостью отбора.

Многоступенчатый отбор. Из генеральной совокупности сначала извлекаются укрупненные группы, затем более мелкие и так до тех пор, пока не будут отобраны те единицы, которые подвергаются обследованию.

РЯДЫ ДИНАМИКИ

Ряд динамики представляет собой ряд расположенных в хронологической последовательности числовых значений статистического показателя, характеризующего изменение общественных явлений во времени.

2 основных элемента:

- время (t) – моменты или периоды, к которым относятся уровни ряда.

- конкретное значение показателя (уровень ряда) (у) – показатели, числовые значения которых составляют динамический ряд.

По времени, отраженному в динамических рядах, они разделяются на моментные и интервальные.

Моментным рядом динамики называется такой ряд, уровни которого характеризуют состояние явления на определенные даты (на моменты времени).

Интервальным (периодическим) называют такой ряд, уровни которого характеризуют разбег явления за конкретный период времени.

Значения уровней интервального ряда в отличии от моментных не содержатся в последующих и предыдущих показателях. Их можно просуммировать, что позволяет получать ряды динамики более укрупненных периодов.

Интервальный ряд, где последовательные уровни могут суммироваться, можно представить как ряд с нарастающими итогами.

Уровни в динамическом ряду могут быть представлены абсолютными, средними или относительными величинами.

По расстоянию между уровнями ряды динамики подразделяются на ряды с равностоящими и неравностоящими уровнями по времени.

Если в рядах динамики прерывающиеся или неравномерные интервалы времени, то такие ряды являются неравностоящими.

Ряды динамики могут быть изображены графически. Графическое изображение позволяет наглядно представить развитие явления во времени и способствует проведению анализа уровней.

Правило построения рядов динамики.

Статистические данные должны быть сопоставимы:

  1. По территории (предполагаются одни и те же границы территории)

  2. По кругу охватываемых объектов (сравнение совокупностей с равным числом элементов)

При этом нужно иметь в виду, что сопоставимые показатели ряда должны быть однородны по экономическому содержанию и границам объекта, который они характеризуют.

  1. По времени регистрации

    1. Для интервальных рядов обеспечивается равенством периодов времени, за которые приводятся данные

    2. Для моментных рядов показатели следует приводить на одну и ту же дату.

  2. По ценам. При приведении к сопоставимому виду продукции, измеренной в стоимостных показателях трудность заключается в том, что во-первых с течением времени происходит непрерывное изменение цен и во-вторых существует несколько видов цен. Для характеристики изменения объема продукции должно быть устранено влияние изменения цен. На практике количество продукции, произведенное в разные периоды, оценивают в ценах одного и того же базисного периода, которые называют неизменными или сопоставимыми ценами.

  3. По методологии расчета. При определении уровней необходимо использовать единую методологию расчетов.

Часто статистические данные выражаются в различных единицах измерения, т.е. динамические ряды несопоставимы по единицам измерения. Эта несопоставимость может быть устранена путем обработки рядов динамики приемом, который носит название смыкание рядов динамики. Этот прием позволяет преодолеть несопоставимость данных вследствие изменения во времени круга охватываемых объектов или методологии расчета показателей.

Имеются данные об объеме реализации продукции фирмы, в которую до 1996 года входило 10 предприятий, а с 1996 – 12. Необходимо получить единый ряд, который был бы пригоден для характеристики динамики объема реализации за весь рассматриваемый период.

V реализации

1993 г.

1994 г.

1995 г.

1996 г.

1997 г.

1998 г.

1999 г.

10 предприятий

120

125

130

140

-

-

-

12 предприятий

-

-

-

168

180

195

215

Сопоставимый ряд

144

150

156

168

180

195

215

Показатели за 1996-1999 гг. несопоставимы с показателями за 1993-1995 гг., т.к. относятся к разному количеству предприятий. Задача заключается в вычислении данных за 1993-1995 гг. в новых границах. Проведем смыкание рядов динамики. По данным 1996 года исчисляем коэффициент соотношения уровней 2х рядов.

k=168/140=1,2

Умножая этот коэффициент на уровень ряда, получаем скорректированные данные за 1993-1995 год в новых границах.

Смыкание рядов дает возможность устранить несопоставимость уровней и получить представление о динамике за весь период.

ПОКАЗАТЕЛИ АНАЛИЗА РЯДА ДИНАМИКИ

К показателям ряда динамики относятся абсолютный прирост, темп роста, темп прироста и абсолютное значение 1% прироста. Система средних показателей включает средний уровень ряда, средний абсолютный прирост, средний темп роста и средний темп прироста. Показатели анализа ряда динамики могут вычисляться на постоянной и переменной базах сравнения. При этом сравниваемый уровень называют отчетным, а уровень, с которым производится сравнение, называют базисным. Для расчета показателей на постоянной базе, уровень ряда сравнивается с одним и тем же базисным уровнем. В качестве базисного выбирается либо начальный уровень в ряду динамики, либо уровень, с которого начинается какой-то новый этап развития явления. При этом исчисляемые показатели называют базисными. При расчете на переменной базе каждый последующий уровень сравнивается с предыдущим. Вычисленные при этом показатели носят название цепные.

  1. Абсолютный прирост (сокращение). Характеризует увеличение или уменьшение уровня за определенный промежуток времени

(2)

Уi – уровень сравниваемого периода

Уi-1 – уровень предшествующего периода

У0 – уровень базисного периода

Цепные и абсолютные приросты связаны между собой: сумма последовательных цепных абсолютных приростов равна базисному.

(3)

Для оценки интенсивности (относительного изменения уровня динамического ряда за период) вычисляют темпы роста (снижения). Эта интенсивность оценивается отношением отчетного уровня к базисному. Показатель интенсивности, выраженный в долях единицы, называют коэффициентом роста в процентах темпа роста. Коэффициент роста (Кр) показывает во сколько раз сравниваемый уровень больше уровня, с которым производится сравнение, если он больше 1 или какую часть уровня, с которым производится сравнение составляет сравниваемый уровень, если Кр меньше 1.

(4)

Темп роста – Кр*100

Между цепным и базисным Кр взаимосвязь: произведение последовательных цепных Кр равно базисному Кр за весь период.

(5)

Темп прироста (сокращения). Показывает на сколько % сравниваемый уровень больше или меньше уровня, принятого за базу сравнения. Вычисляется как отношение абсолютного прироста к абсолютному уровню, принятому за базу сравнения.

(6)

Темп прироста можно получить из темпа роста, выраженного в %, если вычесть из него 100.

Абсолютное значение 1% прироста. А%

Рассчитывается по формуле средней хронологической (изменяется со временем). Для интервальных рядов динамики из абсолютных уровней средний уровень за период времени определяется по формуле средней арифметической. Для равных интервалов используется арифметическая простая. Для неравных – взвешенная. t-веса, или длительность интервалов времени.

С 1 по 15 число в акционерном коммерческом банке работало 20 человек. С 16 по 25 – 27 человек. С 26 по 30 – 30 человек. Посчитать среднесписочное число работников за месяц.

Ответ: 24 человека.

  • Средний уровень моментного ряда. С равностоящими уровнями. Определяется п формуле средней хронологической моментного ряда.

(2)

n-число уровней

у-уровни периода, за которые делается расчет.

С неравностоящими уровнями: определяется по формуле средней хронологической взвешенной.

(3)

Пример: масса остатков топлива в хозяйстве приведена на даты:

На 1.01.09 – 40 тонн

На 1.03.09 – 60 тонн

На 1.04.09 – 100 тонн

На 1.08.09 – 10 тонн

На 1.01.10 – 30 тонн

Ответ: 44,6 тонны

Обобщающий показатель скорости изменения уровней во времени является средний абсолютный прирост (убыль). Он представляет собой обобщенную характеристику индивидуальных абсолютных приростов ряда динамики. По цепным данным об абсолютных приростах за ряд лет можно рассчитать средний абсолютный прирост как среднюю арифметическую простую.

(4)

n - число абсолютных приростов в изучаемом периоде.

Сравнительные характеристики направления и интенсивности роста одновременно развивающихся во времени явлений определяются приведением рядов динамики к общему основанию и расчетам коэффициентов опережения (отставания).

Ряды динамики обычно приводят к одному основанию, если они не могут быть решены другими методами. По исходным уровням нескольких рядов динамики определяют относительные величины, а именно базисные темпы роста или прироста. Принятый при этом за базу сравнения период времени либо дата выступают в качестве постоянной базы расчетов темпов роста для каждого из рядов динамики. В зависимости от целей исследования базой может быть начальный, средний, либо какой-то другой уровень ряда. Сравнение интенсивности изменения уровней рядов во времени возможно с помощью коэффициента опережения. Он представляет собой отношение базисных темпов роста или прироста двух рядов динамики за одинаковые отрезки времени.

Коэффициенты опережения или отставания могут быть вычислены на основе сравнения средних темпов роста или прироста. Эти коэффициенты показывают во сколько раз быстрее растет либо отстает уровень одного ряда динамики по сравнению с другим.

Динамика выпускаемой предприятием продукции в сопоставимых ценах:

2003г – 10 млрд

2004г – 13

2005г – 13

2006г – 11

2007г – 8

  1. Среднегодовой выпуск продукции:

(10+13+13+11+8)/5=11

  1. Абсолютный прирост

Δб Δц

3 3

3 0

1 -2

-2 -3

  1. Коэффициент роста

Кцроста

13/10 13/10

  1. 13/10

11/13 11/10

8/11 8/10

  1. Темп прироста

Цепной

30 30

  1. 30

-15,4 10

-27,2 -20

5) Средний темп роста – показывает во сколько раз в среднем за единицу времени изменяется уровень ряда.

Является обобщенной характеристикой индивидуальных темпов роста ряда динамики.Т.к. средний темп роста представляет собой средний коэффициент роста, выраженный в %, то для равностоящих уровней расчеты по средней геометрической сводятся к исчислению средних коэффициентов роста из цепных коэффициентов роста (по цепному способу).

(6)

Если известны уровни динамического ряда, то расчет коэффициента роста упрощается, т.к. произведение цепных коэффициентов роста равно базисному. Для равностоящих уровней расчет ведется по базисному уровню.

m-число уровней ряда динамики в изучаемом периоде, включая базисный. Средние темпы прироста либо сокращения рассчитывают на основе средних темпов роста вычитанием из них 100%.

Тбр Тбпр

(8/10)1/4=94,6 -100 = 5,4

Остатки вкладов в Сбербанке на начало месяца:

№ банка

1.01

1.02

1.03

1.04

1

4

7

8

8

2

10

12

9

14

Среднемесячные остатки:

По средней хронологической.

Для 1 - 7

Для 2 – 11

Методы анализа основной тенденции развития в рядах динамики.

Основной тенденцией развития (трендом) называется плавное и устойчивое изменение уровня явления во времени свободное от случайных колебаний.

Задача анализа состоит в том, чтобы выявить общую тенденцию в изменении уровней ряда, освобожденную от действия различных случайных факторов.

  • Методы укрупнения интервалов – основан на укрупнении периодов времени, к которым относятся уровни ряда (уменьшаем количество интервалов).

  • Метод скользящей (подвижной) средней – исчисляется средний уровень из определенного числа обычно нечетных первых по счету уровней ряда. Затем из такого же числа уровней, но начиная со 2 по счету, далее с 3 и т.д. Средняя как бы скользит по ряду динамики. недостатком сглаживания ряда является укорачивание его по сравнению с … и потеря информации.

  • Метод аналитического выравнивания – оющая тенденция развития рассчитывается как функция времени.

Уt-уровни динамического ряда, вычисленные по соответствующему аналитическому уравнению на момент времени t. Определение этих расчетных уровней производится на основе так называемой адекватной математической модели. Выбор типа модели зависит от цели исследования и должен быть основан на теоретическом анализе, выявляющем характер развития явления и на графическом изображении ряда динамики.

Расчет параметров функции обычно производится методом наименьших квадратов, в котором в качестве решения принимается точка минимума суммы квадратов отклонений между теоретическими (расчетными) и эмпирическими уровнями.

(!)

Параметры уравнения, удовлетворяющие этому условию, находят решением системы нормальных уравнений. На основе найденного уравнения тренда вычисляются выровненные уровни. Т.о. выравнивание ряда динамики заключается в замене фактических уровней Уt плавно изменяющимися уровнями (с галочкой), что наилучшим образом аппроксимирует статистические данные.

Выравнивание по прямой используется, когда абсолютные приросты практически постоянны. Выравнивание по показательной – когда ряд отражает развитие в геометрической прогрессии (когда цепные коэффициенты роста практически постоянны).

ЛЕКЦИЯ№

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]