- •Предмет и задачи статистики
- •Источники статистической информации
- •Шкалы для статистической информации
- •Основные понятия в статистике.
- •Формы статистических наблюдений
- •Выборочные и генеральные совокупности
- •Нахождение объема репрезентативных выборочных совокупностей
- •Способы отбора и виды выборок
- •Порядок нормирования статистических показателей
- •Виды ошибок статистических наблюдений
- •Содержание задачи сводки и группировки стат. Информации
- •Содержание эмпирического и теоретического познания, их методы
- •Вариационные ряды, их основные параметры, графики
- •Методика получения интервальных вариационных рядов
- •Графо-аналитические методы расчета моды и медианы
- •Аналитические методы расчета моды и медианы вар.Радов.
- •Сущность вариабельности статистических совокупностей.
- •20) Среднее и средневзвешенное вариационных рядов
- •21) Порядок вычисления среднего квадратического отклонения
- •22) Кривая Лоренца и коэффициент Джини
- •23) Содержание децильного коэффициента доходов
- •24,27) Сущность, вычисление коэффициента парной ранговой корреляции
- •25) Правила ранжирования элементов статистических совокупностей
- •26) Порядок вычисления поправок на связанные ранги
- •28) Сущность коэффициента конкордации
- •29) Назначение корреляционных матриц, правила построения
- •30. Определение степени статистической согласованности объектов. Корреляционные матрицы
- •31. Применение корреляционных матриц в компонентном анализе
- •32. Сущность среднего квадратич. Отклонения на графике Гаусса
- •33. Геометрическая интерпретация коэффициентов линейной функции
- •34. Свойства средних значений линейных уравнений регрессии
- •35. Содержание метода наименьших квадратов
- •36. Метод получения коэффициентов линейной регрессии
- •37. Коэффициент линейной корреляции, его свойства
- •38. Сущность нулевой гипотезы в регрессионном анализе о тесноте связи зависимой и независимой переменной
35. Содержание метода наименьших квадратов
Снова запишем вид соотношения (5) S = (yi – ŷi)2 min, и распишем его подробнее:
N N N
S = (yi – ŷi)2 = [yi – (a + bxi) ]2 = (yi – a - bxi)2 min. (7)
I=1 I=1 I=1
Далее потупим так, как и в случае с вышеприведенным примером по нахождению экстремума у функции вида (1), с тем лишь отличием, что в качестве неизвестных переменных будем рассматривать не функцию у, а коэффициенты уравнения (5) а и b. С целью упрощения последующих записей переменные у знака суммы и остальные индексы обозначать не будем.
Для решения поставленной задачи продифференцируем выражение (7) по двум неизвестным а и b в так называемых частных производных.
∂S
— = 2 (y – a - bx) (0 – 1 - 0) = 2 (y – a - bx) (-1) = 0. (8)
∂a
Разделим обе части равенства (8) на (-1), в правой части равенства (8) останется 0. Понятно, 2 ≠ 0, следовательно,
(y – a - bx) = 0. (9)
Распишем выражение (9) следующим образом.
(y – a - bx) = у - а - b = 0; у = а + b х = а + b х.
Поскольку = 1= (1 + 1 + … + 1) = N, то выражение (9) примет вид:
у = аN + b х (10)
В уравнении (10) все переменные, то есть у, х и N, – известные величины, суть исходные данные для получения уравнения регрессии, коэффициент а – неизвестная величина.
Проделаем подобные операции по отношению к еще одной неизвестной величине – коэффициенту b.
∂S
— = 2 (y – a - bx) (0 – 0 – x) = 2 (y – a - bx) (-x) = 0. (11)
∂b
Если в выражении (11) 2 ≠ 0, то остальная часть равенства (11) примет вид:
(yx – ax – bx2) = yx - ax - bx2 = 0;
xy = a x + b x2 (12)
Таким образом, выражение (8) и (12) составляют систему двух уравнений (13) с двумя неизвестными, коэффициентами а и b, а это, в свою очередь, означает, что данная система уравнений – имеет единственное решение.
а N + b х = у
{ (13)
a x + b x2 = xy
Решение системы уравнений (13) может быть осуществлено несколькими способами: методом подстановки, когда одно неизвестное выражается через другое, методом Крамера (метод определителей) и матричным методом. Заметим, однако, что применение первых двух способов оправдано лишь в случаях, когда число неизвестных не превышает трех. Матричный метод – наиболее универсальный, и именно он используется в вычислительных процедурах на ЭВМ средствами ППП, что рассмотрим несколько ниже.
Для решения системы уравнений (13) воспользуемся методом определителей, как наиболее наглядным, для чего перепишем систему (13) в следующем виде.
(для а) (для b) (для правых частей выражения 13)
N х у
= (14)
х x2 xy
Вычислим главный и частные определители по известным правилам, когда столбцы при соответствующих неизвестных замещаются правыми частями выражения (14):
∆ = N x2 - (х )2 ,
∆ a = у x2 - х xy ,
∆ b = N xy - х у.
Тогда искомые значения коэффициентов а и b будут следующими:
∆ a у x2 - х xy
а = — = ——————— , (15)
∆ N x2 - (х )2
∆ b N xy - х у
b = — = ——————— , (16)
∆ N x2 - (х )2
Если коэффициенты регрессии а и b вычислены правильно, то в этом легко убедиться по тождеству (16а), иллюстрирующего тот факт, что если мы подставим среднее значение х, то при найденных коэффициентах получим среднее значение у:
уср ≡ а + b хср . (16а)
Далее рассмотрим процесс нахождения величин коэффициентов линейной функции вида (6) на конкретном, т.н. «модельном» примере.