- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
32.1Оценка средней арифметической
Оценка средней величины имеет целью установить величину генеральной средней для изученной категории объектов. Требуемая для этой цели ошибка репрезентативности определяется по формуле:
(10.18)
Пример
При изучении шерстной продуктивности одной породы овец было взято из разных мест обитания породы у 100 взрослых овец 100 годовых настригов шерсти. Средний настриг у 100 овец оказался μ = 5,0 кг, стандартное отклонение для этой выборки = 1,0. Ответственность исследования обычная, поэтому был принят первый порог вероятности безошибочных прогнозов 1 = 0,95.
Оценка среднего настрига для всей породы может быть проведена следующим образом:
n = 100; μ = 5,0; = 1,0; = 100 – 1 = 99; t = 2,0;
= 2,0 0,1 =0,2;
μmax =5,0 + 0,2 = 5,2 (возможный максимум);
μmin = 5,0 – 0,2 = 4,8 (гарантированный минимум).
Выводы
Средний настриг шерсти по изученной выборке равен μ ± = 5,0 ± 0,2, доверительные границы генеральной средней 4,8 – 5,2. По этим показателям можно провести сравнение результатов проведенного исследования с результатами других работ.
Планировать выход шерсти (n = 10000) на основе проведенного исследования следует исходя из гарантированного минимума генеральной средней μmin = 4,8 кг на одну голову, или 48 т шерсти от всех взрослых овец породы.
Работы по стрижке, обработке, перевозке и хранению шерсти следует планировать исходя из возможного максимума генеральной средней μmах = 5,2 кг с головы, или 52 т от всех овец изученной категории.
Пример
При изучении способности к обучению белых мышей для каждой из 40 особей определенного происхождения регистрировалось время прохождения лабиринта в поисках корма после пятой попытки В одном опыте были получены следующие сводные показатели: n = 40, μ = 7,0 мин, = 3,0 мин
Требовалось определить возможное время прохождения лабиринта в среднем для мышей всей изучаемой линии, что можно сделать следующим образом: n = 40, μ = 7,0, = 3,0, = 40 – 1 = 39, t = 2 (ответственность обычная: = 0,95), = 3 / = 0,48; = 2 0,48 = 0,96 ≈ 1,0, т.е не более 7,0 + 1,0 = 8,0; не менее 7,0 – 1,0 = 6,0.
Выводы
Среднее время для опытной группы
μ ± = 7,0 ± 0,48 мин.
Доверительные границы генеральной средней
μ ± = 6,0 – 8,0 мин.
Если встретится группа мышей со средним временем или меньше 6 мин. или больше 8 мин., возникнет предположение, что эта группа отличается от изученной по способности проходить лабиринт. Это предположение необходимо будет проверить методом определения достоверности разности.
32.2Оценка средней разности
В некоторых исследованиях в качестве первичных данных берется разность двух измерений. Это может быть в случае, когда каждая особь выборки изучается в двух состояниях – или в разном возрасте, или при разных условиях жизни. В этих случаях индивидуальные и средние разности по своему знаку и величине могут характеризовать действие на изучаемый признак или возраста, или изменения условий жизни.
Характеристика действия определенных факторов по разности может быть произведена также и в экспериментах с аналогами, когда каждой особи в опытной группе соответствует строго определенная особь в контроле
Пример
При сортоиспытании пшеницы новый сорт А сравнивался со стандартным сортом В по разности урожаев, полученных на 20 парах параллельных делянок: di = Ai – Вi. В результате в качестве первичных материалов было получено 20 разностей, некоторые из них были положительными (A>В), некоторые – отрицательными (А<В).
Для всей выборки, состоящей из 20 разностей, были получены сводные выборочные показатели: n = 20, μ = + 1,0 ц/га, = 2,5 ц/га. В этой выборке новый сорт оказался лучше стандартного: А – В= + 1,0; A>В.
Возник вопрос: а будет ли и весь новый сорт (а не только выборка из него) в аналогичных условиях лучше стандартного? Можно ли считать, что полученная средняя выборочная положительная разность d =+1,0 правильно отражает соответствующую генеральную разность между новым сортом и всем стандартным сортом? Будет ли эта генеральная разность тоже положительной? Этот вопрос можно решить путем оценки генерального значения средней разности на основе полученных сводных выборочных показателей.
Генеральный параметр изучаемой разности был оценен в форме доверительных границ с надежностью β2 = 0,99 (исследование имело большое экономическое значение) следующим образом:
n = 20, = 20 – 1 = 19;
β2 = 0,99, t = 2,9, = ts = 2,90,56 = 1,6; = 19.
не более + 1,0 + 1,6 = + 2,6 (A> В); не менее + 1,0 – 1,6 = –0,6.
Сортоиспытание выявило, что генеральная разность между сортами во всей их массе (а не только в изученной выборке) может находиться в доверительной зоне от +2,6 до –0,6 ц/га, в любой точке этой зоны – или в положительной, или в отрицательной, или в нулевой; если в положительной, значит весь новый сорт лучше стандартного (А > В), если в отрицательной, значит новый сорт хуже стандартного (А < В), если в нулевой, значит урожайность сортов одинакова (А = В, d = A – В = 0).
На основной вопрос: какой сорт лучше, А или В, – сортоиспытание дало ответ: или А лучше В, или А хуже В, или А не отличается от В.