Исследовательский проект «Курение матери и вес новорожденных»
Вам предлагается применить все полученные знания по обработке данных и провести исследование. Результаты необходимо оформить в виде презентации. Презентация должна быть аккуратно, красиво оформлена.
В исследовании были рассмотрены все случаи беременности между 1960 и 1967 годами среди женщин в районе Восточного залива Сан-Франциско. В этом исследовании изучалась взаимосвязь между курением и весом ребенка. Переменная smoke кодируется 1, если мать является курильщиком, и 0, если нет. Переменная bwt – средняя масса тела при рождении, измеренная в унциях, parity – равно 0 если ребенок первенец и 1 в других случаях, продолжительность беременности в днях (gestation), возраст матери в годах (age), рост матери в дюймах (height) и вес матери во время беременности в фунтах (weight).
Переведите все переменные в привычную для вас систему измерения.
Описательная статистика.
Постройте гистограммы распределения веса ребенка для курящих и некурящих матерей. Постройте графики типа box-plot.
Рассчитайте описательную статистику.
Опишите все полученные результаты, сделайте выводы.
Регрессия с одной переменной.
Постройте линейную регрессионную модель для прогнозирования средней массы тела при рождении на основе статуса курения матери. Запишите уравнение регрессионной прямой. Есть ли статистически значимая связь между курением матери и весом ребенка при рождении?
Постройте линейную регрессионную модель для прогнозирования средней массы тела при рождении в зависимости от того, является ли ребенок первенцем или нет. Запишите уравнение регрессионной прямой. Есть ли статистически значимая связь между весом ребенка при рождении и тем, является он первенцем или нет?
Множественная регрессия.
Постройте линейную регрессионную модель для прогнозирования средней массы тела при рождении с использованием всех доступных переменных. Запишите уравнение множественной регрессии.
Подберите лучшую регрессионную модель, при которой нормированный R-квадрат будет максимальным. Запишите итоговое уравнение. Предскажите средний вес ребенка для произвольных (выбранных вами) значений переменных.
Проанализируйте все полученные результаты, опишите этапы исследования, сделайте выводы.