Линии регрессии. Метод наименьших квадратов (МНК)
Линии регрессии - это линии, отражающие основную форму зависимости отклика Y от факторного признака X. Определение вида этих линий – основная задача регрессионного анализа.
МНК позволяет определить параметры линии регрессии Ломаная линия, соединяющая фактические данные на корреляционном поле, называется эмпирической регрессией. Основное требование МНК: Сумма квадратов отклонений эмпирических значений отклика от теоретических должна быть минимальной.
Отклонение
Рассмотрим простейший случай – линейную регрессию.
Определим с помощью МНК неизвестные параметры a и b:
Решаем эту систему нормальных уравнений методом Крамера:
Регрессия y на x задается следующей формулой :
Это две различные прямые, пересекающиеся в точке
Одна из этих прямых y=ax+b получается в результате решения задачи минимизации суммы квадратов отклонений по вертикали, а другая (x=cy+d) - по горизонтали.
Для удобства определения параметров a и b можно использовать следующую таблицу:
Уравнение регрессии нужно в первую очередь для проведения прогноза (экстраполяции и интерполяции). При экстраполяции не рекомендуется выходить как в сторону больших, так и в сторону меньших значений по X за пределы, превышающие 1/3 размаха вариации по X.
Границы доверительного интервала определяются следующим образом:
m - число параметров в уравнении регрессии. n-m - число степеней свободы, a - уровень значимости,
Нелинейная регрессия 1) Парабола 2-го порядка Для определения параметров a,b,c можно воспользоваться МНК.
2) Гипербола С помощью замены переменной преобразуем эту формулу к линейному виду. Замена: X=1/x;
Для нахождения параметров a и b можно воспользоваться формулами: a=Da/D, b=Db/D, заменив xi ->Xi.
3) Показательная функция или экспонента (e=2,718281828459045…) y=eax+b=(ea)xeb=AxB {A=ea, B=eb} => y=axb ln y= ln (axb)= ln ax+ln b=x ln a+ ln b. ln y= x ln a+ ln b Замена: Y=ln y, A=ln a, B=ln b => a=eA, b=eB. Y=Ax+B, A=DA/D, B=DB/D, yi -> Yi=ln yi.
Для нелинейных форм регрессии в качестве характеристики силы связи между факторным и результативным признаком следует использовать корреляционное отношение (а не коэффициент прямолинейной корреляции Пирсона!).
Общая дисперсия результирующего признака:
Факторная дисперсия (аналог межгрупповой дисперсии):
Остаточная дисперсия:
На основании правила сложения дисперсий, получим: s2=sф2+se2.
Лучшей является регрессионная модель с наибольшим значением корреляционного отношения.
Популярное: Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы... Личность ребенка как объект и субъект в образовательной технологии: В настоящее время в России идет становление новой системы образования, ориентированного на вхождение... Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация... ![]() ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (892)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |