Уравнение парной линейной регрессииЕсли зависимость между результатом и фактором установлена, то ее целесообразно представить математической функцией Когда влияние изменения фактора на результат постоянно, используют линейную функцию, в других случаях необходимо применять нелинейные функции. Математическое описание зависимости в среднем изменений результативного признака Парная линейная регрессия имеет вид где Построение регрессионной модели включает следующие основные этапы: - определение цели исследования; - оценка однородности исходных данных; - выбор формы связи между результатом и отобранными факторами; - определение параметров модели; - оценка тесноты связи; - определение показателей эластичности; - проверка качества построенной модели.
Вернемся к рассматриваемому примеру 1.1 и построим Вначале оценим однородность исходных данных,
Значение коэффициента вариации менее 30%, что говорит об однородности исходных данных, а следовательно, о возможности построения уравнения регрессии. Найдем параметры Для этого используем метод наименьших квадратов (МНК). Исходное условие МНК:
Нужно подобрать такую прямую Для этого воспользуемся системой нормальных уравнений МНК для прямой:
Решая эту систему, можно получить формулы для определения параметров Используя расчетные данные табл. 1.2, получаем Теперь можно записать уравнение парной регрессии:
Параметр Направление связи между признаками В отличие от коэффициента корреляции коэффициент регрессии является асимметричной характеристикой связи: он характеризует не просто связь между переменными, а зависимость изменения Когда единицы измерения исследуемых показателей различаются, для оценки влияния факторов на результативный признак вычисляют коэффициенты эластичности. В нашем примере максимально возможное число баллов, которое можно получить на экзамене, равно 5, а максимально накопленное за семестр число баллов равно 100. Средний коэффициент эластичности для парной линейной регрессии рассчитывается по формуле Он показывает, на сколько процентов изменяется результативный признак В нашем примере Это означает, что при увеличении накопленных за семестр баллов на 1% оценка за экзамен увеличивается примерно на 15%. По уравнению Отклонения фактических оценок от теоретических невелики. Для оценки этих отклонений рассчитывают ошибку аппроксимации. Средняя относительная ошибка аппроксимации определяется по формуле:
Найдем ошибку аппроксимации для нашего примера. Для этого составим расчетную таблицу (табл. 1.3). Таблица 1.3
В нашем примере 6 – 10% свидетельствует о хорошем соответствии модели исходным данным. В последней графе табл. 1.3 показаны квадраты отклонений фактических значений Сумма
где
Это разложение вариации зависимой переменной лежит в основе оценки качества полученного уравнения регрессии: чем большая часть вариации Отношение объясненной вариации к общей вариации Этот коэффициент определяет степень детерминации
Корень квадратный из коэффициента детерминации называется теоретическим корреляционным отношением, он определяет тесноту связи между результативным и факторным признаками при линейной и нелинейной зависимости. Теоретическое корреляционное отношение изменяется от 0 до 1. Чем ближе его значение к 1, тем связь между признаками теснее. В нашем примере Отсюда В случае высокой детерминации В нашем примере уравнение регрессии позволяет определить ожидаемую экзаменационную оценку на основе суммы накопленных за семестр текущих баллов. Выполнить регрессионный анализ, можно воспользовавшись ПК и пакетами прикладных программ Excel, EViews, Statgraphics, Statistica и т.д. Рассмотрим построение парной линейной регрессии с помощью Мiсrоsоft Office Exce12007.
Для этого надо произвести следующие действия. 1.Выбрать Данные ―> Анализ данных ―> Регрессия. 2.В диалоговом окне Регрессиясделать следующее: - ввести в окне Редактирование Входной интервал Yдиапазон зависимой переменной; - ввести в окне Редактирование Входной интервал Хдиапазон факторной переменной; . - установить флажок Метки, если первая строка содержит название столбцов; - установить флажок Константа-ноль, если в уравнении регрессии отсутствует свободный член - ввести в окне Редактирование Выходной интервал - нажать кнопку ОК.
В табл. 1.4 представлены результаты расчета с помощью Мiсrоsоft Office Excel:
а) Регрессионная статистика: - множественный R - коэффициент корреляции - R-квадрат - коэффициент детерминации - наблюдения - число наблюдений n=8; б) Дисперсионный анализ: - столбец df - число степеней свободы. Для строки Регрессия число степеней свободы определяется количеством параметров тв уравнении регрессии: dfф = т -1. В нашем примере два параметра: dfф = 2 - 1 = 1. Для строки Остаток (остаточная вариация) число степе- В примере: dfoc = 8 - 2 = 6. Для строки Итого (общая вариация) число степеней свободы равно: dfy = dfф + dfoc = n - 1. В примере: dfy= 8 - 1 = 7. Столбец SS содержит суммы квадратов отклонении. Для строки Регрессия - это сумма квадратов отклонений теоретических данных от среднего значения:
Для строки Остаток - это сумма квадратов отклонений фактических данных от теоретических:
Для строки Итого - это сумма квадратов отклонений фактических данных от среднего значения:
В столбце MSпоказаны дисперсии на одну степень свободы: Для строки Регрессия - это объясненная (факторная) дисперсия В столбце показано расчетное значение F-критерия Фишера В столбце Значимость F показан уровень значимости, который зависит от вычисленного значения df (остаток) определяется с помощью функции В столбце Коэффициенты показаны значения коэффициентов уравнения регрессии. В строке Y-пересечение - показано значение параметра а уравнения регрессии, в строке х - значение параметра b. Как видим, значения в табл. 1.4 совпадают с расчетами,
Таблица 1.4
Популярное: Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы... Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас... ![]() ©2015-2020 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (5619)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |