Спецификация модели. Основные положения построения моделей регрессии
В зависимости от количества факторов, включенных в уравнение регрессии, различают парную (простую) и множественную регрессии. Парная регрессия – регрессия между двумя переменными - Множественная регрессия представляет собой регрессию результативного признака Любое эконометрическое исследование начинается со спецификации модели, т.е. формулировки вида модели, исходя из соответствующей теории связи между переменными. Прежде всего из всех факторов, влияющих на результативный признак, выделяют наиболее существенно влияющие факторы. Парная регрессия является достаточной, если присутствует один доминирующий фактор, который используется в качестве объясняющей переменной. Однако в таких случаях необходимо определиться, какие переменные остаются неизменными, так как в дальнейшем может возникнуть необходимость учета этих переменных в модели и, как следствие, переход от парной к множественной регрессии. При составлении уравнения регрессии корреляционная связь представляет собой функциональную связь, выраженную в виде математической функции. Практически в каждом случае величина результативного признака складывается из составляющих:
Случайная величина характеризует влияние неучтенных в модели факторов, случайных ошибок и особенностей измерения. Присутствие в модели случайной величины обусловлено тремя причинами: спецификацией модели, выборочным характером исходных данных, особенностями измерения переменных К ошибкам спецификации относят неправильный выбор вида математической функции для Наряду с ошибками спецификации могут иметь место и ошибки выборки, так как исследователь чаще всего имеет дело с выборочными данными при установлении зависимостей между признаками. Ошибки выборки имеют место и в силу неоднородности данных, так как временной ряд представляет собой выборку, то, изменив промежутки времени можно получить другие данные и как следствие, другие результаты регрессионного моделирования. Однако наибольшую опасность в практическом использовании методов регрессии представляют ошибки измерения, особенно при исследовании на макроуровне. При моделировании экономических процессов используются два основных типа данных: 1) пространственные данные – набор сведений по разным объектам, взятый за один и тот же момент или период времени; 2) временные данные – набор сведений, характеризующий один и тот же объект за разные периоды или моменты времени. Исследователь чаще всего имеет дело с комбинированием этих данных. В парной регрессии выбор вида математической функции Графический метод подбора вида математической функции основан на визуальном анализе поля корреляции, которое представляет собой эмпирические данные, отмеченные в виде точек в прямоугольной системе координат. Основные типы кривых, используемые при количественной оценке связей, представлены на рис.1.
0 x 0 x 0 x
рис. 1. Класс математических функций для описания связи двух переменных достаточно широк. Кроме уже указанных используют и другие типы кривых:
Если точки поля корреляции группируются относительно некоторой кривой (в частности, относительно прямой), то можно выдвинуть гипотезу о наличии определенной зависимости между признак–фактором Аналитический метод основан на изучении материальной природы связи исследуемых признаков. Экспериментальный метод чаще всего используется при обработке информации на ПК. Он основан на сравнении остаточной дисперсии, рассчитанной при разных моделях. Если уравнение регрессии проходит через все точки поля корреляции, то фактические значения результативного признака совпадают с теоретическими значениями, т.е. значения результативного признака полностью обусловлены влиянием фактора При обработке статистических данных на ПК в автоматическом режиме идет переработка различных математических функций и нахождение остаточной дисперсии для каждой из них. Далее выбирается та математическая функция, которой соответствует наименьшая остаточная дисперсия. Если остаточная дисперсия остается примерно одинаковой для нескольких видов функции, то предпочтение отдается более простым математическим функциям, так как они требуют меньшего объема наблюдений и проще интерпретируются. Практика показала, что число наблюдений должно быть в 6-7 раз больше, чем число оцениваемых параметров при переменной Уравнение линейной регрессии имеет вид:
Выберем на поле корреляции две точки и проведем прямую линию, тогда параметр Классический подход к оцениванию параметров регрессии основан на методе наименьших квадратов (МНК). Для того чтобы регрессионный анализ, основанный на МНК, давал наилучшие из возможных результатов, должны выполняться следующие условия (условия Гаусса – Маркова): 1) математическое ожидание случайного отклонения 2) дисперсия случайных отклонений постоянна D( 3) случайные отклонения 4) объясняющая величина Однако на ряду со всеми этими условиями выдвигается и условие нормального распределения случайной величины При выполнении всех предпосылок МНК можно получать оценки параметров
Иными словами, из всего множества линий линия регрессии выбирается так, чтобы сумма квадратов расстояний по вертикали между точками поля корреляции и этой линией была бы наименьшей. Известно, что случайная составляющая
в результате чего получим системы нормальных уравнений для определения параметров регрессии
Если каждое из этих уравнений разделить на количество наблюдений Параметр b называется коэффициентом регрессии. Его величина показывает, на сколько единиц своего измерения в среднем изменится результативный признак y при изменении фактора Формально Если переменные Альтернативную оценку параметра b можно найти, сопоставляя изменение результата Иногда уравнение линейной парной регрессии представляют в виде: В матричной форме уравнение регрессии можно представить в виде:
Решением данного матричного уравнения является вектор:
Пример.
Используя следующие данные где
Решение:
Получаем следующие значения параметров регрессии: При использовании линейной регрессии в качестве показателя тесноты связи выступает линейный коэффициент корреляции, числовое значение которого может быть определено с помощью формулы:
Величина коэффициента корреляции находится в границах: В зависимости от числовых значений коэффициента корреляции можно сделать вывод о тесноте связи между факторами. Так, например, если Для оценки качества подбора линейной функции рассматривается величина, равная квадрату линейного коэффициента корреляции ( Величина Величина коэффициента детерминации служит одним из критериев оценки качества линейной модели, т.е. чем больше доля объясненной вариации, тем меньше роль неучтенных факторов и тем лучше модель аппроксимирует исходные данные. В результате чего такую модель можно использовать для выполнения прогноза результативного признака.
Популярное: Личность ребенка как объект и субъект в образовательной технологии: В настоящее время в России идет становление новой системы образования, ориентированного на вхождение... Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас... ![]() ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (1193)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |