Коэффициент детерминации
После проверки значимости каждого коэффициента регрессии обычно проверяется общее качество уравнения регрессии, которое оценивается по тому, как хорошо эмпирическое уравнение регрессии согласуется со статистическими данными. Другими словами, насколько широко рассеяны точки наблюдений относительно линии регрессии. Очевидно, если все точки лежат на построенной прямой, то регрессия Y на X «идеально» объясняет поведение зависимой переменной. В реальной жизни такая ситуация практически не встречается обычно поведение Y лишь частично объясняется влиянием переменной X. Проверка значимости уравнения регрессии производится на основе дисперсионного анализа. В математической статистике дисперсионный анализ рассматривается как самостоятельный метод статистического анализа. Здесь же он применяется как вспомогательное средство для изучения качества регрессионной модели. Рассмотрим вариацию (разброс) значений yi вокруг среднего значения
Покажем, что третье слагаемое будет равно нулю:
Здесь учтено свойства ошибки ei: Таким образом, справедливо следующее равенство
где Замечание 1. В англоязычной литературе Q, QR, Qe часто обозначаются соответственно TSS (total sum of squares), RSS (regression sum of squares) и ESS (error sum of squares), хотя эти обозначения не являются общепринятыми. Замечание 2. Равенство (5.46) верно только в том случае, когда константа b0 включена в число объясняющих параметров регрессии. Одной из наиболее эффективных оценок адекватности регрессионной модели, мерой качества уравнения регрессии, характеристикой прогностической силы анализируемой регрессионной модели является коэффициент детерминации, определяемый по формуле
Заметим, что второе равенство в (5.47) верно лишь в том случае, если верно (5.46), т.е. когда константа включена в уравнение регрессии. Только в этом случае имеет смысл рассматривать статистику R2. В силу определения R2 принимает значения между 0 и 1, Не следует однако абсолютизировать высокие значения R2, т.к. коэффициент детерминации может быть близким к единице в силу того, что обе исследуемые величины X и Y имеют выраженный временной тренд, не связанный с их причинно-следственной зависимостью. В экономике обычно такой тренд имеют объёмные показатели (ВНП, ВВП, доход, потребление). А темповые и относительные показатели (темпы роста, производительность, ставка процента) не всегда имеют тренд. Поэтому при оценивании регрессий по временным рядам объёмных показателей (например, зависимость потребления от дохода или спроса от цены) величина R2 может быть весьма близкой к единице. Но это не обязательно свидетельствует о наличии значимой линейной связи между исследуемыми показателями, а может лишь означать лишь то, что поведение зависимой переменной нельзя описать уравнением Если уравнение регрессии строится по перекрестным данным, а не по временным рядам, то коэффициент детерминации R2 для него обычно не превышает 0,6-0,7. Аналогичные значения R2 обычно получаются и для регрессий по временным рядам, если они не имеют выраженного тренда (темп инфляции от уровня безработицы, темпы прироста выпуска от темпов прироста затрат ресурсов и т.п.). В случае парной линейной регрессионной модели коэффициент детерминации равен квадрату коэффициента корреляции, т.е. R2=r2. % Действительно,
Пример 5.5. По данным примеров 5.1-5.4 рассчитать коэффициент детерминации R2. Решение. По формуле (5.71) находим
Столь высокое значение коэффициента детерминации свидетельствует о высоком общем качестве построенного уравнения регрессии. Отметим, что коэффициент детерминации можно было вычислить и иначе: 5.3.2. Проверка общего качества уравнения регрессии: Любая сумма квадратов отклонений связана с числом степеней свободы (df – degrees of freedom), т.е. с числом независимого варьирования переменной. Число степеней свободы связано с числом единиц совокупности n и с числом определяемых по ней констант. Применительно к исследуемой проблеме число степеней свободы должно показать, сколько независимых отклонений из n возможных При расчёте объяснённой или факторной суммы квадратов Число степеней свободы остаточной суммы квадратов Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений, или, что то же самое, дисперсию на одну степень свободы D.
Определение дисперсии на одну степень свободы приводит дисперсии к сравниваемому виду. При отсутствии линейной зависимости между зависимой и объясняющей переменными случайные величины
Полученную F-статистику можно использовать для проверки нулевой гипотезы
поэтому нулевой гипотезе можно придать вид Если нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга, т.е.
где Величина F-критерия связана с коэффициентом детерминации R2. Факторную сумму квадратов отклонений можно представить как
а остаточную сумму квадратов – как
Тогда значение F-критерия можно выразить как
Таким образом, F-критерий является также критерием для проверки значимости коэффициента детерминации R2. 5.3.3. Проверка общего качества уравнения регрессии: Следует отметить, что значимость уравнения парной линейной регрессии может быть проведена и другим способом, если оценить значимость коэффициента регрессии b1, который, как уже отметалось, имеет распределение Стьюдента с n–2 степенями свободы. Уравнение парной линейной регрессии или коэффициент регрессии b1 значимы на уровне a (иначе – гипотеза H0 о равенстве коэффициента b1нулю, т.е.
больше критического (по абсолютной величине), т.е. Если сравнить (5.50) и (5.52), то можно заметить, что
Следовательно, для парной линейной модели оба способа проверки значимости с использованием F- и t-критериев равносильны. Пример 5.6. По данным примеров 5.1-5.5 проверить значимость построенного уравнения регрессии. Решение. По формуле (5.50) находим
На уровне значимости a=0,05 и числе степеней свободы k1=1 и k2=10 получим
Поскольку Fнабл>Fкрит, то можно сделать вывод о значимости уравнения регрессии на уровне значимости 0,05. Отметим также, что для коэффициента b1 t-критерий равен
Как легко заметить, что для данного случая
Популярное: Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной... ![]() ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (2035)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |