Мегаобучалка Главная | О нас | Обратная связь


Проверка качества регрессионной модели



2019-11-13 945 Обсуждений (0)
Проверка качества регрессионной модели 0.00 из 5.00 0 оценок




А) После построения модели проверяют качество регрессионной модели. Для этого применяют 4 проверки, одна за другой (но и это еще не все – требуется проверка обоснованности применения МНК для нахождения параметров, пункт (Б)).

1. Во-первых, применяются t-тест Стьюдента для оценки значимости параметров модели (все параметры должны быть значимы) при требуемом уровне значимости α (обычно 0,05 и менее). Если найдены оценки параметров линейной регрессии aj, то выяснить их значимость можно, рассчитав для каждого параметра значение стандартных ошибок для каждого параметра ai и значение t-критерия Стьюдента для каждого из них .

Оценка  в уравнении регрессии модели требуется для каждого параметра, указывается под соответствующим параметром прямо в уравнении регрессии, например:

 

Y= -1,3     + 3,2 Х1   –  2,6666 Х2

(2,410)                   (0,34)        (0,45)

 Эти оценки используются для расчета других оценок модели и ее параметров, например, на их основе рассчитывается оценка значимости того или иного параметра, чтобы затем заключить, значим ли параметр, т.е. нужно ли его учитывать в модели – или можно отбросить

Для парной линейной регрессии ошибки оценки параметров модели:

ma1= ),    ma2 = ),

 

· Если  (табличного), то параметр модели статистически значим, т.е. связанный с ним фактор оказывает значимое влияние на результирующий фактор ( Y).  

· Если это неравенство не выполняется – параметр незначим, а соответствующего фактора не должно быть в модели (модель плохая),

 

Доверительный интервал для оценки j-го параметра aj параметра не должен выходить за границы «нормы»:

 

В Excel стат.функция ЛИНЕЙН сама вычисляет и параметры линейной регрессии и их стандартную ошибку, для построения доверит интервала останется только при заданном уровне значимости α найти по таблице распределений Стьюдента (или вычислить с помощью функц. СТЬЮДЕНТОБР в Excel) критическую t.

2. Во-вторых, для оценки качества модели подсчитывают коэффициент детерминации D для оценки близости расчетов модели к фактическим данным (он должен быть близок к 1 (0,86 и более).

Он считается на основе коэффициента R линейной корреляции между расчетными и фактическими значениями эндогенного фактора Y, показывая, насколько близко расчетное по модели значение Y к действительным значениям Yt. Например, R =0,8 значит, что 80% изменчивости значений Yt вызваны моделью, а остальные 20% - чем-то еще (предположительно, другими факторами, ошибками наблюдения). Модель тем лучше, чем больше факторов она учитывает, т.е. чем ближе R к 1. При малых значения (менее 0,4) корреляционная связь рассчетным и фактическим рядом значений фактора Y отсутствует, т.е. модель неадекватна реальным данным.

Для оценки качества модели принято считать коэффициент детерминации D=R2 (он еще сильнее показывает связь модели с реальностью). R2≤1 всегда.

(здесь реальное случайное значение t-й переменной Y из выборки,

 =f(Xt ) – рассчётное по модели значение переменной Y при конкретных значениях Xt.

 среднее арифметическое по всей выборке)

T – число наблюдений.

 

3. Применяются тест Фишера (Фишера-Снедекора) для оценки значимости модели в целом.

Модель регрессии считается значимой по Фишеру (т.е. адекватно описывает реальность), если величина

F=  >

Т.е. F больше критического табличного значения распределения Фишера.  выясняется из таблицы распределения Фишера. В формуле R2=D – ‘коэффициент детерминации.

Если неравенство теста Фишера не выполняется. Если Fрасчетное>Fкритического, то R2 статистически значим и может использоваться для оценки качества модели. Иначе – нет и, скорее всего, модель плохая («незначима по Фишеру»), ее надо переделывать, например, выкинув незначимые факторы, или добавив другие факторы, или изменив вид функциональной зависимости Y=F(X).

4. В четвертых, проверяют дисперсию остатков модели  (дисперсию отклонений расчетных значений от фактических). Здесь n – число данных в тестовом ряду, m – число независимых факторов модели (X). Для ряда тестовых значений одна должна стремиться к нулю. Если дисперсия ошибки σ-квадрат мала, это может быть потому, что модель хороша, адекватна реальным наблюдениям, но окончательным выводом о качестве этот признак не может служить (могло просто повезти).

 

Б) После построения модели методом МНК также проверяют условия применимости метода МНК для вычисления параметров модели. Если они не выполняются, моделью пользоваться нельзя:

1. Требование случайности (нормальности распределения) ошибок регрессии εi (отсутствие тенденции или скрытых зависимостей)в ряду остатков ε i= Yi- Yi мод (разностей между значениями зависимого фактора - Y фактическими и Y расчетными по модели). Для проверки этого требования можно построить график зависимости εi от Yi. В идеале этот график должен быть горизонтальной полосой разбросов значений ε i= Yi- Yiрасч  вокруг оси Yi). Если этого нет (например, прослеживается нарастание или убывание, или иная – например, периодическая - зависимость), значит неудачно выбрана функция регрессии или требуется переделать модель. Есть также статистические способы проверки. Например, можно подсчитать

Если для ряда остатков выполняется отношение между корнем из дисперсии и вариацией  примерно равное 1:2, то ряд подчиняются закону нормального распределения, т.е в них нет скрытой тенденции ( - среднеквадратическое отклонение, где  - среднее. Арифметическое, только вместо х – остатки модели

2. Требованиенулевой средняя величина остатков, т.е. , Если этого нет, значит модель неадекватна.

3. Требование гомоскедастичности регрессии остатков регрессии – дисперсия остатков должна быть постоянна на протяжении всей выборки (         ). Например, дисперсия остатков, взятая на одном участке выборки и дисперсия остатков на другом участке выборки, должны быть одного уровня. Для проверки применяют тесты ранговой корреляции Спирмена, Уайта, Голдфелда-Квандта, Глейзера и др. (например, ищут дисперсию на двух половинах всей выборки (или на 1 и 3 участках выборки), находят их отношение – оно должны быть равно или почти равно 1, т.е.. Отклонение от единицы оценивают статистически – если оно великовато – модель плохая.

 

4. Требование отсутствия автокорреляция остатков, т.е. независимость ошибок регрессии друг от друга. Тесты на отсутствие автокорреляции – тест Дарбина-Уотса ( d), Бреуша-Годфри, Q-тест Льюинга-Бокса. Если это условие не выполняется, значит модель учитывает не все зависимости, модель выбран неправильно и должна быть переделана.

Так, Тест Дарбина-Уотса оценивает, есть ли корреляция между соседними значениями ошибки εt и εt+1. Применяется для линейных регрессионных моделей.

Для оценки адекватности модели реальному процессу эконометрических моделей можно попытаться оценить, как распределены остатки модели модели. Если они хаотично распределены, не несут в себе какой-то тенденции (закономерности), случайны, то модель корректна, с точки зрения этого теста. Если же распределение остатков et неслучайно, есть автокорреляция, то модель неадекватна реальности.

Суть теста Дарбина-Уотса: подсчитывают число d по формуле: , где  - остаток модели для момента t. Затем смотрят, не является ли d близким к нулю или к 4. (Величина d всегда будет ).

· Если d близко к 0 или к 4 – в ряду остатков есть скрытая автокорреляция, модель плоха.

· Если d близко к 2, то корреляции между рядами et et+1 нет – либо она или есть, но нелинейная и требуются другие тесты.

· Если d другое не очень близко к 0,2,4 – то вывод о наличии или отсутствии корреляции делать нельзя, и требуются другие методы ее проверки.

 



2019-11-13 945 Обсуждений (0)
Проверка качества регрессионной модели 0.00 из 5.00 0 оценок









Обсуждение в статье: Проверка качества регрессионной модели

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной...
Организация как механизм и форма жизни коллектива: Организация не сможет достичь поставленных целей без соответствующей внутренней...
Как построить свою речь (словесное оформление): При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (945)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.007 сек.)