Пример выполненной лабораторной работы № 2
Тема : «Множественная регрессия» Задание. Имеются данные по странам
Требуется: 1. Найти матрицу парных коэффициентов корреляции. Сделать выводы. 2. Построить уравнение множественной регрессии в стандартизованной и естественной форме. 3. Сделать выводы о силе влияния факторов на результат на основе -коэффициентов и средних коэффициентов эластичности. 4. Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции. Проанализировать линейные коэффициенты парной и частной корреляции. Рассчитать значение скорректированного коэффициента множественной детерминации. 5. С помощью общего F-критерия Фишера оценить статистическую надежность уравнения регрессии. 6. С помощью частных F-критериев Фишера оценить, насколько целесообразно включение в уравнение регрессии фактора после фактора и насколько целесообразно включение в уравнение регрессии фактора после фактора . 7. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов при переменных и множественного уравнения регрессии. 8. Сделать выводы.
Решение. 1. Матрицу парных коэффициентов можно получить, рассчитав линейные коэффициенты парной корреляции аналогично тому, как это делалось в первой лабораторной работе. Однако, эффетивнее воспользоваться инструментом «Корреляция» ППП Exel. При построении матрицы парных коэффициентов корреляции исследуемых показателей, учитываем, что эта матрица должна быть симметричной относительно главной диагонали:
Очевидно, что факторы и явно коллинеарны , то есть они дублируют друг друга, один из них следует исключить. Для дальнейшего анализа предпочтительнее оставить фактор , так как он меньше коррелирует с фактором ( ), чем фактор ( ). 2. Линейное уравнение регрессии от и имеет вид: . Для расчета его параметров применим метод стандартизации переменных и построим искомое уравнение в стандартизованном масштабе: . В нашем примере число объясняющих факторов . Стандартизованные коэффициенты регрессии ( -коэффициенты) определяются из следующей системы уравнений: . При эта система принимает вид: .
Для нахождения -коэффициентов применим метод Крамера: ; , ; , . ; Получим уравнение в стандартизованном масштабе . Для построения уравнения в естественной форме рассчитаем и , используя формулы для перехода от к : ; ; Для расчета необходимых величин составим расчетную таблицу 3.2.1. Таблица 3.2.1
; . Значение параметра определим из соотношения Получим уравнение в естественной форме .
3. При сравнении модулей значений стандартизованных коэффициентов и приходим к выводу, что сила влияния на оказалась большей, чем сила влияния : . К аналогичным выводам можно прийти, рассчитав средние коэффициенты эластичности: ; ; . С увеличением на 1 % от его среднего уровня возрастает на 1,49 % от своего среднего уровня; при повышении на 1 % от его среднего уровня повышается на 0,03 % от своего среднего уровня. Очевидно, что сила влияния на оказалась большей, чем сила . 4. Линейные коэффициенты частной корреляции рассчитываются по рекуррентной формуле: . При получаем: ; ; . Коэффициенты частной корреляции дают более точную характеристику тесноты связи двух признаков, чем коэффициенты парной корреляции, так как очищают парную зависимость от взаимодействия данной пары признаков с другими признаками, представленным в модели. Сравним парные и частные коэффициенты корреляции: – выводы о связи между и совпадают;
– связь между и на основе частного коэффициента корреляции оказалась гораздо слабее;
– связь между и на основе частного коэффициента корреляции оказалась гораздо слабее. Различия в выводах на основе частных и парных коэффициентов корреляции различаются из-за довольно существенной межфакторной связи . Расчет линейного коэффициента множественной корреляции выполним с использованием коэффициентов и : Зависимость от и характеризуется как тесная, в которой 93,7 % вариации среднего душевого дохода определяются вариацией учтенных в модели факторов. Прочие факторы, не включенные в модель, составляют соответственно 6,3 % от общей вариации . Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается следующим образом: . 5. Общий F-критерий проверяет гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи: Определяем по таблице значений F-критерия Фишера . Так как , то гипотеза о случайной природе оцениваемых характеристик отклоняется, и с вероятностью делаем заключение о статистической значимости уравнения в целом и показателя тесноты связи, которые сформировались под неслучайным воздействием факторов и . 6. Частные F-критерии – и оценивают статистическую значимость присутствия факторов и в уравнении множественной регрессии. оценивает, насколько целесообразно включение в уравнение регрессии фактора после фактора , а указывает целесообразность включения в уравнение регрессии фактора после фактора . Фактическое значение частного F-критерия рассчитываетcя по формуле: . . Так как , то гипотезу о несущественности прироста за счет включения дополнительного фактора отклоняем и приходим к выводу о статистически подтвержденной целесообразности включения в уравнение регрессии фактора после фактора . Целесообразность включения в модель фактора после фактора проверяет : . Так как , то гипотезу о несущественности прироста за счет включения дополнительного фактора принимаем. Это означает нецелесообразность включения в уравнение регрессии фактора после фактора . 7. Оценка с помощью t-критерия Стьюдента значимости коэффициентов и связана с сопоставлением их значений с величиной их случайных ошибок и . Расчет значений случайных ошибок достаточно сложен и трудоёмок. Поэтому предлагается расчёт значения t-критерия Стьюдента по следующим формулам: ; . Табличные (критические) значения t-критерия Стьюдента зависят от принятого уровня значимости и от числа степеней свободы , где – число единиц совокупности, – число факторов в уравнении. В нашем примере . Так как , то коэффициент регрессии является статистически значимым, надежным, на него можно опираться в анализе и в прогнозе. Так как , то приходим к заключению, что величина является статистически незначимой, ненадежной в силу того, что формируется преимущественно под воздействием случайных факторов. Еще раз подтверждается статистическая значимость влияния на и ненадежность, незначимость влияния на . 8.Проведенные выше исследования показывают, что в данном примере парная регрессионная модель зависимости индекса человеческого развития от средней ожидаемой продолжительности жизни является достаточно статистически значимой, и нет необходимости улучшать ее, включая дополнительный фактор (суточную калорийность питания).
Варианты индивидуальных заданий к лабораторной работе №3 Задание 1. Найти матрицу парных коэффициентов корреляции. Сделать выводы. 2. Построить уравнение множественной регрессии в стандартизованной и естественной форме. 3. Сделать выводы о силе влияния факторов на результат на основе -коэффициентов и средних коэффициентов эластичности. 4. Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции. Проанализировать линейные коэффициенты парной и частной корреляции. Рассчитать значение скорректированного коэффициента множественной детерминации. 5. С помощью общего F-критерия Фишера оценить статистическую надежность уравнения регрессии при уровне значимости . 6. С помощью частных F-критериев Фишера оценить, насколько целесообразно включение в уравнение регрессии фактора после фактора и насколько целесообразно включение в уравнение регрессии фактора после фактора при уровне значимости . 7. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов при переменных и множественного уравнения регрессии при уровне значимости . 8. Сделать выводы. Варианты исходных данных 1–21 По 10 однотипным фирмам (i – номер фирмы) имеются данные за год по зависимости цены товара yi, тыс. руб., от дальности его перевозки xi1, км, расходов на рекламу в месяц xi2, тыс. руб. и расходов на прочие нужды в месяц xi3, тыс. руб.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
Варианты исходных данных 22–29 Имеются данные о рынке строящегося жилья в Санкт-Петербурге: y – цена квартиры, тыс. долл.; x1 – количество комнат в квартире; x2 – общая площадь квартиры, м2; x3 -площадь кухни, м2 . 22.
23.
24.
25.
26.
27.
(0.007 сек.) |