Множественный коэффициент корреляции (Индекс множественной корреляции)
Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции. В отличии от парного коэффициента корреляции, который может принимать отрицательные значения, он принимает значения от 0 до 1. Поэтому R не может быть использован для интерпретации направления связи. Чем плотнее фактические значения yi располагаются относительно линии регрессии, тем меньше остаточная дисперсия и, следовательно, больше величина Ry(x1,...,xm). Таким образом, при значении R близком к 1, уравнение регрессии лучше описывает фактические данные и факторы сильнее влияют на результат. При значении R близком к 0 уравнение регрессии плохо описывает фактические данные и факторы оказывают слабое воздействие на результат.
Связь между признаком Y факторами X низкая. Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и β-коэффициентов.
Коэффициент детерминации R2 = 0.0878 Коэффициент детерминации. R2= 0.2962 = 0.0879 4. Оценка значения результативного признака при заданных значениях факторов. Y(41.6,49.6) = 502897.32-8443.73 * 41.6-5148.23 * 49.6 = -103714.07 V = X0T(XTX)-1X0 где
X0T = [ 1 ; 41.6 ; 49.6]
Умножаем матрицы X0T и (XTX)-1
Умножаем полученную матрицу на X0, находим V = 0.4
Доверительные интервалы с вероятностью 0.95 для среднего значения результативного признака M(Y). (Y – t*SY ; Y + t*SY ) где t(20-2-1;0.05/2) = 2.11 находим по таблице Стьюдента. (-103714.07 – 2.11*264382.6 ; -103714.07 + 2.11*264382.6) (-661561.36;454133.22) C вероятностью 0.95 среднее значение Y при X0i находится в указанных пределах. Доверительные интервалы с вероятностью 0.95 для индивидуального значения результативного признака.
(-103714.07 – 2.11*494614.56 ; -103714.07 + 2.11*494614.56) (-1147350.79;939922.65) C вероятностью 0.95 индивидуальное значение Y при X0i находится в указанных пределах. 6. Проверка общего качества уравнения множественной регрессии. Оценка значимости уравнения множественной регрессии осуществляется путем проверки гипотезы о равенстве нулю коэффициент детерминации рассчитанного по данным генеральной совокупности: R2 или b1 = b2 =... = bm = 0 (гипотеза о незначимости уравнения регрессии, рассчитанного по данным генеральной совокупности). Для ее проверки используют F-критерий Фишера. При этом вычисляют фактическое (наблюдаемое) значение F-критерия, через коэффициент детерминации R2, рассчитанный по данным конкретного наблюдения. По таблицам распределения Фишера-Снедоккора находят критическое значение F-критерия (Fкр). Для этого задаются уровнем значимости α (обычно его берут равным 0,05) и двумя числами степеней свободы k1=m и k2=n-m-1. 2) F-статистика. Критерий Фишера.
Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y. Более объективной оценкой является скорректированный коэффициент детерминации:
Добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации. Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных: H0: R2 = 0; β1 = β2 = ... = βm = 0. H1: R2 ≠ 0. Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера (правосторонняя проверка). Если F < Fkp = Fα ; n-m-1, то нет оснований для отклонения гипотезы H0.
Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 20 - 2 - 1 = 17, Fkp(2;17) = 3.59 Отметим значения на числовой оси.
Поскольку фактическое значение F < Fkp, то коэффициент детерминации статистически не значим и уравнение регрессии статистически ненадежно.
Решение было получено и оформлено с помощью сервиса: Уравнение множественной регрессии Вместе с этой задачей решают также: Уравнение парной линейной регрессии Выявление тренда методом аналитического выравнивания Уравнение нелинейной регрессии Проверка на автокорреляцию Системы эконометрических уравнений Метод статистических уравнений зависимостей Онлайн сдача дистанционных тестов Copyright © Semestr.RU
Задание №3
По данным о средних потребительских ценах в РФ, взятым из соответствующей таблицы, выполнить следующие действия: 1. Параметры линейного, экспоненциального, степенного, гиперболического трендов, описывающих динамику доли малых предприятий. Выберите из них наилучший, используя среднюю ошибку аппроксимации и коэффициент детерминации. 2. Выбрать лучшую форму тренда и выполнить точечный прогноз на 2012, 2013 и 2014 годы. 3. Определить коэффициенты автокорреляции 1, 2, 3 и 4 порядков. 4. Построить автокорреляционной функцию временного ряда. Охарактеризовать структуру этого ряда.
Таблица 3 Исходные данные
Решение: Линейное уравнение тренда имеет вид y = a1t + a0 1. Находим параметры уравнения методом наименьших квадратов. Система уравнений МНК: a0n + a1∑t = ∑y a0∑t + a1∑t2 = ∑y • t
Для наших данных система уравнений имеет вид: 14a0 + 28063a1 = 278.59 28063a0 + 56252511a1 = 559218.48 Из первого уравнения выражаем а0 и подставим во второе уравнение Получаем a0 = -6895.185, a1 = 3.45 Уравнение тренда: y = 3.45 t - 6895.185 Эмпирические коэффициенты тренда a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных. Коэффициент тренда b = 3.45 показывает среднее изменение результативного показателя (в единицах измерения у) с изменением периода времени t на единицу его измерения. В данном примере с увеличением t на 1 единицу, y изменится в среднем на 3.45. Ошибка аппроксимации. Оценим качество уравнения тренда с помощью средней относительной ошибки аппроксимации.
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения тренда к исходным данным.
Поскольку ошибка больше 7%, то данное уравнение не желательно использовать в качестве тренда. Эмпирическое корреляционное отношение. Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].
где
В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1]. Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0.1 < η < 0.3: слабая; 0.3 < η < 0.5: умеренная; 0.5 < η < 0.7: заметная; 0.7 < η < 0.9: высокая; 0.9 < η < 1: весьма высокая; Полученная величина свидетельствует о том, что изменение временного периода t существенно влияет на y. Коэффициент детерминации.
т.е. в 93.56% случаев влияет на изменение данных. Другими словами - точность подбора уравнения тренда - высокая. Для оценки качества параметров уравнения построим расчетную таблицу (табл. 2)
2. Анализ точности определения оценок параметров уравнения тренда. Стандартная ошибка уравнения.
где m = 1 - количество влияющих факторов в модели тренда.
Интервальный прогноз. Определим среднеквадратическую ошибку прогнозируемого показателя. Uy = yn+L ± K где
L - период упреждения; уn+L - точечный прогноз по модели на (n + L)-й момент времени; n - количество наблюдений во временном ряду; Sy - стандартная ошибка прогнозируемого показателя; Tтабл - табличное значение критерия Стьюдента для уровня значимости α и для числа степеней свободы, равного n-2. По таблице Стьюдента находим Tтабл Tтабл (n-m-1;α/2) = (12;0.025) = 2.179 Точечный прогноз, t = 2012: y(2012) = 3.45*2012 -6895.19 = 45.77
45.77 - 9.86 = 35.91 ; 45.77 + 9.86 = 55.63 Интервальный прогноз: t = 2012: (35.91;55.63) Точечный прогноз, t = 2013: y(2013) = 3.45*2013 -6895.19 = 49.22
49.22 - 10.12 = 39.1 ; 49.22 + 10.12 = 59.34 Интервальный прогноз: t = 2013: (39.1;59.34) Точечный прогноз, t = 2014: y(2014) = 3.45*2014 -6895.19 = 52.67
52.67 - 10.4 = 42.27 ; 52.67 + 10.4 = 63.07 Интервальный прогноз: t = 2014: (42.27;63.07)
Решение было получено и оформлено с помощью сервиса: Уравнение тренда Вместе с этой задачей решают также: Уравнение регрессии Уравнение множественной регрессии Показатели вариации Показатели динамики Онлайн сдача дистанционных тестов Copyright © Semestr.RU
Степенное уравнение тренда имеет вид y = a0 ta1 (ln y = ln a0 + a1 ln t) 1. Находим параметры уравнения методом наименьших квадратов. Система уравнений МНК: a0n + a1∑t = ∑y a0∑t + a1∑t2 = ∑y • t
Для наших данных система уравнений имеет вид: 14a0 + 106.44a1 = 37.5 106.44a0 + 809.31a1 = 285.11 Из первого уравнения выражаем а0 и подставим во второе уравнение Получаем a0 = -3171.912, a1 = 417.536 Уравнение тренда: y = 0t417.536 Эмпирические коэффициенты тренда a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных. Коэффициент тренда b степенной функции есть относительный показатель силы связи, или коэффициент эластичности. Он показывает, на сколько процентов изменится в среднем значение результативного признака при изменении периода t на 1%. Ошибка аппроксимации. Оценим качество уравнения тренда с помощью средней относительной ошибки аппроксимации.
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения тренда к исходным данным.
Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве тренда. Эмпирическое корреляционное отношение. Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].
где
В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1]. Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0.1 < η < 0.3: слабая; 0.3 < η < 0.5: умеренная; 0.5 < η < 0.7: заметная; 0.7 < η < 0.9: высокая; 0.9 < η < 1: весьма высокая; Полученная величина свидетельствует о том, что изменение временного периода t существенно влияет на y. Индекс детерминации.
т.е. в 98.9% случаев влияет на изменение данных. Другими словами - точность подбора уравнения тренда - высокая. Для оценки качества параметров уравнения построим расчетную таблицу (табл. 2)
2. Анализ точности определения оценок параметров уравнения тренда. Стандартная ошибка уравнения.
где m = 1 - количество влияющих факторов в модели тренда.
Интервальный прогноз. Определим среднеквадратическую ошибку прогнозируемого показателя. Uy = yn+L ± K где
L - период упреждения; уn+L - точечный прогноз по модели на (n + L)-й момент времени; n - количество наблюдений во временном ряду; Sy - стандартная ошибка прогнозируемого показателя; Tтабл - табличное значение критерия Стьюдента для уровня значимости α и для числа степеней свободы, равного n-2. По таблице Стьюдента находим Tтабл Tтабл (n-m-1;α/2) = (12;0.025) = 2.179 Точечный прогноз, t = 2012: y(2012) = -3171.91*2012417.54 = 69.3
69.3 - 0.24 = 69.06 ; 69.3 + 0.24 = 69.54 Интервальный прогноз: t = 2012: (69.06;69.54) Точечный прогноз, t = 2013: y(2013) = -3171.91*2013417.54 = 85.28
85.28 - 0.25 = 85.03 ; 85.28 + 0.25 = 85.53 Интервальный прогноз: t = 2013: (85.03;85.53) Точечный прогноз, t = 2014: y(2014) = -3171.91*2014417.54 = 104.93
104.93 - 0.25 = 104.68 ; 104.93 + 0.25 = 105.18 Интервальный прогноз: t = 2014: (104.68;105.18)
Решение было получено и оформлено с помощью сервиса: Уравнение тренда Вместе с этой задачей решают также: Уравнение регрессии Уравнение множественной регрессии Показатели вариации Показатели динамики Онлайн сдача дистанционных тестов Copyright © Semestr.RU
Экспоненциальное уравнение тренда имеет вид y = a0 ea1t (ln y = ln a0 + a1t) 1. Находим параметры уравнения методом наименьших квадратов. Система уравнений МНК: a0n + a1∑t = ∑y a0∑t + a1∑t2 = ∑y • t
Для наших данных система уравнений имеет вид: 14a0 + 28063a1 = 37.5 28063a0 + 56252511a1 = 75208.67 Из первого уравнения выражаем а0 и подставим во второе уравнение Получаем a0 = -414.152, a1 = 0.208 Уравнение тренда: y = 0e0.208t Эмпирические коэффициенты тренда a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных. Коэффициент тренда b = 0.208 показывает среднее изменение результативного показателя (в единицах измерения у) с изменением периода времени t на единицу его измерения. В данном примере с увеличением t на 1 единицу, y изменится в среднем на 0.208. Ошибка аппроксимации. Оценим качество уравнения тренда с помощью средней относительной ошибки аппроксимации.
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения тренда к исходным данным.
Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве тренда. Эмпирическое корреляционное отношение. Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].
где
В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1]. Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0.1 < η < 0.3: слабая; 0.3 < η < 0.5: умеренная; 0.5 < η < 0.7: заметная; 0.7 < η < 0.9: высокая; 0.9 < η < 1: весьма высокая; Полученная величина свидетельствует о том, что изменение временного периода t существенно влияет на y. Индекс детерминации.
т.е. в 98.88% случаев влияет на изменение данных. Другими словами - точность подбора уравнения тренда - высокая. Для оценки качества параметров уравнения построим расчетную таблицу (табл. 2)
2. Анализ точности определения оценок параметров уравнения тренда. Стандартная ошибка уравнения.
где m = 1 - количество влияющих факторов в модели тренда.
Интервальный прогноз. Определим среднеквадратическую ошибку прогнозируемого показателя. Uy = yn+L ± K где
L - период упреждения; уn+L - точечный прогноз по модели на (n + L)-й момент времени; n - количество наблюдений во временном ряду; Sy - стандартная ошибка прогнозируемого показателя; Tтабл - табличное значение критерия Стьюдента для уровня значимости α и для числа степеней свободы, равного n-2. По таблице Стьюдента находим Tтабл Tтабл (n-m-1;α/2) = (12;0.025) = 2.179 Точечный прогноз, t = 2012: y(2012) = -414.15 e0.21*2012 = -2.0974983267339E+184
-2.0974983267339E+184 - 0.24 = -2.0974983267339E+184 ; -2.0974983267339E+184 + 0.24 = -2.0974983267339E+184 Интервальный прогноз: t = 2012: (-2.0974983267339E+184;-2.0974983267339E+184) Точечный прогноз, t = 2013: y(2013) = -414.15 e0.21*2013 = -2.5823317287601E+184
-2.5823317287601E+184 - 0.25 = -2.5823317287601E+184 ; -2.5823317287601E+184 + 0.25 = -2.5823317287601E+184 Интервальный прогноз: t = 2013: (-2.5823317287601E+184;-2.5823317287601E+184) Точечный прогноз, t = 2014: y(2014) = -414.15 e0.21*2014 = -3.1792336005078E+184
-3.1792336005078E+184 - 0.25 = -3.1792336005078E+184 ; -3.1792336005078E+184 + 0.25 = -3.1792336005078E+184 Интервальный прогноз: t = 2014: (-3.1792336005078E+184;-3.1792336005078E+184)
Решение было получено и оформлено с помощью сервиса: Уравнение тренда Вместе с этой задачей решают также: Уравнение регрессии Уравнение множественной регрессии Показатели вариации Показатели динамики Онлайн сдача дистанционных тестов Copyright © Semestr.RU
Гиперболическое уравнение тренда имеет вид y = a1/t + a0 1. Находим параметры уравнения методом наименьших квадратов. Система уравнений МНК: a0n + a1∑1/t = ∑y a0∑1/t + a1∑1/t2 = ∑y/t
Для наших данных система уравнений имеет вид: 14a0 + 0.00698a1 = 278.59 0.00698a0 + 3.0E-6a1 = 0.14 Из первого уравнения выражаем а0 и подставим во второе уравнение Получаем a0 = 19.872, a1 = 55.621 Уравнение тренда: y = 55.621 / t + 19.872 Эмпирические коэффициенты тренда a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных. Коэффициент тренда b = 55.621 показывает среднее изменение результативного показателя (в единицах измерения у) с изменением периода времени t на единицу его измерения. В данном примере с увеличением t на 1 единицу, y изменится в среднем на 55.621. Ошибка аппроксимации. Оценим качество уравнения тренда с помощью средней относительной ошибки аппроксимации.
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения тренда к исходным данным.
Поскольку ошибка больше 7%, то данное уравнение не желательно использовать в качестве тренда. Эмпирическое корреляционное отношение. Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].
где
В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1]. Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0.1 < η < 0.3: слабая; 0.3 < η < 0.5: умеренная; 0.5 < η < 0.7: заметная; 0.7 < η < 0.9: высокая; 0.9 < η < 1: весьма высокая; Полученная величина свидетельствует о том, что изменение временного периода t умеренно влияет на y. Индекс детерминации.
т.е. в -0% случаев влияет на изменение данных. Другими словами - точность подбора уравнения тренда - низкая. Для оценки качества параметров уравнения построим расчетную таблицу (табл. 2)
2. Анализ точности определения оценок параметров уравнения тренда. Стандартная ошибка уравнения.
где m = 1 - количество влияющих факторов в модели тренда.
Интервальный прогноз. Определим среднеквадратическую ошибку прогнозируемого показателя. Uy = yn+L ± K где
L - период упреждения; уn+L - точечный прогноз по модели на (n + L)-й момент времени; n - количество наблюдений во временном ряду; Sy - стандартная ошибка прогнозируемого показателя; Tтабл - табличное значение критерия Стьюдента для уровня значимости α и для числа степеней свободы, равного n-2. По таблице Стьюдента находим Tтабл Tтабл (n-m-1;α/2) = (12;0.025) = 2.179 Точечный прогноз, t = 2012: y(2012) = 55.62/2012 + 19.87 = 19.9
19.9 - 38.86 = -18.96 ; 19.9 + 38.86 = 58.76 Интервальный прогноз: t = 2012: (-18.96;58.76) Точечный прогноз, t = 2013: y(2013) = 55.62/2013 + 19.87 = 19.9
19.9 - 39.88 = -19.98 ; 19.9 + 39.88 = 59.78 Интервальный прогноз: t = 2013: (-19.98;59.78) Точечный прогноз, t = 2014: y(2014) = 55.62/2014 + 19.87 = 19.9
19.9 - 41 = -21.1 ; 19.9 + 41 = 60.9 Интервальный прогноз: t = 2014: (-21.1;60.9)
Решение было получено и оформлено с помощью сервиса: Уравнение тренда Вместе с этой задачей решают также: Уравнение регрессии Уравнение множественной регрессии Показатели вариации Показатели динамики Онлайн сдача дистанционных тестов Copyright © Semestr.RU
Популярное: Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... Почему стероиды повышают давление?: Основных причин три... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (1387)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |