D .1. Парная регрессия и корреляция
Задача 1. По территориям региона приводятся данные за 199X г. (см. таблицу своего варианта). 1. Построить линейное уравнение парной регрессии от . 2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации. 3. Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента. 4. Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня. 5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал. 6. На одном графике построить исходные данные и теоретическую прямую.
= .
Получено уравнение регрессии: С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,95 руб.
2. Тесноту линейной связи оценит коэффициент корреляции:
Это означает, что 81% вариации заработной платы () объясняется вариацией фактора – среднедушевого прожиточного минимума. Качество модели определяет средняя ошибка аппроксимации: Качество построенной модели оценивается как хорошее, так как не превышает 8-10%. 3. Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия: Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как то уравнение регрессии признается статистически значимым. Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей. Табличное значение -критерия для числа степеней свободы и составит . Определим случайные ошибки , , :
Тогда Фактические значения -статистики превосходят табличное значение: , поэтому параметры , и не случайно отличаются от нуля, а статистически значимы. Рассчитаем доверительные интервалы для параметров регрессии и . Для этого определим предельную ошибку для каждого показателя: Доверительные интервалы Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры и , находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля. 4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит: тогда прогнозное значение заработной платы составит: 5. Ошибка прогноза составит: Предельная ошибка прогноза, которая в случаев не будет превышена, составит: Доверительный интервал прогноза: Выполненный прогноз среднемесячной заработной платы является надежным (p=1-a=1-0,05=0,95) и находится в пределах от 131,23руб. до 163,37руб. D .2. Множественная регрессия и корреляция Задача 2. По 20 предприятиям региона изучается зависимость выработки продукции на одного работника (тыс. руб.) от ввода в действие новых основных фондов (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих (%)
Требуется: 1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат. 2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их. 3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации. 4. С помощью -критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации . 5. С помощью частных -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после . 6. Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор. Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу:
Найдем средние квадратические отклонения признаков: 1. Вычисление параметров линейного уравнения множественной регрессии. Для нахождения параметров линейного уравнения множественной регрессии необходимо решить следующую систему линейных уравнений относительно неизвестных параметров , , : либо воспользоваться готовыми формулами: ; ; . Рассчитаем сначала парные коэффициенты корреляции: Находим Таким образом, получили следующее уравнение множественной регрессии: Коэффициенты и стандартизованного уравнения регрессии находятся по формулам: Т.е. уравнение будет выглядеть следующим образом: Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации. Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности: . Вычисляем: Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% уменьшает среднем выработку продукции на 0,51% или 0,21% соответственно. Таким образом, подтверждается большее влияние на результат фактора , чем фактора . 2. Коэффициенты парной корреляции мы уже нашли: . Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т.к. . При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения. Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии. При двух факторах частные коэффициенты корреляции рассчитываются следующим образом: Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи. Коэффициент множественной корреляции определить через матрицу парных коэффициентов корреляции: , где – определитель матрицы парных коэффициентов корреляции; – определитель матрицы межфакторной корреляции. Коэффициент множественной корреляции Коэффициент множественной корреляции показывает на весьма сильную связь всего набора факторов с результатом. 3. Нескорректированный коэффициент множественной детерминации оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 97,6% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом. Скорректированный коэффициент множественной детерминации определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более ) детерминированность результата в модели факторами и . 4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает -критерий Фишера: . В нашем случае фактическое значение -критерия Фишера: Получили, что (при ), т.е. вероятность случайно получить такое значение -критерия не превышает допустимый уровень значимости . Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи . 5. С помощью частных -критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул: ; . Найдем и . ; . Имеем Получили, что . Следовательно, включение в модель фактора после того, как в модель включен фактор статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака оказывается незначительным, несущественным; фактор включать в уравнение после фактора не следует. Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения после , то результат расчета частного -критерия для будет иным. , т.е. вероятность его случайного формирования меньше принятого стандарта . Следовательно, значение частного -критерия для дополнительно включенного фактора не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора является существенным. Фактор должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора . 6. Общий вывод состоит в том, что множественная модель с факторами и с содержит неинформативный фактор . Если исключить фактор , то можно ограничиться уравнением парной регрессии: ,
Популярное: Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас... Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... Организация как механизм и форма жизни коллектива: Организация не сможет достичь поставленных целей без соответствующей внутренней... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (320)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |