ПРИЛОЖЕНИЕ: компьютерные распечатки на 4 листах.
КОНТРОЛЬНАЯ РАБОТА По дисциплине ЭКОНОМЕТРИКА
Брянск — 2009 ЗАДАЧА 1 По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпускаемой продукции (Y, млн. руб.) от объема капиталовложений (X, млн. руб.):
Требуется: 1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию углового коэффициента регрессии. 2. Вычислить остатки; найти остаточную сумму квадратов; определить стандартную ошибку регрессии; построить график остатков. 3. Проверить выполнение предпосылок метода наименьших квадратов. 4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (уровень значимости a=0,05). 5. Вычислить коэффициент детерминации R2; проверить значимость уравнения регрессии с помощью F-критерия Фишера (уровень значимости a=0,05); найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели. 6. Осуществить прогнозирование значения показателя Y при уровне значимости a=0,1, если прогнозное значения фактора Х составит 80 % от его максимального значения. 7. Представить графически: фактические и модельные значения Y, точки прогноза. 8. Составить уравнения нелинейной регрессии: Ø логарифмической; Ø степенной; Ø показательной. Привести графики построенных уравнений регрессии. 9. Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод. РЕШЕНИЕ Для решения задачи используется табличный процессор EXCEL. 1. С помощью надстройки «Анализ данных» EXCEL проводим регрессионный анализ и определяем параметры уравнения линейной регрессии (меню «Сервис» ® «Анализ данных…» ® «Регрессия»): (Для копирования снимка окна в буфер обмена данных WINDOWS используется комбинация клавиш Alt+Print Screen.) В результате этого уравнение регрессии будет иметь вид: (прил. 1). Угловой коэффициент b1=0,785 является по своей сути средним абсолютным приростом. Его значение показывает, что при увеличении объема капиталовложений X на 1 млн. руб. объем выпускаемой продукции Y возрастает в среднем на 0,785 млн. руб.
2. При проведении регрессионного анализа в EXCEL одновременно были определены остатки регрессии (i=1, 2, …, n, где n=10 — число наблюдений значений переменных X и Y) (см. «Вывод остатка» в прил. 1) и рассчитана остаточная сумма квадратов
(см. «Дисперсионный анализ» в прил. 1). Стандартная ошибка линейной парной регрессии Sрег определена там же: млн. руб. (см. «Регрессионную статистику» в прил. 1), где p=1 — число факторов в регрессионной модели. График остатков ei от предсказанных уравнением регрессии значений результата (i=1, 2, …, n) строим с помощью диаграммы EXCEL. Предварительно в «Выводе остатка» прил. 1 выделяются блоки ячеек «Предсказанное Y» и «Остатки» вместе с заголовками, а затем выбирается пункт меню «Вставка» ® «Диаграмма…» ® «Точечная»:
График остатков приведен в прил. 2.
3. Проверим выполнение предпосылок обычного метода наименьших квадратов. 1) Случайный характер остатков. Визуальный анализ графика остатков не выявляет в них какой-либо явной закономерности. Проверим исходные данные на наличие аномальных наблюдений объема выпускаемой продукции Y (выбросов). С этой целю сравним абсолютные величиныстандартизированных остатков(см. «Вывод остатка» в прил. 1) с табличным значением t-критерия Стьюдента для уровня значимости a=0,05 и числа степеней свободы остатка регрессии , которое составляет tтаб=2,306. Видно, что ни один из стандартизированных остатков не превышает по абсолютной величинетабличное значение t-критерия Стьюдента. Это свидетельствует об отсутствии выбросов. 2) Нулевая средняя величина остатков. Данная предпосылка всегда выполняется для линейных моделей со свободным коэффициентом b0, параметры которых оцениваются обычным методом наименьших квадратов. В нашей модели алгебраическая сумма остатков и, следовательно, их среднее, равны нулю: (см. прил. 1). Для вычисления суммы и среднего значений остатков использовались встроенные функции EXCEL «СУММ» и «СРЗНАЧ». 3) Одинаковая дисперсия (гомоскедастичность) остатков. Выполнение данной предпосылки проверим методом Глейзера в предположении линейной зависимости среднего квадратического отклонения возмущений от предсказанных уравнением регрессии значений результата (i=1, 2, …, n). Для этого рассчитывается коэффициент корреляции между абсолютными величинами остатков и (i=1, 2, …, n) с помощью выражения, составленного из встроенных функций: =КОРРЕЛ(ABS(«Остатки»);«Предсказанное Y») Коэффициент корреляции оказался равным (см. прил. 1). Критическое значение коэффициента корреляции для уровня значимости a=0,05 и числа степеней свободы составляет rкр=0,632. Так как коэффициент корреляции не превышает по абсолютной величине критическое значение, то статистическая гипотеза об одинаковой дисперсии остатков не отклоняется на уровне значимости a=0,05. 4) Отсутствие автокорреляции в остатках. Выполнение данной предпосылки проверяем методом Дарбина–Уотсона. Предварительно ряд остатков упорядочивается в зависимости от последовательно возрастающих значений результата Y, предсказанных уравнением регрессии. Для этой цели в «Выводе остатка» прил. 1 выделяется любая ячейка в столбце «Предсказанное Y», и на панели инструментов нажимается кнопка « » («Сортировка по возрастанию»). По упорядоченному ряду остатков рассчитываем d‑статистику Дарбина–Уотсона (см. прил. 1). Для расчета d‑статистики использовалось выражение, составленное из встроенных функций EXCEL: =СУММКВРАЗН(«Остатки 2, …, n»;«Остатки 1, …, n–1»)/СУММКВ(«Остатки 1, …,n») Критические значения d‑статистики для числа наблюдений n=10, числа факторов p=1 и уровня значимости a=0,05 составляют: d1=0,88; d2=1,32. Так как выполняется условие , статистическая гипотеза об отсутствии автокорреляции в остатках не отклоняется на уровне значимости a=0,05. Проверим отсутствие автокорреляции в остатках также и по коэффициенту автокорреляции остатков первого порядка (см. прил. 1). (ряд остатков упорядочен в той же самой последовательности). Для расчета коэффициента автокорреляции использовалось выражение, составленное из встроенных функций: =СУММПРОИЗВ(«Остатки 2, …, n»;«Остатки 1, …, n–1»)/СУММКВ(«Остатки 1, …,n») Критическое значение коэффициента автокорреляции для числа наблюдений n=10 и уровня значимости a=0,05 составляет r(1)кр=0,632. Так как коэффициент автокорреляции остатков первого порядка не превышает по абсолютной величине критическое значение, то это еще раз указывает на отсутствие автокорреляции в остатках. 5) Нормальный закон распределения остатков. Выполнение этой предпосылки проверяем с помощью R/S-критерия, определяемого по формуле , где emax=6,32; emin=(–5,19) — наибольший и наименьший остатки соответственно (определялись с помощью встроенных функций «МАКС» и «МИН»); — стандартное отклонение ряда остатков (определено с помощью встроенной функции «СТАНДОТКЛОН») (см. прил. 1). Критические границы R / S-критерия для числа наблюдений n=10 и уровня значимости a=0,05 имеют значения: (R/S)1=2,67 и (R/S)2=3,69. Так как расчетное значение R/S-критерия попадает в интервал между критическими границами, то статистическая гипотеза о нормальном законе распределения остатков не отклоняется на уровне значимости a=0,05. Проведенная проверка показала, что выполняются все пять предпосылок обычного метода наименьших квадратов. Это свидетельствует об адекватности регрессионной модели исследуемому экономическому явлению.
4. Проверим статистическую значимость коэффициентов b0 и b1 уравнения регрессии. Табличное значение t-критерия Стьюдента для уровня значимости a=0,05 и числа степеней свободы остатка линейной парной регрессии составляет tтаб=2,306. t-статистики коэффициентов , были определены при проведении регрессионного анализа в EXCEL и имеют следующие значения: tb0»3,202; tb1»7,288 (см. прил. 1). Анализ этих значений показывает, что по абсолютной величине все они превышают табличное значение t-критерия Стьюдента. Это свидетельствует о статистической значимости обоих коэффициентов. На то же самое обстоятельство указывают и вероятности случайного формирования коэффициентов b0 и b1, которые ниже допустимого уровня значимости a=0,05 (см. «P‑Значение»). Статистическая значимость углового коэффициента b1 дает основание говорить о существенном (значимом) влиянии изменения объема капиталовложений X на изменение объема выпускаемой продукции Y.
5. Коэффициент детерминации R2 линейной модели также был определен при проведении регрессионного анализа в EXCEL:
(см. «Регрессионную статистику» в прил. 1). Значение R2 показывает, что линейная модель объясняет 86,9 % вариации объема выпускаемой продукции Y. F-статистика линейной модели имеет значение (см. «Дисперсионный анализ» в прил. 1). Табличное значение F-критерия Фишера для уровня значимости a=0,05 и чисел степеней свободы числителя (регрессии) и знаменателя (остатка) составляет Fтаб=5,32. Так как F-статистика превышает табличное значение F-критерия Фишера, то это свидетельствует о статистической значимости уравнения регрессии в целом. На этот же факт указывает и то, что вероятность случайного формирования уравнения регрессии в том виде, в каком оно получено, составляет 8,49×10-5 (см. «Значимость F» в «Дисперсионном анализе» прил. 1), что ниже допустимого уровня значимости a=0,05. Среднюю относительную ошибку аппроксимации определяем по приближенной формуле , где млн. руб. — средний объем выпускаемой продукции, определенный с помощью встроенной функции «СРЗНАЧ» (см. «Исходные данные» в прил. 1). Значение Еотн показывает, что предсказанные уравнением регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 7,1 %. Линейная модель имеет хорошую точность. По результатам проверок, проведенных в пунктах 3 — 5, можно сделать вывод о достаточно хорошем качестве линейной модели и возможности ее использования для целей анализа и прогнозирования объема выпускаемой продукции.
6. Спрогнозируем объем выпускаемой продукции Y, если прогнозное значение объема капиталовложений X составит 80 % от своего максимального значения в исходных данных: § максимальное значение X — xmax=59 млн. руб. (см. «Исходные данные» в прил. 1); § прогнозное значение X — млн. руб. Среднее прогнозируемое значение объема выпускаемой продукции (точечный прогноз) равно млн. руб. Стандартная ошибка прогноза фактического значенияобъема выпускаемой продукции y0 рассчитывается по формуле млн. руб., где млн. руб. — средний объем капиталовложений; млн. руб. — стандартное отклонение объема капиталовложений (определены с помощью встроенных функций «СРЗНАЧ» и «СТАНДОТКЛОН») (см. «Исходные данные» в прил. 1). Интервальный прогноз фактического значения объема выпускаемой продукции y0 с надежностью (доверительной вероятностью) g=0,9 (уровень значимости a=0,1) имеет вид: млн. руб., где tтаб=1,860 — табличное значение t-критерия Стьюдента при уровне значимости a=0,1 и числе степеней свободы . Таким образом, объем выпускаемой продукции Y с вероятностью 90 % будет находиться в интервале от 43,2 до 58,8 млн. руб.
7. График, на котором изображены фактические и предсказанные уравнением регрессии значения Y строим с помощью диаграммы EXCEL (меню «Вставка» ® «Диаграмма…» ® «Точечная»). Далее строим линию линейного тренда (меню «Диаграмма» ® «Добавить линию тренда…» ® «Линейная»), и устанавливаем вывод на диаграмме уравнения регрессии и коэффициента детерминации R2:
Точки точечного и интервального прогнозов наносим на график вручную (прил. 3).
8. Логарифмическую, степенную и показательную модели также строим с помощью диаграммы EXCEL (меню «Вставка» ® «Диаграмма…» ® «Точечная»). Далее последовательно строим соответствующие линии тренда (меню «Диаграмма» ® «Добавить линию тренда…»), и устанавливаем вывод на диаграмме уравнения регрессии и коэффициента детерминации R2:
Графики линий регрессии, уравнения регрессии и значения R2 приведены в прил. 4. Рассмотрим последовательно каждую модель.
1) Логарифмическая модель: . Значение параметра b1=29,9 показывает, что при увеличении объема капиталовложений X на 1 % объем выпускаемой продукции Y возрастает в среднем на млн. руб. Коэффициент детерминации R2»0,898 показывает, что логарифмическая модель объясняет 89,8 % вариации объема выпускаемой продукции Y. F-статистика Фишера логарифмической модели определяется через коэффициент детерминации R2 по формуле . Табличное значение F-критерия Фишера одинаково как для линейной, так и для всех нелинейных моделей, которые здесь строятся (Fтаб=5,32). Так как F-статистика превышает табличное значение F-критерия, то это свидетельствует о статистической значимости уравнения логарифмической регрессии. Стандартная ошибка логарифмической регрессии также рассчитывается через коэффициент детерминации R2 по формуле млн. руб., где млн. руб. — стандартное отклонение объема выпускаемой продукции, определенное с помощью встроенной функции «СТАНДОТКЛОН» (см. «Исходные данные» в прил. 1). Среднюю относительную ошибку аппроксимации определяем по приближенной формуле . Предсказанные уравнением логарифмической регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 6,2 %. Логарифмическая модель имеет хорошую точность. 2) Степенная модель: . Показатель степени b1=0,721 является средним коэффициентом эластичности. Его значение показывает, что при увеличении объема капиталовложений X на 1 % объем выпускаемой продукции Y возрастает в среднем на 0,721 %. Коэффициент детерминации R2»0,873 показывает, что степенная модель объясняет 87,3 % вариации объема выпускаемой продукции Y. F-статистика степенной модели также превышает табличное значение F-критерия Фишера (Fтаб=5,32), что указывает на статистическую значимость уравнения степенной регрессии. Стандартная ошибка степенной регрессии равна млн. руб. Средняя относительная ошибка аппроксимации имеет значение . Предсказанные уравнением степенной регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 7,0 %. Степенная модель имеет хорошую точность. 3) Показательная (экспоненциальная) модель: , где е=2,718… — основание натуральных логарифмов; — функция экспоненты (в EXCEL встроенная функция «EXP»). Параметр b1=1,019 является средним коэффициентом роста. Его значение показывает, что при увеличении объема капиталовложений X на 1 млн. руб. объем выпускаемой продукции Y возрастает в среднем в 1,019 раза, то есть на 1,9 %. Коэффициент детерминации R2»0,821 показывает, что показательная модель объясняет 82,1 % вариации объема выпускаемой продукции Y. F-статистика показательной модели превышает табличное значение F-критерия Фишера (Fтаб=5,32), что свидетельствует о статистической значимости уравнения показательной регрессии. Стандартная ошибка показательной регрессии: млн. руб. Средняя относительная ошибка аппроксимации: . Предсказанные уравнением показательной регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 8,3 %. Показательная модель имеет хорошую точность.
Сравнивая между собой коэффициенты детерминации R2 четырех построенных моделей (линейной, логарифмической, степенной и показательной), можно придти к выводу, что лучшей моделью является логарифмическая модель, так как она имеет самое большое значение R2.
ПРИЛОЖЕНИЕ: компьютерные распечатки на 4 листах. ЗАДАЧА 2 Задача 2а и 2б Для каждого варианта даны по две структурные формы модели, которые заданы в виде матриц коэффициентов модели. Необходимо записать системы одновременных уравнений и проверить обе системы на идентифицируемость.
РЕШЕНИЕ Задача 2а Используя матрицу коэффициентов модели в исходных данных, записываем систему одновременных уравнений регрессии в структурной форме: Проверим каждое уравнение системы на выполнение необходимого и достаточного условия идентификации. В первом уравнении три эндогенные переменные: y1, y2и y3 (H=3). В нем отсутствуют экзогенные переменные x3и x4 (D=2). Необходимое условие идентификации выполнено. Для проверки на достаточное условие составим матрицу из коэффициентов при переменных x3и x4, отсутствующих в данном уравнении, но имеющихся в системе:
Определитель данной матрицы не равен нулю: , а ее ранг равен 2. В заданной системе уравнений три эндогенные переменные — y1, y2 и y3 . Так как ранг матрицы не меньше, чем количество эндогенных переменных в системе без одного, то достаточное условие идентификации для данного уравнения выполнено. Первое уравнение считается идентифицируемым. Во втором уравнении две эндогенные переменные: y1 и y2(H=2). В нем отсутствует одна экзогенная переменная x4(D=1). Необходимое условие идентификации выполнено. Составим матрицу из коэффициентов при переменных y3и x4, которые отсутствуют во втором уравнении:
Определитель данной матрицы не равен нулю: , а ее ранг равен 2. Значит, достаточное условие идентификации выполнено, и второе уравнение считается идентифицируемым. В третьем уравнении три эндогенные переменные: y1, y2 и y3 (H=3). В нем отсутствует экзогенные переменные x1и x2 (D=2). Необходимое условие идентификации выполнено. Составим матрицу из коэффициентов при переменных х1и x2, которые отсутствуют в третьем уравнении:
Определитель данной матрицы равен , а ее ранг — 2. Если , то это означает, что достаточное условие идентификации выполнено, и третье уравнение можно считать идентифицируемым. Таким образом, все три уравнения заданной системы идентифицируемы, а значит, идентифицируема и вся система в целом.
Задача 2б Используя матрицукоэффициентов модели в исходных данных, записываем систему одновременных уравнений регрессии в структурной форме: Проверим каждое уравнение системы на выполнение необходимого и достаточного условия идентификации. В первом уравнении три эндогенные переменные: y1, y2и y3 (H=3). В нем отсутствуют экзогенные переменные x3и x4 (D=2). Необходимое условие идентификации выполнено. Для проверки на достаточное условие составим матрицу из коэффициентов при переменных x3и x4, отсутствующих в данном уравнении, но имеющихся в системе:
Определитель матрицы не равен нулю: , а ее ранг матрицы равен 2. В заданной системе уравнений три эндогенные переменные — y1, y2 и y3. Так как ранг матрицы не меньше, чем количество эндогенных переменных в системе без одного, то достаточное условие идентификации для данного уравнения выполнено. Первое уравнение считается идентифицируемым. Во втором уравнении две эндогенные переменные: y1 и y2(H=2). В нем отсутствует экзогенные переменные x1и x4 (D=2). Так как , то это означает, что данное уравнение сверхидентифицируемо. В третьем уравнении три эндогенные переменные: y1, y2 и y3 (H=3). В нем отсутствует одна экзогенная переменная x3 (D=1). Так как , то это означает, что данное уравнение неидентифицируемо. Таким образом, первое уравнение заданной системы идентифицируемо, второе — сверхидентифицируемо, а третье — неидентифицируемо. Если хотя бы одно уравнение системы неидентифицируемо, то вся система считается неидентифицируемой. Данная система является неидентифицируемой и не имеет статистического решения. Задача 2в По данным таблицы для своего варианта, используя косвенный метод наименьших квадратов, построить структурную форму модели вида:
РЕШЕНИЕ С помощью табличного процессора EXCEL строим два приведенных уравнения системы одновременных уравнений регрессии (меню «Сервис» ® «Анализ данных…» ® «Регрессия»):
Данные уравнения образуют приведенную форму системы одновременных уравнений регрессии: Коэффициенты приведенной формы имеют следующие значения: d10»19,90; d11»2,821; d12»0,394; d20»19,14; d21»1,679 и d22»1,181 (см. прил.). Таким образом, приведенная форма системы уравнений имеет вид: Определим коэффициенты структурной формы системы уравнений Структурные коэффициенты определяются по формулам: ; ; ; ; ; . Окончательно структурная форма системы одновременных уравнений регрессии примет вид:
Популярное: Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... Почему стероиды повышают давление?: Основных причин три... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (150)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |