Мегаобучалка Главная | О нас | Обратная связь


Описание информационной базы



2019-12-29 174 Обсуждений (0)
Описание информационной базы 0.00 из 5.00 0 оценок




Для проведения эконометрического исследования нами был сформирован массив данных (Приложение 1).  Сбор данной статистической информации осуществлялся на специализированных сайтах в сети Internet  [4]. Регистрация значений участвующих в модели показателей производилась  в пределах второй половины февраля и первой половины марта месяца 2010 года.

Исходный массив данных является пространственной выборкой. Количество наблюдений равно 160 единиц.

Рассмотрим статистические свойства выборки – Таблица 3.1.

Таблица 3.1.

Параметр Среднее значение Медиана Максимальное значение Минимальное значение Стандартное отклонение
PRICE 23776.68 23459.5 38200 15050 5908.408
Indesit 0.17 0 1 0 0.375707
Bosch 0.32 0 1 0 0.467455
Whirlpool 0.22 0 1 0 0.414697
Colour_write 0.44 0 1 0 0.497636
Colour_silvery 0.50 0 1 0 0.501531
ELECTRONNOE 0.58 1 1 0 0.494903
CLASS_A 0.64 1 1 0 0.480394
CLASS_В 0.17 0 1 0 0.375707
Сompressor 1.225 1 2 1 0.418893
RMK_CNIZY 0.84 1 1 0 0.364232
SZM 0.74 1 1 0 0.441374
SOXL 0.27 0 1 0 0.447916
Razmor_MK 0.48 0 1 0 0.501217
Razmor_HK 0.41 0 10 0 0.492674
VMK 86.57 86.5 140 17 18.84315
VHK 236.66 229 400 157 38.90822
WIDTH 60.24 60 81 54 4.500547
DEPTH 63.96 65 78 54.2 4.261727
HEIGHT 186.11 185 204 122 12.94135

 

1. Цена двухкамерных холодильников в городе Челябинске варьируется от 15050 тыс. руб. до 38200 тыс. руб. Средняя цена – 23776.68 тыс. руб (Приложение 2, Рис.1).

2. Проведя анализ продаваемых холодильников, мы выяснили, что 17% - Indesit, 32% - Bosch, 22% - Whirlpool (Приложение 2, Рис.2,3,4).

3. Из Приложения 2, Рис.5,6 видно, что 44% - белый цвет холодильника, а 50% - серебристый цвет холодильника.

4. Из Приложения 2, Рис.8,9 видно, что цена холодильника зависит от класса энергопотребления, где класс А составляет 64%, а класс В – 17%.

5. Минимальное количество компрессоров - 1, максимальное -2, среднее значение – 1.225 (Приложение 2, Рис.10).

6. Объем морозильной камеры варьируется от 17 до 140 л, среднее значение – 86,57 л (Приложение 2, Рис.16); объем холодильной камеры от 157 до 400 л, среднее значение – 236,66 л (Приложение 2, Рис. 17).

7. Ширина варьирует от 54 до 81, среднее значение – 60,24 (Приложение 2, Рис.18); глубина от 54,2 до 78, среднее – 63,96 (Приложение 2, Рис. 19); высота от 122 до 204, среднее – 186,11 (Приложение 2, Рис. 20).

8. Также выяснилось, что у 58% продаваемых холодильников электронное управление (Приложение 2, Рис.7); у 84% - морозильная камера расположена снизу (Приложение 2, Рис.11); у 74% - присутствует суперзаморозка морозильной камеры (Приложение 2, Рис. 12); у 27% -  присутствует суперохлождение холодильной камеры (Приложение 2, Рис. 13); у 48% морозильной камеры и у 41% холодильной камеры используется система размораживания No Forst (Приложение 2, Рис. 14,15).

Полученные показатели говорят об однородности исходной статистической  информации. Используя графические возможности программного пакета Eviews, были построены гистограммы (Приложение 2), анализ которых также подтверждает общую однородность зарегистрированных данных.

Для последующей оценки качества выбранной модели из множества данных выделим часть (20%) для проверки близости реальных данных расчетным, полученным по другой части данных. Таким образом, рабочая выборка составит 128 наблюдений.

 

Идентификация модели

Целью данной курсовой работы является построение нескольких вариантов эконометрической модели зависимости стоимости двухкамерного холодильника от его характеристик. Построим линейную, полулогарифмическую и логарифмическую множественную регрессии, оценки коэффициентов которых ищутся методом наименьших квадратов.

Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность. Мультиколлинеарность возникает, когда более чем два фактора связаны между собой линейной зависимостью. В результате нельзя правильно оценить воздействие каждого фактора в отдельности. Чем сильнее мультиколлинеарность, тем менее надёжна оценка распределения суммы объясненной вариации по отдельным факторам с помощью МНК [2,c.98].

Одним из признаков мультиколлинеарности является большие стандартные ошибки и малая значимость оценок, в то время, как модель является достаточно значимой. Так же при мультиколлинеарности оценки могут иметь неправильные с экономической точки зрения знаки или неоправданно большие значения [3,c.94].

Проверим выборку на наличие мультиколлинеарности. Для этого рассмотрим корреляционную матрицу (Приложение 3).

Если коэффициент корреляции принадлежит отрезку (0,65; 1,00), то соответствующая связь относится к сильной [1, с.53].

Из таблицы видно, что между Colour_Write и регрессором Colour_Silvery, также между Class_B и Indesit и между Width и Depth имеется сильная корреляция. Во избежание эффекта мультиколлинеарности необходимо исключить из регрессии сильно зависимые переменные. Так как эти регрессоры между собой имеет явную зависимость, то при исключение Colour_Silvery, Class_B и Width из дальнейшего анализа не приведет к ухудшению регрессий.

Проверку выполняемости условия Гаусса-Маркова о постоянстве дисперсии ошибок регрессии будем проводить с помощью теста на гетероскедастичность – теста Уайта. В случае нарушения базовой предпосылки использования методов наименьших квадратов будем делать поправку на гетероскедастичность.

Для определения корректности выбора вида модели используем RESET- тест на функциональную форму модели.

 

     5.1 Идентификация линейной модели

PRICE = C(1) + C(2)*COLOUR_WRITE + C(3)*ELECTRONNOE + C(4)*CLASS_A + C(5)*COMPRESSOR + C(6)*RMK_CNIZY + C(7)*SZM + C(8)*SOXL + C(9)*RAZMOR_MK + C(10)*RAZMOR_HK + C(11)*VMK + C(12)*VHK + C(13)*DEPTH + C(14)*HEIGHT + C(15)*INDESIT + C(16)*BOSCH + C(17)*WHIRLPOOL

 

Получаем следующие оценки коэффициентов регрессии методом наименьших квадратов:

 

Рис. 5.1.1 Результаты оценивания объясняющих переменных и модели в целом

При 5-ти процентном уровне значимости следующие коэффициенты оказались незначимыми: compressor, rmk_cnizy,  szm, razmor_hk, vmk, depth, height, whilrlpool.

Модель в целом значима, доля общей вариации результирующего признака (R-squared) составила 0,6723.

С целью исключения коррелирующих между собой факторов рассмотрим корреляционную матрицу (Приложение 3).

В результате последовательного исключения незначимых переменных получили следующие результаты оценивания:

Рис. 5.1.2 Результаты вычисления после исключения незначимых переменных

PRICE = 33897.91764 - 2646.788256*COLOUR_WRITE + 2287.243032*ELECTRONNOE - 2242.280271*CLASS_A + 4027.561932*SOXL + 2412.357199*RAZMOR_MK + 29.89422351*VHK - 247.4443967*DEPTH - 6629.486951*INDESIT - 2541.658419*BOSCH - 2698.042488*WHIRLPOOL

Модель в целом осталась значима; доля общей вариации результирующего признака уменьшилась на 0,0095 и составила 0,6628.

Для исследования полученной модели на наличие гомоскедастичности используется тест Уайта:

      Рис. 5.1.3 Результаты теста Уайта

На 5% уровне значимости, гипотеза о гомоскедастичности отвергается, т.е. признается наличие гетероскедастичности.

После применения поправки были получены следующие результаты:

   Рис. 5.1.4 Результаты применения поправки на гетероскедастичность

Значения переменных несколько изменились, но все они остались значимыми. Доля общей вариации результирующего признака не изменилась (0,6628), как и значимость модели в целом (значима).

Проводим RESET-тест на ошибку спецификации регрессоров:

     Рис. 5.1.5 Результаты RESET-теста

Результат RESET-теста указывает на ошибочную спецификацию модели.

 

 

 

     5.2 Идентификация полулогарифмической модели

LOG(PRICE) = C(1) + C(2)*COLOUR_WRITE + C(3)*ELECTRONNOE + C(4)*CLASS_A + C(5)*COMPRESSOR + C(6)*RMK_CNIZY + C(7)*SZM + C(8)*SOXL + C(9)*RAZMOR_MK + C(10)*RAZMOR_HK + C(11)*VMK + C(12)*VHK + C(13)*DEPTH + C(14)*HEIGHT + C(15)*INDESIT + C(16)*BOSCH + C(17)*WHIRLPOOL

 

Получаем следующие оценки коэффициентов регрессии методом наименьших квадратов:

Рис. 5.2.1 Результаты оценивания объясняющих переменных и модели в целом

При 5-ти процентном уровне значимости следующие коэффициенты оказались незначимыми: class_a, compressor, rmk_cnizy, szm, razmor_hk, vmk, depth, height.

Модель в целом значима, доля общей вариации результирующего признака составила 0,6847.

С целью исключения коррелирующих между собой факторов рассмотрим корреляционную матрицу (Приложение 3).

В результате последовательного исключения незначимых переменных получили следующие результаты оценивания:

Рис. 5.2.2. Результаты вычисления после исключения незначимых переменных

LOG(PRICE) = 10.4865464 - 0.1132719331*COLOUR_WRITE + 0.1166536381*ELECTRONNOE - 0.0672971414*CLASS_A + 0.1474838763*SOXL + 0.1075644245*RAZMOR_MK + 0.001463502726*VHK - 0.0117092567*DEPTH - 0.2759079383*INDESIT - 0.1186543974*BOSCH - 0.122385393*WHIRLPOOL

 

Модель в целом осталась значима; доля общей вариации результирующего признака уменьшилась на 0,0082 и составила 0,6765.

Для исследования полученной модели на наличие гомоскедастичности используется тест Уайта:

Рис. 5.2.3. Результаты теста Уайта

На 5% уровне значимости, гипотеза о гомоскедастичности принимается.

 

Проводим RESET-тест на ошибку спецификации регрессоров:

Рис. 5.2.4. Результаты RESET-теста

Результат RESET-теста свидетельствует об отсутствии ошибки спецификации.

 

      5.3 Идентификация логарифмической модели

LOG(PRICE) = C(1) + C(2)*COLOUR_WRITE + C(3)*ELECTRONNOE + C(4)*CLASS_A + C(5)*LOG(COMPRESSOR) + C(6)*RMK_CNIZY + C(7)*SZM + C(8)*SOXL + C(9)*RAZMOR_MK + C(10)*RAZMOR_HK + C(11)*LOG(VMK) + C(12)*LOG(VHK) + C(13)*LOG(DEPTH) + C(14)*LOG(HEIGHT) + C(15)*INDESIT + C(16)*BOSCH + C(17)*WHIRLPOOL

 

Получаем следующие оценки коэффициентов регрессии методом наименьших квадратов:

Рис. 5.3.1.  Результаты оценивания объясняющих переменных и модели в целом

При 5-ти процентном уровне значимости следующие коэффициенты оказались незначимыми: class_a, log(compressor), rmk_cnizy, szm, razmor_hk, log(vmk), log(depth), log(height).

Модель в целом значима, доля общей вариации результирующего признака составила 0,6847.

С целью исключения коррелирующих между собой факторов рассмотрим корреляционную матрицу (Приложение 3).

В результате последовательного исключения незначимых переменных получили следующие результаты оценивания:

Рис. 5.3.2. Результаты вычисления после исключения незначимых переменных

LOG(PRICE) = 11.2020286 - 0.1137005911*COLOUR_WRITE + 0.1167036723*ELECTRONNOE - 0.066814893*CLASS_A + 0.1480422557*SOXL + 0.106879945*RAZMOR_MK + 0.3319897268*LOG(VHK) - 0.70497857*LOG(DEPTH) - 0.2756174193*INDESIT - 0.1192342258*BOSCH - 0.1209517658*WHIRLPOOL

Модель в целом осталась значима; доля общей вариации результирующего признака уменьшилась на 0,0073 и составила 0,6774.

Для исследования полученной модели на наличие гомоскедастичности используется тест Уайта:

Рис. 5.3.3. Результаты теста Уайта

На 5% уровне значимости, гипотеза о гомоскедастичности принимается.

     Проводим RESET-тест на ошибку спецификации регрессоров:

Рис. 5.3.4. Результаты RESET-теста

Результат RESET-теста свидетельствует об отсутствии ошибки спецификации.

 

    5.4 Выбор наилучшей модели  

В процессе моделирования получено две значимых модели, качественно описывающих процесс формирования на рынке г. Челябинска продажной стоимости двухкамерных холодильников.

Так как линейная модель имеет ошибочную спецификацию, то сразу перейдем к рассмотрению логарифмической и полулогарифмической модели.

Для сравнения логарифмической и полулогарифмической модели воспользуемся J-тестом, для этого составим прогноз цены для логарифмической модели (LPRICEF) и прогноз цены для полулогарифмической модели (PRICEFL). Затем построим следующие регрессии:

Для полулогарифмической:

LOG(PRICE) = C(1) + C(2)*COLOUR_WRITE + C(3)*ELECTRONNOE + C(4)*CLASS_A + C(5)*SOXL + C(6)*RAZMOR_MK + C(7)*VHK + C(8)*DEPTH + C(9)*INDESIT + C(10)*BOSCH + C(11)*WHIRLPOOL + C(12)*LPRICEF

Для логарифмической:

LOG(PRICE) = C(1) + C(2)*COLOUR_WRITE + C(3)*ELECTRONNOE + C(4)*CLASS_A + C(5)*SOXL + C(6)*RAZMOR_MK + C(7)*LOG(VHK) + C(8)*LOG(DEPTH) + C(9)*INDESIT + C(10)*BOSCH + C(11)*WHIRLPOOL + C(12)*PRICEFL

При проведении сравнения между полулогарифмической и логарифмической моделями посредством применения J-теста получены следующие результаты:

Для полулогарифмической модели:

Рис. 5.4.1 Результаты J-теста для полулогарифмической модели


Для логарифмической модели:

Рис. 5.4.1 Результаты J-теста для логарифмической модели

Получаем, что при 5-и процентном уровне значимости нулевая гипотеза полулогарифмической регрессии принимается, поскольку коэффициент при LCENAF =3,54Е-05 и Probability равна 0,2373, то есть этот коэффициент в полулогарифмической модели незначим. В логарифмической модели нулевая гипотеза также принимается, так как коэффициент при CENAFL =2.63E-05 и Probability равна 0,3361. Следовательно, обе модели принимаются.

Для выбора лучшей модели проверим логарифмическую и полулогарифмическую модели на соответствие теоретической цены реальной. Для полулогарифмической модели точность прогноза для контрольной выборки составляет 89,01%, а для логарифмической 88,41%. Получаем, что полулогарифмическая модель более точна. Поэтому выберем ее как итоговую модель.




2019-12-29 174 Обсуждений (0)
Описание информационной базы 0.00 из 5.00 0 оценок









Обсуждение в статье: Описание информационной базы

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной...
Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы...
Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (174)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.008 сек.)