Для применения ВМНК необходимо знать фактические значения дисперсий . На практике такие значения известны очень редко. Следовательно, чтобы применить ВМНК, необходимо сделать реалистические предположения о значениях .
- Может оказаться целесообразным предположить, что дисперсии отклонений пропорциональны значениям , что отражено на рисунке 4.3.
Рис. 4.3
В этом случае ( – коэффициент пропорциональности). Тогда уравнение (4.5) преобразуется делением его левой и правой части на :
(4.8)
При этом для случайных отклонений выполняется условие гомоскедастичности. Оценив для (4.8) коэффициенты и , затем возвращаются к исходному уравнению регрессии (4.5).
Если в уравнении регрессии присутствуют несколько объясняющих переменных, можно поступить следующим образом. Вместо конкретной объясняющей переменной используются значения, рассчитанные по эмпирическому уравнению регрессии: . В этом случае получают следующую регрессию:
(4.9)
- Можно сделать предположение о том, что дисперсии отклонений пропорциональны значениям , что отражено на рисунке 4.4.
Рис. 4.4
В этом случае необходимо преобразовать (4.5) делением на к виду:
. (4.10)
При этом для случайных отклонений выполняется условие гомоскедастичности. Оценив для (4.10) коэффициенты и , затем возвращаются к исходному уравнению регрессии (4.5).
Для применения описанных выше методов весьма значимы знания об истинных значениях дисперсий отклонений , либо предположения, какими эти дисперсии могут быть. На практике рекомендуется применять несколько методов определения гетероскедастичности и способов ее корректировки.
Пример.Исследуем зависимость между доходом (Х) домохозяйства и его расходом (Y) на продукты питания. Выборочные данные по 40 домохозяйствам представлены в таблице 4.1.
Таблица 4.1
X
Y
X
Y
X
Y
X
Y
25,5
14,5
42,5
14,9
61,0
10,9
79,2
19,8
26,5
11,3
44,2
11,6
61,7
16,1
81,5
21,2
27,2
14,7
44,8
21,5
62,5
10,5
82,4
29,0
29,6
10,2
45,5
10,8
64,7
10,6
82,8
17,3
35,7
13,5
45,5
13,8
69,7
29,0
83,0
23,5
38,6
9,9
48,3
16,0
71,2
8,2
85,9
22,0
39,0
12,4
49,5
18,2
73,8
14,3
86,4
18,3
39,3
8,6
52,3
19,1
74,7
21,8
86,9
13,7
40,0
10,3
55,7
16,3
75,8
26,1
88,3
14,5
41,9
13,9
59,0
17,5
76,9
20,0
89,0
27,3
Построим эмпирическое уравнение регрессии и проведем анализ модели на наличие гетероскедастичности.
По (1.11) определим коэффициенты эмпирического уравнения регрессии: , . Следовательно, уравнение имеет вид: .
Определим отклонения (где ), , ранги и . Рассчитанные величины представим в таблице 4.2.
Таблица 4.2
X
Y
Ранг Х
Ранг (абсол. вел.)
25,5
14,5
11,120
3,380
11,4244
-33
26,5
11,3
11,280
0,020
0,0004
-17
27,2
14,7
11,392
3,308
10,9429
-30
29,6
10,2
11,776
-1,576
2,4838
-11
35,7
13,5
12,752
0,748
0,5595
-19
38,6
9,9
13,216
-3,316
10,9959
-4
39,0
12,4
13,280
-0,880
0,7744
-9
39,3
8,6
13,328
-4,728
22,3540
40,0
10,3
13,440
-3,140
9,8596
-2
41,9
13,9
13,744
0,156
0,0243
-11
42,5
14,9
13,840
1,060
1,1236
-15
44,2
11,6
14,112
-2,512
6,3101
-2
44,8
21,5
14,208
7,292
53,1733
-25
45,5
10,8
14,320
-3,520
12,3904
45,5
13,8
14,320
-0,520
0,2704
-4
48,3
16,0
14,768
1,232
1,5178
-13
49,5
18,2
14,960
3,240
10,4976
-15
52,3
19,1
15,408
3,692
13,6309
-17
55,7
16,3
15,952
0,348
0,1211
-3
59,0
17,5
16,480
1,020
1,0404
-5
61,0
10,9
16,800
-5,900
34,8100
61,7
16,1
16,912
-0,812
0,6593
62,5
10,5
17,040
-6,540
42,7716
64,7
10,6
17,392
-6,792
46,1313
69,7
29,0
18,192
10,808
116,8129
-15
71,2
8,2
18,432
-10,232
104,6938
73,8
14,3
18,848
-4,548
20,6843
74,7
21,8
18,992
2,808
7,8849
-2
75,8
26,1
19,168
6,932
48,0526
-8
76,9
20,0
19,344
0,656
0,4303
79,2
19,8
19,712
0,088
0,0077
81,5
21,2
20,080
1,120
1,2544
82,4
29,0
20,224
8,776
77,0182
-6
82,8
17,3
20,288
-2,988
8,9281
83,0
23,5
20,320
3,180
10,1124
85,9
22,0
20,784
1,216
1,4787
86,4
18,3
20,864
-2,564
6,5741
86,9
13,7
20,944
-7,244
52,4755
Продолжение табл. 4.2
88,3
14,5
21,168
-6,668
44,4622
89,0
27,3
21,280
6,020
36,2404
Проанализируем графически остатки, представив зависимость от (рис. 4.5).
Рис. 4.5
Изучая график, можно обнаружить, что с увеличением возрастает разброс значений , что свидетельствует о наличии гетероскедастичности.
Применим для обнаружения гетероскедастичности тест ранговой корреляции Спирмена. Для этого рассчитаем по (4.1) коэффициент ранговой корреляции:
Рассчитаем -статистику:
.
Из приложения 1 определим критическое значение -статистики для числа степеней свободы и уровня значимости : . Так как рассчитанное значение -статистики превышает критическое, определенное по приложению 1, то гипотеза об отсутствии гетероскедастичности отклоняется с уровнем значимости .
Проверим гипотезу об отсутствии гетероскедастичности с помощью теста Голдфелда-Квандта. Для этого разобьем ряд на три подвыборки размерности 14, 12, 14.
Определим дисперсии отклонений для первой и третьей подвыборок:
и .
Определим значение -статистики. .
Из приложения 2 определим критическое значение -статистики для числа степеней свободы и уровня значимости : . Так как рассчитанное значение -статистики превышает критическое, определенное по приложению 2, то гипотеза об отсутствии гетероскедастичности отклоняется с уровнем значимости .
Следовательно, по всем трем тестам гетероскедастичность в данной модели присутствует.