Задание 2. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
1. По результатам задания 1 по виду гистограммы и полигона частостей, а также по значению выборочных коэффициентов асимметрии и эксцесса сделать предварительный выбор закона распределения
СВ Х и У.
2. Найти точечные оценки параметров нормального распределения, записать для него функцию плотности вероятности f(x) (f(y)) и функцию распределения F(x) (F(y)).
3. Найти теоретические частоты нормального распределения. Проверить согласие эмпирической функции распределения с теоретической, используя критерий согласия Пирсона для СВ Х и У. Построить эмпирические и теоретические кривые распределения.
Т а б л и ц а 7. Вычисление числовых характеристик СВ У
Интервалы наблюденных значений СВ У
| Середины интервалов
yi
| Частоты
mi
|
|
|
|
|
|
|
0,39–0,61
|
0,50
|
|
|
– 0,429
|
– 6,006
|
2,5760
|
– 1,1051
|
0,4732
|
0,61–0,83
|
0,72
|
|
18,72
|
– 0,209
|
– 5,434
|
1,1362
|
– 0,2374
|
0,0494
|
0,83–1,05
|
0,94
|
|
27,26
|
0,011
|
0,319
|
0,0029
|
0,0000
|
0,0000
|
1,05–1,27
|
1,16
|
|
20,88
|
0,231
|
4,158
|
0,9612
|
0,2214
|
0,0504
|
1,27–1,49
|
1,38
|
|
12,42
|
0,451
|
4,059
|
1,8306
|
0,8253
|
0,3726
|
1,49–1,71
|
1,60
|
|
4,8
|
0,671
|
2,013
|
1,3506
|
0,9060
|
0,6078
|
1,71–1,93
|
1,82
|
|
1,82
|
0,891
|
0,891
|
0,7939
|
0,7074
|
0,6303
|
Сумма
|
|
|
92,9
|
|
|
8,6514
|
1,3176
|
2,1837
| 4. Найти доверительный интервал для оценки математического ожидания нормального распределения (доверительную вероятность принять 1-a=0,95).
Решение типового варианта
Методику выполнения этого задания покажем на результатах задания 1.
1. По виду гистограммы и полигона частостей (напоминают нормальную кривую), а также по значению выборочных коэффициентов асимметрии и эксцесса (Аs(X)=0,749, , они близки к нулю), предполагая, что СВ Х – стоимость основных производственных фондов изменяется под влиянием большого числа факторов, примерно равнозначных по силе влияния, можно выдвинуть гипотезу о том, что закон распределения СВ Х является нормальным.
2. Плотность вероятности нормального закона распределения имеет вид , или 
Точечными оценками параметров а и s нормального закона распределения служат средняя выборочная и среднее выборочное квадратическое отклонение , вычисленные ранее, т.е. , =0,251. Следовательно, плотность вероятности предполагаемого нормального закона распределения имеет вид
, или
.
Функция распределения предполагаемого нормального закона
.
Используя нормированную функцию Лапласа , функцию распределения нормального закона записывают в виде , в нашем случае эта функция есть , ее называют теоретической функцией распределения.
3. Проведем проверку гипотезы о нормальном законе распределения СВ Х, используя критерий согласия Пирсона . Для удобства вычислений интервалы наблюденных значений нормируют, т.е. выражают их в единицах среднего квадратического отклонения : , причем наименьшее значение ui полагают равным , а наибольшее – , эта замена производится для того, чтобы сумма теоретических частот была равной объему выборки. Далее вычисляют вероятность попадания СВ Х, распределенной по нормальному закону с параметрами и , в частичные интервалы по формуле

После того как будут найдены находим теоретические частоты для каждого частичного интервала по формуле , где – теоретическая частота i-го интервала. Между теоретическими и эмпирическими частотами могут быть расхождения. Замену эмпирических частот теоретическими называют выравниванием частот статистического ряда.
Составим табл. 8 для вычисления теоретических частот СВ Х.
Для примера вычислений найдем вероятность того , что СВ Х попадет в первый частичный интервал , эта вероятность равна 
. Аналогично находим 
и т.д. Для вычисления значений функции Ф использовано приложение 1. После этого вычисляют теоретические частоты , например, и т.д. Сумма теоретических частот должно быть равна объему выборки, т.е. . Далее находим значение выборочной статистики или это есть наблюдаемое значение критерия . Затем по таблицам квантилей распределения , по уровню значимости =0,05 и числу степеней свободы (где k – число частичных интервалов, r – число параметров предполагаемого закона распределения СВ X) находят критическое значение , удовлетворяющее условию . При использовании критерия необходимо, чтобы в каждом частичном интервале было не менее 5 элементов. Если же число элементов менее 5, рекомендуется соседние интервалы объединять в один (как это сделано в табл.9). Уменьшенное число частичных интервалов учитывается при нахождении числа степеней свободы .
Составим табл. 9 для вычисления .
Т а б л и ц а 9. Вычисление выборочной статистики CВ Х
Интервалы
наблюдаемых значе-
ний СВ Х
| Эмпирические
частоты
| Теоретические
частоты
|
|
|
| 0,465–0,675
0,675–0,885
0,885–1,095
1,095–1,305
1,305–1,515
1,515–1,725
1,725–1,935
|
3 17
| 4,75
20,33
15,58
30,07
29,55
15,40
4,06 20,05
0,59
|
– 1,33
7,93
– 3,55
– 3,05
|
1,7689
62,8849
12,6025
9,3025
|
0,0870
2,0913
0,4264
0,4640
|
Сумма
|
|
|
|
|
Т а б л и ц а 8. Вычисление теоретических частот СВ Х
Интервалы наблюденных значений
СВ Х
| Частоты
mi
| Начало
интервала
| Конец
интервала
|
|
|
|
|
|
Теоретические частоты
| 0,465–0,675
|
|
0,465
|
0,675
|
–
|
– 1,67
|
– 0,5
|
–0,4525
|
0,0475
|
4,75
| 0,675–0,885
|
|
0,675
|
0,885
|
– 1,67
|
– 0,83
|
– 0,4525
|
–0,2967
|
0,1558
|
15,58
| 0,885–1,095
|
|
0,885
|
1,095
|
– 0,83
|
0,01
|
– 0,2967
|
–0,0040
|
0,3007
|
30,07
| 1,095–1,305
|
|
1,095
|
1,305
|
0,01
|
0,84
|
0,0040
|
0,2995
|
0,2955
|
29,55
| 1,305–1,515
|
|
1,305
|
1,515
|
0,84
|
1,68
|
0,2995
|
0,4535
|
0,1540
|
15,40
| 1,515–1,725
|
|
1,515
|
1,725
|
1,68
|
2,52
|
0,4535
|
0,4941
|
0,0406
|
4,06
| 1,725–1,935
|
|
1,725
|
1,935
|
2,52
|
+
|
0,4941
|
0,5
|
0,0059
|
0,59
|
Сумма
|
|
|
|
|
|
|
|
|
|
Число степеней свободы По таблице квантилей (приложение 2) по уровню значимости и числу степеней свободы находим критическое значение Так как то нет оснований для отклонения гипотезы о нормальном законе распределения СВХ. Другими словами расхождения между эмпирическими и теоретическими частотами являются незначительными, т.е. случайными и предположение о распределении СВ Х по нормальному закону вполне согласуется с эмпирическим распределением выборки.
На рис.5 построены нормальная кривая по найденным теоретическим частотам и полигон эмпирических (наблюдаемых) частот.
4. Доверительный интервал для оценки математического ожидания случайной величины Х, распределенной по нормальному закону, (при n 30) находят по формуле

где квантили нормального распределения находят по таблицам функции Лапласа (приложение 1) из условия – доверительная вероятность, в нашем случае или и Точность оценки математического ожидания (предельная погрешность) есть . Вычислим предельную погрешность Искомый доверительный интервал, накрывающий математическое ожидания СВ Х, равен


Рис. 5.
Смысл полученного результата таков: если будет произведено достаточно большое число выборок по 100 значений СВ Х – стоимости основных производственных фондов, то в 95% из них доверительный интервал накроет математическое ожидание СВ Х и только в 5% случаев математическое ожидание может выйти за границы доверительного интервала.
Аналогичным образом выполним это задание для СВ У – стоимость валовой продукции (у. е /га).
1. По виду гистограммы и полигона частостей, а также по значению выборочных коэффициентов асимметрии и эксцесса ( выдвигаем гипотезу о том, что закон распределения СВ У является нормальным.
2. Плотность вероятности предполагаемого нормального закона распределения имеет вид

Функция распределения нормального закона для СВ У есть .
3. Вычислим теоретические частоты нормального распределения СВ У для проверки согласия эмпирической функции распределения с теоретической (табл.10).
Далее составим табл. 11 для нахождения выборочной статистики СВ У.
Число степеней свободы . По таблице (приложение 2 ) по уровню значимости находим критическое значение . Так, как , то нет оснований для отклонения гипотезы о нормальном законе распределения СВ У.
На рис. 6 построены эмпирическая и теоретическая кривые распределения.
4. Для нахождения доверительного интервала для оценки математического ожидания СВ У вычислим предельную погрешность , тогда доверительный интервал равен или .

Рис. 6.
Т а б л и ц а 11. Вычисление выборочной статистики СВ У
Интервалы
наблюдаемых значе-
ний СВ У
| Эмпирические
частоты
| Теоретические
частоты
|
|
|
|
0,39–0,61
0,61–0,83
0,83–1,05
1,05–1,27
1,27–1,49
1,49–1,71
1,71–1,93
|
3 13
|
14,01
22,68
29,22
21,79
9,49
2,42 12,3
0,39
|
– 0,1
3,32
– 0,22
– 3,79
0,7
|
0,01
11,0224
0,0484
14,3641
0,49
|
0,0007
0,4860
0,0017
0,6592
0,0398
|
Cумма
|
|
|
|
|
Задание 3. КОРРЕЛЯЦИЯ
1. По результатам задания 1 составить корреляционную таблицу.
2. Найти условные средние , построить точки , и по характеру их расположения подобрать вид функций регрессии.
3. Найти выборочный коэффициент корреляции и сделать вывод о силе корреляционной связи.
4. Найти доверительный интервал, накрывающий коэффициент корреляции генеральной совокупности с заданной доверительной вероятностью .
5. Найти уравнения линий регрессии х на у и у на х и построить их.
Решение типового варианта
Методику выполнения этого задания покажем на примере статистических данных табл.1, где СВ Х – стоимость основных производст-
венных фондов (у. е /га), СВ У – стоимость валовой продукции (у.е/га).
1. Для составления корреляционной таблицы воспользуемся разбиением СВ Х и У на частичные интервалы (табл. 2 и 5). Сделаем подсчет частот системы СВ Х и У, рассматривая каждую пару значений табл.1. Например, первая пара (0,73; 0,60) попадает во вторую строку и первый столбец табл.8 и отмечается черточкой. Вторая пара значений (0,82; 0,61) попадает также во вторую строку и первый столбец, причем, значение 0,61 совпадает с концами интервалов 0,39–0,61 и 0,61–0,83; будем относить это число к тому интервалу, где наблюдается совпадение с правым концом, т.е. к интервалу 0,39–0,61. Третья пара (0,89; 0,95) – третья строка и третий столбец. Таким образом просматриваем все 100 пар значений системы СВ Х и У. В результате получим табл. 12.
Т а б л и ц а 12 .Подсчет частот системы СВ Х и У
У
Х
|
0,39–0,61
|
0,61–0,83
|
0,83–1,05
|
1,05–1,27
|
1,27–1,49
|
1,49–1,71
|
1,71–1,93
|
| 0,465–0,675
|
| I
|
|
|
|
|
|
| 0,675–0,885
| IIIIIIII
| IIIIII
| III
| I
|
|
|
|
| 0,885–1,095
| IIIIII
| IIIIIIIII
IIIIII
| IIIIIIIII
IIII
| III
| I
|
|
|
| 1,095–1,305
|
| IIII
| IIIIIIIIII
| IIIIIIIII
| II
| I
|
|
| 1,305–1,515
|
|
| II
| III
| IIII
| II
|
|
| 1,515–1,725
|
|
|
|
| II
|
| I
|
| 1,725–1,935
|
|
| I
| II
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для дальнейших расчетов нужны будут середины интервалов, которые запишем под частичными интервалами.
Т а б л и ц а 10. Вычисление теоретических частот СВ У
Интервалы наблюденных значений
СВ У
|
Частоты
mi
| Начало ин-
тервала
| Конец
интер-вала
|
|
|
|
|
| Теоретичес
кие час-
тоты
|
0,39–0,61
|
|
0,39
|
0,61
|
–
|
– 1,8
|
–0,5
|
–0,3599
|
0,1401
|
14,01
|
0,61–0,83
|
|
0,61
|
0,83
|
– 1,08
|
– 0,34
|
–0,3599
|
–0,1331
|
0,2268
|
22,68
|
0,83–1,05
|
|
0,83
|
1,05
|
– 0,34
|
0,41
|
–0,1331
|
0,1591
|
0,2922
|
29,22
|
1,05–1,27
|
|
1,05
|
1,27
|
0,41
|
1,16
|
0,1591
|
0,3770
|
0,2179
|
21,79
|
1,27–1,49
|
|
1,27
|
1,49
|
1,16
|
1,91
|
0,3770
|
0,4719
|
0,0949
|
9,49
|
1,49–1,71
|
|
1,49
|
1,71
|
1,91
|
2,66
|
0,4719
|
0,4961
|
0,0242
|
2,42
|
1,71–1,93
|
|
1,71
|
1,93
|
2,66
|
+
|
0,4961
|
0,5
|
0,0039
|
0,39
|
Сумма
|
|
|
|
|
|
|
|
|
|
В столбце табл.13 записаны суммы частот по строкам, а в строке – суммы частот по столбцам. , где n – объем выборки.
2. Находим условные средние по формуле
;
;
;
Т а б л и ц а 13. Корреляционная таблица системы СВ Х и У
У
Х
| 0,39–
0,61
0,50
|
0,61–
0,83
0,72
|
0,83–
1,05
0,94
| 1,05–
1,27
1,16
| 1,27–
1,491,38
|
1,49–
1,71
1,60
|
1,71–1,93
1,82
|
| 0,465–0,675
0,57
|
|
|
|
|
|
|
|
| 0,675–0,885
0,78
|
|
|
|
|
|
|
|
| 0,885–1,095
0,99
|
|
|
|
|
|
|
|
| 1,095–1,305
1,20
|
|
|
|
|
|
|
|
| 1,305–1,515
1,41
|
|
|
|
|
|
|
|
| 1,515–1,725
1,62
|
|
|
|
|
|
|
|
| 1,725–1,935
1,83
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
;
;
;
;
.
Результаты вычислений заносим в табл. 14.
Т а б л и ц а 14 . Условные средние 
| 0,50
| 0,72
| 0,94
| 1,16
| 1,38
| 1,60
| 1,82
|
| 0,87
| 0,96
| 1,10
| 1,25
| 1,36
| 1,34
| 1,62
|
Каждая пара значений представляет координаты точки. Построив эти точки в системе координат xoy, по их расположению делаем вывод о виде функции регрессии. Из чертежа видно, что расположение точек близко к прямой линии, поэтому можно считать, что зависимость х на у является линейной.
Аналогично находим условные средние по формуле
; ;
;
;
;
;
;
.
Результаты вычислений поместим в табл.15.
Т а б л и ц а 15. Условные средние
| 0,57
| 0,78
| 0,99
| 1,20
| 1,41
| 1,62
| 1,83
|
| 0,72
| 0,68
| 0,81
| 1,04
| 1,28
| 1,58
| 1,09
|
Точки построим на предыдущем чертеже и по их расположению делаем вывод о линейной зависимости у на х. Значит линии регрессии представляют собой прямые (рис.7).
3. Выборочный коэффициент корреляции находим по формуле
,
где из расчетов задания 1 известно, что , , , .
Остается найти . Воспользуемся корреляционной табл.13 и формулой



Рис. 7.
Выборочный коэффициент корреляции

По знаку и величине коэффициента корреляции делаем вывод о связи между СВ X и У: прямая линейная корреляционная зависимость, средняя связь.
Квадрат коэффициента корреляции называется коэффициентом детерминации, который показывает процент влияния СВ X на СВ У.
В нашем случае коэффициент детерминации равен
.
Вывод: примерно 42% составляет влияние стоимости основных производственных фондов на стоимость валовой продукции. Остальные 58% обусловлены влиянием других факторов.
4. Доверительный интервал для коэффициента корреляции генеральной совокупности с заданной доверительной вероятностью находится по формуле
где находится, используя функцию Лапласа: , т.е. 0,95=Ф(t0,95). По значению функции Лапласа 0,95, по приложению 1 находим значение t0,95 = 1,96.
Подставим имеющиеся данные в формулу доверительного интервала: имеем .
В результате вычислений получим доверительный интервал .
Вывод: если рассматривать большое число выборок системы СВ Х и У и для каждой из них найти коэффициент корреляции , то примерно в 95% из них доверительный интервал накроет коэффициент корреляции генеральной совокупности и только в 5% случаев может выйти за границы этого интервала.
5. Найдем линейные уравнения функций регрессии. Уравнение регрессии у на х имеет вид: Подставляем имеющиеся данные: имеем
преобразуя, получим 
Аналогично составим уравнение регрессии x на y. 



Построим эти прямые на чертеже (рис.7), учитывая, что они проходят через точку 
Читайте также: Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ...
©2015-2020 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (326)
|
Почему 1285321 студент выбрали МегаОбучалку...
Система поиска информации
Мобильная версия сайта
Удобная навигация
Нет шокирующей рекламы
|