Мегаобучалка Главная | О нас | Обратная связь


Моделирование ряда распределения



2019-12-29 192 Обсуждений (0)
Моделирование ряда распределения 0.00 из 5.00 0 оценок




 

Нормальное распределение важно по многим причинам. Распределение многих статистик является нормальным или может быть получено из нормальных с помощью некоторых преобразований. Рассуждая философски, можно сказать, что нормальное распределение представляет собой одну из эмпирически проверенных истин относительно общей природы действительности и его положение может рассматриваться как один из фундаментальных законов природы.

Выдвинем гипотезу о том, что распределение в совокупности подчиняется нормальному закону. Воспользуемся для проверки гипотезы критерием согласия Пирсона, для чего возьмем за основу вариационный ряд, составленный ранее. Для расчетов понадобятся значения средней величины (27,1), среднего квадратического отклонения (14,23) и длина интервала (9). Дополним ряд так, чтобы получилась следующая таблица:

 

X`j

Интервал

 

t

 

 

 

4,5

0

9

5

-1,59

0,1127

6

0,1667

13,5

9

18

16

-0,96

0,2516

14

0,2857

22,5

18

27

32

-0,32

0,3790

21

5,7619

31,5

27

36

18

0,31

0,3802

21

0,4286

40,5

36

45

8

0,94

0,2565

14

2,5714

49,5

45

54

2

1,57

0,1163

6

2,6667

58,5

54

63

4

2,21

0,0347

2

2,0000

67,5

63

72

3

2,84

0,0071

0

ошибка деления на ноль

Таблица 4 –Моделирование ряла распределения

 

Видно, что для последнего интервала округленная теоретическая частота, то есть частота, которая должна быть при нормальном распределении, статистически незначима. Для интервала 54-63 теоретическая частота равна 2, что тоже достаточно невысокий показатель. Объединим последние три интервала в один. Получим интервал 45-72 с длиной, равной 27. Необходимо также пересчитать среднее значение и среднее квадратическое отклонение. Они равны соответственно 27 и 13,84.

 

X`j

Интервал

 

t

 

 

 

4,5

0

9

5

-1,63

0,1057

6

0,1667

13,5

9

18

16

-0,98

0,2468

14

0,2857

22,5

18

27

32

-0,33

0,3778

22

4,5455

31,5

27

36

18

0,33

0,3778

22

0,7273

40,5

36

45

8

0,98

0,2468

14

2,5714

58,5

45

72

9

2,28

0,0297

5

3,2

Итого

Х

Х

Х

Х

Х

Х

11,4965

Таблица 5 – моделирование ряда распределения после объединения интервалов


В данном ряду нет статистически незначимых частот, поэтому можно приступать к определению χ2. Предельное значение, определяющее условия отклонения гипотезы о нормальном характере распределения, для уровня значимости=0,05 при степени свободы=3 равно 7,815. Эмпирическое же значение равно 11,5. Так как теоретическое значение меньше полученного на практике, то гипотеза о нормальном законе распределения отвергается. Имеет место выраженная правосторонняя асимметрия со смещением в область более низких значений.

Оценка параметров генеральной совокупности на основе выборочных данных

 

В реальных условиях для наблюдения какого-то признака практически никогда не анализируется вся совокупность в целом. Вместо этого применяют выборочное наблюдение, то есть статистическому обследованию подвергаются определенным образом отобранные единицы изучаемой совокупности. Целью выборочного наблюдения является характеристика всей совокупности единиц по обследуемой части, при условии соблюдения всех правил и принципов статистического наблюдения. Это позволяет сэкономить материальные, трудовые ресурсы, время, дает возможность более детально и подробно изучить отдельные единицы статистической совокупности и их группы.

Для проведения выборочного наблюдения необходимо определить способ отбора и тип выборки. В данном конкретном случае считаю оптимальным применение бесповторной собственно случайной выборки методом жеребьевки, так как единицы наблюдаемой совокупности не упорядочены и с равной вероятностью могут попасть в выборку.


Выборка 54 регионов

 

Из 88 регионов выберем 54. Выбранные единицы представлены в Приложении В.

Рассчитаем выборочную среднюю для совокупности. Вследствие отсутствия весов рассчитывается как простая арифметическая средняя. Она равна 27,07%. Вычислим предельную ошибку средней с помощью коэффициента доверия для вероятностей 0,760, 0,860, 0,880 и 0,960.

 

Вероятность Предельная ошибка

0,76

6,05

0,86

6,68

0,88

6,80

0,96

7,25

Таблица 6 – Предельные ошибки

 

Необходимо отметить, что используемая для расчета предельной ошибки средней дисперсия генеральной совокупности вычисляется из выборочной дисперсии путем ее умножения на величину n/(n-1), где n – размер выборочной совокупности. В нашем случае этот коэффициент равен 54/53.

В результате получаем следующие доверительные интервалы генеральной средней:

 

Таблица 7 – Доверительные интервалы генеральной средней

Вероятность Интервал

0,76

21,02 - 33,12

0,86

20,39 - 33,75

0,88

20,27 - 33,86

0,96

19,81 - 34,32


Выборка 24 региона

 

Выберем 24 региона из совокупности (Приложение Г). Рассчитаем среднее значение выборки как среднюю арифметическую величину. Оно равно 29,14%.

Так как количество единиц в выборке меньше 30, то она относится к малым. Следовательно, расчет предельной средней необходимо проводить по правилам малой выборки.

Здесь используется критерий доверия Стьюдента. Также необходимо отметить, что применяется выборочная, а не генеральная дисперсия, и коэффициент корректировки на бесповторность. Получаем следующие предельные ошибки:

 

Степень значимости Предельная ошибка

0,24

3,43

0,14

4,45

0,12

4,45

0,04

6,49

Таблица 8 – предельные ошибки малой выборки

 

Коэффициент корректировки на бесповторность равен 64/87. Число степеней свободы равно 23. Значение коэффициента доверия Стьюдента выбирается по соответствующей таблице.

 

Доверительные интервалы в малой выборке имеют вид:

Степень значимости Интервал

0,24

25,72 - 32,57

0,14

24,69 - 33,59

0,12

25,69 - 33,59

0,04

22,65 - 35, 63

 

Значение генеральной средней равно 27,1%. Для всех предложенных вероятностей оно попадает в доверительный интервал, рассчитанный как для малой, так и для большой выборки. Однако, на мой взгляд, к таким результатам привели большие значения предельных ошибок, которые в свою очередь зависят от дисперсии. Но формально можно считать обе выборки достаточно результативными.

Анализ динамики

 

Проанализируем динамику показателя «Среднедушевой доход в месяц, руб.», по Центральному федеральному округу за 2000-2004 годы. Построим ряд динамики:

 

Год

2000

2001

2002

2003

2004

Значение

3230,6

4299,6

5435,6

7211,3

8999,5

Таблица 9 – Среднедушевые доходы населения по Центральному федеральному округу в месяц, руб.

 

Необходимо отметить, что ряд является интервальным и равномерным. Показатели в каждом интервале полностью сопоставимы по единицам измерения и территории.



2019-12-29 192 Обсуждений (0)
Моделирование ряда распределения 0.00 из 5.00 0 оценок









Обсуждение в статье: Моделирование ряда распределения

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Личность ребенка как объект и субъект в образовательной технологии: В настоящее время в России идет становление новой системы образования, ориентированного на вхождение...
Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе...
Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (192)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.005 сек.)