Моделирование ряда распределения

2019-12-29

211

Обсуждений (0)

0.00 из 5.00 0 оценок

123

Нормальное распределение важно по многим причинам. Распределение многих статистик является нормальным или может быть получено из нормальных с помощью некоторых преобразований. Рассуждая философски, можно сказать, что нормальное распределение представляет собой одну из эмпирически проверенных истин относительно общей природы действительности и его положение может рассматриваться как один из фундаментальных законов природы.

Выдвинем гипотезу о том, что распределение в совокупности подчиняется нормальному закону. Воспользуемся для проверки гипотезы критерием согласия Пирсона, для чего возьмем за основу вариационный ряд, составленный ранее. Для расчетов понадобятся значения средней величины (27,1), среднего квадратического отклонения (14,23) и длина интервала (9). Дополним ряд так, чтобы получилась следующая таблица:

X`j	Интервал			t
4,5	0	9	5	-1,59	0,1127	6	0,1667
13,5	9	18	16	-0,96	0,2516	14	0,2857
22,5	18	27	32	-0,32	0,3790	21	5,7619
31,5	27	36	18	0,31	0,3802	21	0,4286
40,5	36	45	8	0,94	0,2565	14	2,5714
49,5	45	54	2	1,57	0,1163	6	2,6667
58,5	54	63	4	2,21	0,0347	2	2,0000
67,5	63	72	3	2,84	0,0071	0	ошибка деления на ноль

Таблица 4 –Моделирование ряла распределения

Видно, что для последнего интервала округленная теоретическая частота, то есть частота, которая должна быть при нормальном распределении, статистически незначима. Для интервала 54-63 теоретическая частота равна 2, что тоже достаточно невысокий показатель. Объединим последние три интервала в один. Получим интервал 45-72 с длиной, равной 27. Необходимо также пересчитать среднее значение и среднее квадратическое отклонение. Они равны соответственно 27 и 13,84.

X`j	Интервал			t
4,5	0	9	5	-1,63	0,1057	6	0,1667
13,5	9	18	16	-0,98	0,2468	14	0,2857
22,5	18	27	32	-0,33	0,3778	22	4,5455
31,5	27	36	18	0,33	0,3778	22	0,7273
40,5	36	45	8	0,98	0,2468	14	2,5714
58,5	45	72	9	2,28	0,0297	5	3,2
Итого	Х	Х	Х	Х	Х	Х	11,4965

Таблица 5 – моделирование ряда распределения после объединения интервалов

В данном ряду нет статистически незначимых частот, поэтому можно приступать к определению χ². Предельное значение, определяющее условия отклонения гипотезы о нормальном характере распределения, для уровня значимости=0,05 при степени свободы=3 равно 7,815. Эмпирическое же значение равно 11,5. Так как теоретическое значение меньше полученного на практике, то гипотеза о нормальном законе распределения отвергается. Имеет место выраженная правосторонняя асимметрия со смещением в область более низких значений.

Оценка параметров генеральной совокупности на основе выборочных данных

В реальных условиях для наблюдения какого-то признака практически никогда не анализируется вся совокупность в целом. Вместо этого применяют выборочное наблюдение, то есть статистическому обследованию подвергаются определенным образом отобранные единицы изучаемой совокупности. Целью выборочного наблюдения является характеристика всей совокупности единиц по обследуемой части, при условии соблюдения всех правил и принципов статистического наблюдения. Это позволяет сэкономить материальные, трудовые ресурсы, время, дает возможность более детально и подробно изучить отдельные единицы статистической совокупности и их группы.

Для проведения выборочного наблюдения необходимо определить способ отбора и тип выборки. В данном конкретном случае считаю оптимальным применение бесповторной собственно случайной выборки методом жеребьевки, так как единицы наблюдаемой совокупности не упорядочены и с равной вероятностью могут попасть в выборку.

Выборка 54 регионов

Из 88 регионов выберем 54. Выбранные единицы представлены в Приложении В.

Рассчитаем выборочную среднюю для совокупности. Вследствие отсутствия весов рассчитывается как простая арифметическая средняя. Она равна 27,07%. Вычислим предельную ошибку средней с помощью коэффициента доверия для вероятностей 0,760, 0,860, 0,880 и 0,960.

Вероятность	Предельная ошибка
0,76	6,05
0,86	6,68
0,88	6,80
0,96	7,25

Таблица 6 – Предельные ошибки

Необходимо отметить, что используемая для расчета предельной ошибки средней дисперсия генеральной совокупности вычисляется из выборочной дисперсии путем ее умножения на величину n/(n-1), где n – размер выборочной совокупности. В нашем случае этот коэффициент равен 54/53.

В результате получаем следующие доверительные интервалы генеральной средней:

Таблица 7 – Доверительные интервалы генеральной средней

Вероятность	Интервал
0,76	21,02 - 33,12
0,86	20,39 - 33,75
0,88	20,27 - 33,86
0,96	19,81 - 34,32

Выборка 24 региона

Выберем 24 региона из совокупности (Приложение Г). Рассчитаем среднее значение выборки как среднюю арифметическую величину. Оно равно 29,14%.

Так как количество единиц в выборке меньше 30, то она относится к малым. Следовательно, расчет предельной средней необходимо проводить по правилам малой выборки.

Здесь используется критерий доверия Стьюдента. Также необходимо отметить, что применяется выборочная, а не генеральная дисперсия, и коэффициент корректировки на бесповторность. Получаем следующие предельные ошибки:

Степень значимости	Предельная ошибка
0,24	3,43
0,14	4,45
0,12	4,45
0,04	6,49

Таблица 8 – предельные ошибки малой выборки

Коэффициент корректировки на бесповторность равен 64/87. Число степеней свободы равно 23. Значение коэффициента доверия Стьюдента выбирается по соответствующей таблице.

Доверительные интервалы в малой выборке имеют вид:

Степень значимости	Интервал
0,24	25,72 - 32,57
0,14	24,69 - 33,59
0,12	25,69 - 33,59
0,04	22,65 - 35, 63

Значение генеральной средней равно 27,1%. Для всех предложенных вероятностей оно попадает в доверительный интервал, рассчитанный как для малой, так и для большой выборки. Однако, на мой взгляд, к таким результатам привели большие значения предельных ошибок, которые в свою очередь зависят от дисперсии. Но формально можно считать обе выборки достаточно результативными.

Анализ динамики

Проанализируем динамику показателя «Среднедушевой доход в месяц, руб.», по Центральному федеральному округу за 2000-2004 годы. Построим ряд динамики:

Год	2000	2001	2002	2003	2004
Значение	3230,6	4299,6	5435,6	7211,3	8999,5

Таблица 9 – Среднедушевые доходы населения по Центральному федеральному округу в месяц, руб.

Необходимо отметить, что ряд является интервальным и равномерным. Показатели в каждом интервале полностью сопоставимы по единицам измерения и территории.

2019-12-29

211

Обсуждений (0)

0.00 из 5.00 0 оценок

123

Обсуждение в статье: Моделирование ряда распределения

Обсуждений еще не было, будьте первым... ↓↓↓