Задание 2. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
1. По результатам задания 1 по виду гистограммы и полигона частостей, а также по значению выборочных коэффициентов асимметрии и эксцесса сделать предварительный выбор закона распределения СВ Х и У. 2. Найти точечные оценки параметров нормального распределения, записать для него функцию плотности вероятности f(x) (f(y)) и функцию распределения F(x) (F(y)). 3. Найти теоретические частоты нормального распределения. Проверить согласие эмпирической функции распределения с теоретической, используя критерий согласия Пирсона для СВ Х и У. Построить эмпирические и теоретические кривые распределения.
Т а б л и ц а 7. Вычисление числовых характеристик СВ У
4. Найти доверительный интервал для оценки математического ожидания нормального распределения (доверительную вероятность принять 1-a=0,95). Решение типового варианта Методику выполнения этого задания покажем на результатах задания 1. 1. По виду гистограммы и полигона частостей (напоминают нормальную кривую), а также по значению выборочных коэффициентов асимметрии и эксцесса (Аs(X)=0,749, , они близки к нулю), предполагая, что СВ Х – стоимость основных производственных фондов изменяется под влиянием большого числа факторов, примерно равнозначных по силе влияния, можно выдвинуть гипотезу о том, что закон распределения СВ Х является нормальным. 2. Плотность вероятности нормального закона распределения имеет вид , или Точечными оценками параметров а и s нормального закона распределения служат средняя выборочная и среднее выборочное квадратическое отклонение , вычисленные ранее, т.е. , =0,251. Следовательно, плотность вероятности предполагаемого нормального закона распределения имеет вид , или . Функция распределения предполагаемого нормального закона
. Используя нормированную функцию Лапласа , функцию распределения нормального закона записывают в виде , в нашем случае эта функция есть , ее называют теоретической функцией распределения. 3. Проведем проверку гипотезы о нормальном законе распределения СВ Х, используя критерий согласия Пирсона . Для удобства вычислений интервалы наблюденных значений нормируют, т.е. выражают их в единицах среднего квадратического отклонения : , причем наименьшее значение ui полагают равным , а наибольшее – , эта замена производится для того, чтобы сумма теоретических частот была равной объему выборки. Далее вычисляют вероятность попадания СВ Х, распределенной по нормальному закону с параметрами и , в частичные интервалы по формуле После того как будут найдены находим теоретические частоты для каждого частичного интервала по формуле , где – теоретическая частота i-го интервала. Между теоретическими и эмпирическими частотами могут быть расхождения. Замену эмпирических частот теоретическими называют выравниванием частот статистического ряда. Составим табл. 8 для вычисления теоретических частот СВ Х. Для примера вычислений найдем вероятность того , что СВ Х попадет в первый частичный интервал , эта вероятность равна . Аналогично находим и т.д. Для вычисления значений функции Ф использовано приложение 1. После этого вычисляют теоретические частоты , например, и т.д. Сумма теоретических частот должно быть равна объему выборки, т.е. . Далее находим значение выборочной статистики или это есть наблюдаемое значение критерия . Затем по таблицам квантилей распределения , по уровню значимости =0,05 и числу степеней свободы (где k – число частичных интервалов, r – число параметров предполагаемого закона распределения СВ X) находят критическое значение , удовлетворяющее условию . При использовании критерия необходимо, чтобы в каждом частичном интервале было не менее 5 элементов. Если же число элементов менее 5, рекомендуется соседние интервалы объединять в один (как это сделано в табл.9). Уменьшенное число частичных интервалов учитывается при нахождении числа степеней свободы . Составим табл. 9 для вычисления . Т а б л и ц а 9. Вычисление выборочной статистики CВ Х
Т а б л и ц а 8. Вычисление теоретических частот СВ Х
Число степеней свободы По таблице квантилей (приложение 2) по уровню значимости и числу степеней свободы находим критическое значение Так как то нет оснований для отклонения гипотезы о нормальном законе распределения СВХ. Другими словами расхождения между эмпирическими и теоретическими частотами являются незначительными, т.е. случайными и предположение о распределении СВ Х по нормальному закону вполне согласуется с эмпирическим распределением выборки. На рис.5 построены нормальная кривая по найденным теоретическим частотам и полигон эмпирических (наблюдаемых) частот. 4. Доверительный интервал для оценки математического ожидания случайной величины Х, распределенной по нормальному закону, (при n 30) находят по формуле где квантили нормального распределения находят по таблицам функции Лапласа (приложение 1) из условия – доверительная вероятность, в нашем случае или и Точность оценки математического ожидания (предельная погрешность) есть . Вычислим предельную погрешность Искомый доверительный интервал, накрывающий математическое ожидания СВ Х, равен
Рис. 5.
Смысл полученного результата таков: если будет произведено достаточно большое число выборок по 100 значений СВ Х – стоимости основных производственных фондов, то в 95% из них доверительный интервал накроет математическое ожидание СВ Х и только в 5% случаев математическое ожидание может выйти за границы доверительного интервала. Аналогичным образом выполним это задание для СВ У – стоимость валовой продукции (у. е /га). 1. По виду гистограммы и полигона частостей, а также по значению выборочных коэффициентов асимметрии и эксцесса ( выдвигаем гипотезу о том, что закон распределения СВ У является нормальным. 2. Плотность вероятности предполагаемого нормального закона распределения имеет вид Функция распределения нормального закона для СВ У есть . 3. Вычислим теоретические частоты нормального распределения СВ У для проверки согласия эмпирической функции распределения с теоретической (табл.10). Далее составим табл. 11 для нахождения выборочной статистики СВ У. Число степеней свободы . По таблице (приложение 2 ) по уровню значимости находим критическое значение . Так, как , то нет оснований для отклонения гипотезы о нормальном законе распределения СВ У. На рис. 6 построены эмпирическая и теоретическая кривые распределения. 4. Для нахождения доверительного интервала для оценки математического ожидания СВ У вычислим предельную погрешность , тогда доверительный интервал равен или .
Рис. 6.
Т а б л и ц а 11. Вычисление выборочной статистики СВ У
Задание 3. КОРРЕЛЯЦИЯ
1. По результатам задания 1 составить корреляционную таблицу. 2. Найти условные средние , построить точки , и по характеру их расположения подобрать вид функций регрессии. 3. Найти выборочный коэффициент корреляции и сделать вывод о силе корреляционной связи. 4. Найти доверительный интервал, накрывающий коэффициент корреляции генеральной совокупности с заданной доверительной вероятностью . 5. Найти уравнения линий регрессии х на у и у на х и построить их. Решение типового варианта
Методику выполнения этого задания покажем на примере статистических данных табл.1, где СВ Х – стоимость основных производст- венных фондов (у. е /га), СВ У – стоимость валовой продукции (у.е/га). 1. Для составления корреляционной таблицы воспользуемся разбиением СВ Х и У на частичные интервалы (табл. 2 и 5). Сделаем подсчет частот системы СВ Х и У, рассматривая каждую пару значений табл.1. Например, первая пара (0,73; 0,60) попадает во вторую строку и первый столбец табл.8 и отмечается черточкой. Вторая пара значений (0,82; 0,61) попадает также во вторую строку и первый столбец, причем, значение 0,61 совпадает с концами интервалов 0,39–0,61 и 0,61–0,83; будем относить это число к тому интервалу, где наблюдается совпадение с правым концом, т.е. к интервалу 0,39–0,61. Третья пара (0,89; 0,95) – третья строка и третий столбец. Таким образом просматриваем все 100 пар значений системы СВ Х и У. В результате получим табл. 12.
Т а б л и ц а 12 .Подсчет частот системы СВ Х и У
Для дальнейших расчетов нужны будут середины интервалов, которые запишем под частичными интервалами.
Т а б л и ц а 10. Вычисление теоретических частот СВ У
В столбце табл.13 записаны суммы частот по строкам, а в строке – суммы частот по столбцам. , где n – объем выборки. 2. Находим условные средние по формуле ; ; ;
Т а б л и ц а 13. Корреляционная таблица системы СВ Х и У
; ; ; ; . Результаты вычислений заносим в табл. 14.
Т а б л и ц а 14 . Условные средние
Каждая пара значений представляет координаты точки. Построив эти точки в системе координат xoy, по их расположению делаем вывод о виде функции регрессии. Из чертежа видно, что расположение точек близко к прямой линии, поэтому можно считать, что зависимость х на у является линейной. Аналогично находим условные средние по формуле ; ; ; ; ; ; ; . Результаты вычислений поместим в табл.15. Т а б л и ц а 15. Условные средние
Точки построим на предыдущем чертеже и по их расположению делаем вывод о линейной зависимости у на х. Значит линии регрессии представляют собой прямые (рис.7). 3. Выборочный коэффициент корреляции находим по формуле , где из расчетов задания 1 известно, что , , , . Остается найти . Воспользуемся корреляционной табл.13 и формулой
Рис. 7.
Выборочный коэффициент корреляции По знаку и величине коэффициента корреляции делаем вывод о связи между СВ X и У: прямая линейная корреляционная зависимость, средняя связь. Квадрат коэффициента корреляции называется коэффициентом детерминации, который показывает процент влияния СВ X на СВ У. В нашем случае коэффициент детерминации равен . Вывод: примерно 42% составляет влияние стоимости основных производственных фондов на стоимость валовой продукции. Остальные 58% обусловлены влиянием других факторов. 4. Доверительный интервал для коэффициента корреляции генеральной совокупности с заданной доверительной вероятностью находится по формуле где находится, используя функцию Лапласа: , т.е. 0,95=Ф(t0,95). По значению функции Лапласа 0,95, по приложению 1 находим значение t0,95 = 1,96. Подставим имеющиеся данные в формулу доверительного интервала: имеем . В результате вычислений получим доверительный интервал . Вывод: если рассматривать большое число выборок системы СВ Х и У и для каждой из них найти коэффициент корреляции , то примерно в 95% из них доверительный интервал накроет коэффициент корреляции генеральной совокупности и только в 5% случаев может выйти за границы этого интервала. 5. Найдем линейные уравнения функций регрессии. Уравнение регрессии у на х имеет вид: Подставляем имеющиеся данные: имеем преобразуя, получим Аналогично составим уравнение регрессии x на y. Построим эти прямые на чертеже (рис.7), учитывая, что они проходят через точку
Популярное: Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (410)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |