Кривые распределения. Критерии согласия
Кривая распределения – кривая линия, которая отражает закономерность изменения частот в чистом, исключающем влияние случайных факторов виде. Теоретическая кривая распределения - кривая, выражающая общую закономерность данного типа распределения в чистом виде, исключающем влияние случайных факторов. Закономерности распределения - закономерности изменения частот в вариационных рядах. Нормальное распределение выражается следующей стандартизированной кривой нормального распределения: , где yt - ордината кривой нормального распределения; - стандартизированная (нормированная) величина; e и π – математические постоянные.
В статистической практике большой интерес представляет решение вопроса о том, в какой мере можно считать полученное в результате статистического наблюдения распределение признака в исследуемой совокупности, соответствующее нормальному распределению. Для решения этого вопроса следует рассчитать теоретические частоты нормального распределения, т.е. те частоты, которые были бы, если бы данное распределение в точности следовало закону нормального распределения. Для расчета теоретических частот применяется следующая формула: , величина определяется по специальной таблице (Приложение 1). Следовательно, в зависимости от величины t для каждого интервала эмпирического ряда определяются теоретические частоты. Степень расхождения теоретических и эмпирических частот оценивается с помощью особых показателей – критериев согласия, с помощью которых проверяется гипотеза о законе распределения. Наиболее распространенным является критерий согласияК. Пирсона χ2 ("хи- квадрат"), исчисляемый по формуле: , где f - эмпирические частоты (частости) в интервале; f´- теоретические частоты (частости) в интервале.
Полученное значение критерия (χ²расч) сравнивается с табличным значением (χ²табл). Последнее определяется по специальной таблице (Приложение 2) в зависимости от принятой вероятности (Р) и числа степеней свободы k (для нормального распределения k равно числу групп в ряду распределения минус 3). Если χ²расч £ χ²табл , то гипотеза о близости эмпирического распределения к нормальному не отвергается.
При расчете критерия Пирсона необходимо соблюдать условия: число наблюдений должно быть достаточно велико (п ³ 50); если теоретические частоты в некоторых интервалах меньше 5, то интервалы объединяют так, чтобы частоты были больше 5. Используя величину χ²,В.И. Романовский предложил оценивать близость эмпирического распределения кривой нормального распределения по отношению: , где k - число групп; (k – 3) - число степеней свободы при исчислении частот нормального распределения. Если < 3, то можно принять гипотезу о нормальном характере эмпирического распределения.
Распространенным критерием согласия является критерий А.И. Колмогорова (l): , где D - максимальное значение разности между накопленными эмпирическими и теоретическими частотами; - сумма эмпирических частот. По таблице значений вероятностей l-критерия находят соответствующую вероятность (Р). Приведем краткую выдержку из таблицы значений функции k(l) А.Н. Колмогорова:
Если найденной величине l соответствует значительная по величине вероятность (Р), то расхождения между эмпирическим и теоретическим распределениями несущественны и рассматриваемое распределение следует закону нормального распределения.
Практическое и научное значение имеет распределениеПуассона. Оно характерно для редко встречающихся явлений, поэтому его называют "законом редких явлений" (или "законом малых чисел"). Закон Пуассона применяется для совокупностей, достаточно больших по объему (n ³ 50) и имеющих достаточно малую долю единиц, обладающих данным признаком (р £ 0,1), например, для распределения партий готовой продукции по числу забракованных изделий, печатных страниц по числу опечаток, станков по числу отказов, ткацких станков по числу обрывов нити и т. д. Теоретические частоты распределения Пуассона определяются формулой: , где n - общее число независимых испытаний; l - среднее число появления редкого события в п одинаковых независимых испытаниях; т - частота данного события (т = 0, 1, 2 ...); е - основание натуральных логарифмов, е = 1,271828. Величина е-l определяется по специальной таблице (Приложение 3); m! – произведение 1×2×3×…×m; 0! – считается равным единице.
Например. Рассмотрим построение кривой нормального распределения на примере, характеризующем распределение партий деталей по длительности производственного цикла: Таблица 5.2
Нормальное распределение определяется двумя параметрами – это средняя арифметическая и среднее квадратическое отклонение. По нашим данным =331 ч., σ = 157,25 ч. Все последующие расчеты для определения теоретических частот представлены в графах 3-8 табл.5.2. Значения граф 5 и 6 определяются по таблицам интегральной функции Лапласа (Приложение 4). 7 графа определяется разностью гр.6 – гр.5. Теоретическая частота гр.8 = . Например, для первого интервала = 0,0268·71 = 1,9 и т.д.
Расчет критерия Пирсона: при расчете нужно соблюдать следующие условия: 1) число наблюдений должно быть достаточно велико (п ³ 50); 2) если теоретические частоты в некоторых интервалах меньше 5, то интервалы объединяют так, чтобы частоты были больше 5. Воспользуемся данными примера, приведенного в табл.5.2, для расчета критерия "хи-квадрат", предварительно округлив теоретические частоты в гр.8, а также объединив частоты двух и трех последних интервалов, выполняя требование ³5. Получим частоты эмпирического и теоретического распределений, приведенные в табл.5.3. Таблица 5.3
χ²расч = 4,05.
Для проверки гипотезы о нормальности распределения число степеней свободы равно (k-3), где k – число групп. Следовательно, число степеней свободы равно: 7-3=4. Уровень значимости выбирается таким образом, что Р(χ²расч > χ²табл)=a (величина a принимается равной 0,05 или 0,01). При уровне значимости 0,05 и числе степеней свободы 4: χ²табл=9,5. Таким образом, расчетное значение критерия Пирсона не превышает табличное значение (4,05<9,5) при a =0,05, т.е. проведенный расчет дает право не отвергать гипотезу о нормальном характере эмпирического распределения. Например, по критерию Романовского: = Так как рассчитанное отношение значительно меньше 3, следует принять гипотезу о нормальности эмпирического распределения.
Популярное: Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы... Почему стероиды повышают давление?: Основных причин три... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (945)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |