Мегаобучалка Главная | О нас | Обратная связь


Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ»



2015-11-27 402 Обсуждений (0)
Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ» 0.00 из 5.00 0 оценок




 

1. Постановка задачи проверки гипотез о законе рапределения

2. Критерий χ2-Пирсона

3. Критерий ω2

 

ЛИТЕРАТУРА

 

1. Морозов Ю.В. Основы высшей математики и статистики. М., «Медицина», 2004, §§ 11.1-11.6.

2. Павлушков И.В. и др. Основы высшей математики и математической статистики. М., «ГЭОТАР-Медиа», 2006, § 8.5.

 

1) Эмпирические законы распределения вероятностей имеют дискретный характер независимо от того, является ли эта величина дискретной или непрерывной. Использование такого закона в различных расчётах оказывается не всегда удобным. Поэтому возникает задача замены его неко-

торым теоретическим законом распределения, который был бы в определённом смысле близким к эмпирическому закону. Эта задача решается следующим образом. По виду гистограммы, полигона или графика эмпирической функции распределения по справочникам выбирается подходящий теоретический закон распределения и выдвигается гипотеза (H0) о том, что именно этот выбранный закон является истинным законом распределения изучаемой величины. Затем по определённому критерию близости теоретического и эмпирического законов распределений выдвинутая гипотеза принимается или отвергается. Сами критерии близости могут быть различными, поэтому истинность вы-двинутой гипотезы можно проверить различным образом.

 

2) Одним из наиболее распространённых критериев является критерий χ2-Пирсона. Вся широта эмпирического распределения разбивается на r частичных интервалов, и сравниваются вероятности попадания измеренных значений случайной величины в эти интервалы для случая эмпирического распределения и для случая теоретического распределения. В качестве меры отклонения берётся величина

 

, (1)

 

где n – объём выборки, ni – число элементов, попавших в i-й интервал, pi – вероятность попадания в i-тый интервал, вычисленная на основе теоретического распределения.

Смысл величины χ2 заключается в следующем. В качестве меры отклонения эмпирического распределения от теоретического в i-м интервале можно взять квадрат разности между эмпирической и теоретической вероятностью попадания изучаемой величины в этот интервал:

 

 

Если теперь суммировать квадраты отклонений по всем интервалам, то все отклонения будут учтены с одинаковым весом независимо от величины pi. При одном и том же абсолютном отклонении относительная величина отклонения будет тем больше, чем меньше вероятность pi. Целесообразно ввести весовые коэффициенты, обратно пропорциональные вероятностям pi. Выбор коэффициентов в виде n/pi приводит к формуле (1).

Вероятности pi вычисляются по теоретической (гипотетической) функции распределения F(x) или по соответствующей плотности f(x):

 

 

 

где zi–1 и zi – левая и правая границы i-ого интервала.

Оказывается, что если гипотеза верна, то величина χ2 распределена по закону χ2 с k = r – 1 степенями свободы. Этим фактом объясняется выбор структуры весового коэффициента. По таблицам распределения χ2 решается уравнение относительно значения χ2α :

 

, (2)

 

где α – малая величина, выбираемая в пределах 0,01 ÷ 0,1. Эта величина (уровень значимости) по смыслу является вероятностью отвергнуть истинную гипотезу, т.е. вероятностью ошибки первого рода. Величина χ2α– критическое значение величины χ2. Она является нижней границей односторонней критической области данного критерия. Правило принятия решения основывается на сравнении вычисленного значения χ2 с критическим значением χ2α . Если , то гипотеза о соответствии эмпирического и теоретического законов принимается, в противном случае, когда вычисленное χ2 попадает в критическую область, эта гипотеза отвергается.

Идея этого критерия заключается в следующем. Величина χ2 распределена по закону χ2 только в том случае, когда гипотеза H0 является истинной. Именно при этом условии было определено критическое значение

χ2α таким образом, что вероятность выполнения неравенства очень мала. Предположим теперь, что это неравенство, тем не менее, выполнилось, т. е. вычисленное значение χ2 попало в критическую область. Это значит, что произошло маловероятное событие. Если все наши рассуждения верны, то такой результат является достаточно редким. Поэтому мы подвергаем сомнению наши рассуждения. Мы могли сделать ошибку лишь тогда, когда предположили истинность проверяемой гипотезы H0. Следовательно, эту гипотезу нужно отвергнуть. Принимая такое решение, мы можем совершить ошибку с вероятностью α, поскольку именно с этой вероятностью указанное маловероятное событие может произойти.

Если теоретическое распределение содержит неизвестные параметры, то перед вычислением вероятностей pi, эти параметры (например, математическое ожидание, дисперсия и т.п.) оцениваются по той же самой выборке. В таком случае число степеней свободы k распределения χ2 уменьшается: k = r – s – 1, где s – число оценённых параметров.

Число частичных интервалов следует брать не менее 8, однако, если для некоторых интервалов при вычислениях оказывается npi < 5, то их нужно объединять с соседними интервалами, чтобы было npi ≥ 5 (в ответственных случаях не допускается npi < 10). Общее число интервалов при этом, естественно, сокращается.

 

3)Недостатком критерия χ2-Пирсона является то, что для его применения необходим большой объём выборки. Это связано с тем, что в критерии используется интервальный вариационный ряд, при получении которого имела место частичная потеря информации (за счёт группирования данных). В случае малых объёмов выборок целесообразно использовать критерии, непосредственно опирающиеся на измерения исследуемой величины. Наиболее распространённым критерием такого типа является критерий ω2 (и его модификации). В этом критерии в качестве меры отклонения эмпирического распределения от теоретического применяется величина

 

где F*(x) – эмпирическая функция распределения вероятностей; F(x) – теоретическая (гипотетическая) функция. Интегрирование приводит к следующему выражению:

 

, (3)

 

где xi – элементы выборки. Доказано, что распределение величины 2 при возрастании n достаточно быстро сходится к некоторому предельному распределению, для которого составлена таблица.

Практически критерием можно пользоваться уже при n > 40, что выгодно отличает этот критерий от критерия χ2. Схема принятия решения аналогична схеме, рассмотренной выше. Решается уравнение

 

(4)

 

т.е. по заданному уровню значимости α по таблицам находится критическое значение zα.

Если оказывается, что 2 < zα, т о гипотеза о соответствии эмпирического и теоретического распределений принимается, в противном случае – отвергается.

КОНТРОЛЬНЫЕ ВОПРОСЫ

 

1. Как решается задача замены эмпирического закона распределения теоретическим?

2. В чем заключается смысл величины χ2 ?

3. Почему для применения χ2-критерия требуется большой объем выборки?

4. Что принимается в качестве меры отклонения в ω2-критерии?

5. Какова схема принятия решения при использования критерия χ2 ?

 

 



2015-11-27 402 Обсуждений (0)
Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ» 0.00 из 5.00 0 оценок









Обсуждение в статье: Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ»

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе...
Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ...
Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация...
Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (402)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.005 сек.)