Метод доверительных интервалов
После получения точечной оценки Задачу интервального оценивания в самом общем виде можно сформулировать следующим образом: по данным выборки построить числовой интервал, относительно которого с заранее выбранной вероятностью можно сказать, что внутри этого интервала находится оцениваемый параметр. Здесь существует несколько подходов. Наиболее распространенным методом интервального оценивания является метод доверительных интервалов[1]. Доверительным интервалом для параметра q называется интервал
Число g называется доверительной вероятностью, а число a=1–g – уровнем надежности. Доверительная вероятность задается априорно и определяется конкретными условиями. Обычно используется g=0,9; 0,95; 0,99 (соответственно, a=0,1; 0,05; 0,01). Длина доверительного интервала, характеризующая точность интервальной оценки, зависит от объема выборки n и доверительной вероятности g. При увеличении величины n длина доверительного интервала уменьшается, а с приближением вероятности g к единице – увеличивается. Часто доверительный интервал строят симметричным относительно точечной оценки, т.е. в виде
или
Здесь число D называется предельной (или стандартной) ошибкой выборки. Однако симметричные интервалы не всегда удается построить, более того, иногда приходится ограничиваться односторонними доверительными интервалами:
Поскольку в эконометрических задачах часто приходится строить доверительные интервалы параметров случайных величин, имеющих нормальное распределение, приведем схемы их нахождения. 3.4.2. Доверительный интервал оценки генеральной Пусть количественный признак X генеральной совокупности имеет нормальное распределение с заданной дисперсией s2 и неизвестным математическим ожиданием a. Для оценки параметра a извлечена выборка X1, X2, …, Xn, состоящей из n независимых нормальной распределенных случайных величин с параметрами a и s, причем s известно, а величину a оценивают по выборке:
Оценим точность этого приближенного равенства. Для этого зададим вероятность g и попробуем найти такое число D, чтобы выполнялось соотношение
Далее воспользуемся свойствами нормального распределения. Известно, что сумма нормально распределенных величин также имеет нормальное распределение. Поэтому средняя величина
Следовательно,
Воспользуемся теперь формулой нахождения вероятностей отклонения нормально распределенной случайной величины от математического ожидания:
где F(x) – функция Лапласа. Заменяя X на
где
Тогда
Приняв во внимание, что доверительная вероятность задана и равна g, получим окончательный результат. Интервальная оценка генеральной средней (математического ожидания) имеет вид
или более кратко
где число tg определяется из равенства Приведем значения tg для широко распространенных значений доверительной вероятности:
Обсудим, как влияет на точность оценивания параметра a объем выборки n, величина среднего квадратичного отклонения s, а также значение доверительной вероятности g. а) При увеличении n точность оценки увеличивается. К сожалению, увеличение точности (т.е. уменьшение длины доверительного интервала) пропорционально б) Чем больше s, тем ниже точность. Зависимость точности от этого параметра носит линейный характер. в) Чем выше доверительная вероятность g, тем больше значение параметра tg, т.е. тем ниже точность. При этом между g и tg существует нелинейная связь. С увеличением g значение tg резко увеличивается ( Отметим, что величина
называется средней ошибкой выборки. Для бесповторной выборки эта формула примет вид
Тогда предельная ошибка выборки D будет представлять собой t-кратную среднюю ошибку:
Пример 3.7. На основе продолжительных наблюдений за весом X пакетов орешков, заполняемых автоматически, установлено, что среднее квадратичное отклонение веса пакетов равно s=10 г. Взвешено 25 пакетов, при этом их средний вес составил Решение. Логично считать, случайная величина X имеет нормальный закон распределения:
Для определения 95%-го доверительного интервала вычислим предельную ошибку выборки
Следовательно 95%-й доверительный интервал для истинное значение среднего веса пакетов будет иметь вид
или
На первый взгляд может показаться, что полученный результат представляет только теоретический результат, поскольку среднее квадратичное отклонение s, как правило, тоже неизвестно и вычисляется по выборочным данным. Однако если выборка достаточно большая, то полученный результат вполне приемлем для практического использования, поскольку функция распределения Пример 3.8. Предположим, что в результате выборочного обследования жилищных условий жителей города на основе собственно-случайной повторной выборки, получен следующий вариационный ряд: Таблица 3.5
Построить 95%-доверительный интервал для изучаемого признака. Решение. Рассчитаем выборочную среднюю величину и дисперсию изучаемого признака. Таблица 3.6
Тогда
Средняя ошибка выборки составит
Определим предельную ошибку выборки с вероятностью 0,95 (
Установим границы генеральной средней
или
Таким образом, на основании проведенного выборочного обследования с вероятностью 0,95 можно заключить, что средний размер общей площади, приходящейся на 1 чел., в целом по городу лежит в пределах от 18,6 до 19,4 м2. â 3.4.3. Доверительный интервал оценки генеральной Выше была решена задача построения интервальной оценки для математического ожидания нормального распределения, когда его дисперсия известна. Однако на практике дисперсия обычно тоже неизвестна и ее вычисляют по той же самой выборке, что и математическое ожидание. Это приводит к необходимости использования другой формулы при определении доверительного интервала для математического ожидания случайной величины, имеющей нормальное распределение. Такая постановка задачи особенно актуальна при малых объемах выборки. Пусть количественный признак X генеральной совокупности имеет нормальное распределение N(a,s), причем оба параметра a и s неизвестны. По данным выборки X1, X2, …, Xn, вычислим среднее арифметическое и исправленную дисперсию:
Для нахождения доверительного интервала в этом случае строится статистика
имеющая распределение Стьюдента с числом степеней свободы n=n–1 независимо от значений параметров a и s. Выбрав доверительную вероятность g и зная объем выборки n, можно найти такое число t, что будет выполняться равенство
или
Отсюда находим интервальную оценку для генеральной средней (математического ожидания) при неизвестном s:
или более кратко
Число t (коэффициент Стьюдента) находится из таблиц для распределения Стьюдента. Отметим, что он является функцией двух аргументов: доверительной вероятности g и числа степеней свободы k=n–1, т.е. t=t(g,n). Следует быть очень внимательным при использовании таблиц для распределения Стьюдента. Во-первых, обычно в таблицах вместо доверительной вероятности g используют уровень надежности a=1–g. Во-вторых, очень часто в таблицах приводятся значения т.н. одностороннего критерия Стьюдента
В этом случае в таблицах следует брать значения Несмотря на кажущееся сходство формул (3.17) и (3.22), между ними имеется существенное различие, заключающееся в том, что коэффициент Стьюдента t зависит не только от доверительной вероятности, но и от объема выборки. Особенно это различие заметно при малых выборках. (Напомним, что при больших выборках различие между распределением Стьюдента и нормальным распределением практически исчезает.) В этом случае использование нормального распределения приводит к неоправданному сужению доверительного интервала, т.е. к неоправданному повышению точности. Например, если n=5 и g=0,99, то, пользуясь распределением Стьюдента, получим t=4,6, а используя нормальное распределение, – t=2,58, т.е. доверительный интервал в последнем случае почти в два раза уже, чем интервал при использовании распределения Стьюдента. Пример 3.9. Аналитик фондового рынка оценивает среднюю доходность определенных акций. Случайная выборка 15 дней показала, что средняя (годовая) доходность Решение. Поскольку объем выборки n=15, то необходимо применить распределение Стьюдента с
Используя это значение, строим 95%-доверительный интервал:
или
Следовательно, аналитик может быть на 95% уверен, что средняя годовая доходность по акциям находится между 8,44% и 12,3%. â
Популярное: Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы... Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной... Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние... Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... ![]() ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (5882)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |