Интервальные оценки средней
12 При изложении данного вопроса будем различать случаи больших и малых выборок. При этом оба случая сначала рассмотрим в более простой, с теоретической точки зрения, ситуации возвратной (повторной) выборки.
Большая выборка Если объем выборки достаточно большой (практически, начиная с п > 20—30), то распределение выборочной средней М(
где σ— генеральное среднее квадратическое отклонение, п — объем выборки. Таким образом, величина
распределена по стандартному нормальному закону (с математическим ожиданием M(z) = 0и средним квадратическим отклонением σ( z ) = 1). Задавшись доверительной вероятностью Р = 1 — α, определяем из равенства 2Ф(z) = 1 — α соответствующее значение za (используем при этом таблицу интегральной функции Лапласа). Тогда с вероятностью Р = 1 — α выполняется неравенство:
которое эквивалентно неравенству:
Величина Таким образом, мы имеем доверительный интервал для генеральной средней:
(
Наоборот, если задана предельная ошибка ε , а требуется определить вероятность Р, то схема решения задачи следующая:
ε→z=
Наконец, определение объема выборки п по данным Р и ε производится по следующей схеме: P=2Ф(z) →z→n= Пример 1.9.4. Взвешивание 50 случайно отобранных коробок печенья дало Решение: Дано: n=50; Из равенства Р = 2Ф(z)=0,95 по таблице значений интегральной функции Лапласа находим z=1,96, откуда:
ε=
Таким образом, получаем доверительный интервал: 1200 — 30 < Пример 1.9.5 Определить, с какой доверительной вероятностью можно утверждать, что при данном объеме выборки (50 коробок) ошибка выборки не превысит 20 г. Решение: По величине ε=20 вычисляем
Пример 1.9.6. Определить необходимый объем выборки n, который с вероятностью 0,99 гарантировал бы ошибку выборки не более чем ε = 20г. Решение: Из Р = 2Ф(z ) =0,99 находим z = 2,58, откуда:
Предположение о том, что генеральная дисперсия σ2известна при неизвестной генеральной средней, на практике выполняется весьма редко. Чаще всего мы имеем лишь выборочные данные и можем дать лишь выборочную оценку s 2 неизвестной дисперсии σ2. Статистика
подчиняется закону распределения Стьюдента с v = n—1 степенями свободы. Однако при больших значениях параметра v (v ≥ 30) распределение Стьюдента практически совпадает с нормальным. Поэтому в случае больших выборок схема решения задач остается прежней, даже если вместо 'Неизве стного генерального среднего квадратического отклонения а используется его выборочная оценка s .
Малая выборка Если генеральная совокупность подчинена нормальному закону распределения (что на практике имеет место очень часто), то выборочная средняя Если же генеральное среднее квадратическое отклонение σ неизвестно и приходится пользоваться его выборочной оценкой s , то используется статистика t (1.9.26), которая, как мы уже отмечали, подчинена закону распределения Стьюдента с v = n—1 степенями свободы. При v < 30 имеются значительные различия между распределением Стьюдента и нормальным распределением (тем более значительные, чем меньше v). Используя функцию распределения Стьюдента, мы можем записать равенство, аналогичное формуле Лапласа:
где S ( t , v) — функция Стьюдента, значения которой для различных значений tи v подробно рассчитаны и представлены в специальных таблицах. Выражение (1.9.27) эквивалентно выражению:
где Решение задач с помощью этого равенства аналогично решению задач с использованием формулы Лапласа. Лишь определение п несколько усложняется из-за того, что оно входит также в параметр v = n—1. Поэтому можно воспользоваться схемой последовательных приближений. Вначале производят оценку (s2) генеральной дисперсии. Затем находят п1 по схеме (1.9.25), используя таблицу функции Лапласа и принимая σ2 = s 2 - По найденному n 1 и, соответственно, v 1 = n 1 — 1 и заданному значению Р=1—α определяют t 1 (по таблице распределения Стьюдента) и вычисляют Теперь можно снова повторить расчет по v 2 = n 2 — 1 и т.д. Итерация заканчивается, если окажется ni ≈ ni -1.
Пример 1.9.7. Для определения среднего заработка работника за день при соблюдении необходимых условий было отобрано 10 работников, заработок которых оказался равным (в руб.): 325; 337; 319; 330; 327; 328; 332; 320; 318; 334. Требуется определить с вероятностью 0,95 доверительный интервал для среднего заработка работников в генеральной совокупности, если есть основания полагать, что заработная плата в генеральной совокупности подчиняется нормальному закону определения. Решение: По данным выборки определяем среднюю и дисперсию. Получаем
Рассчитываем несмещенную оценку генеральной дисперсии
Предположение о нормальном характере генерального распределения позволяет нам использовать равенства (1.9.27) и (1.9.28). Обращаясь к таблице значений функции Стьюдента, по заданным P = 2 S ( t , v)=0,95 и v = n—1 = 10 – 1 = 9 находим t = 2,26. Вычисляем предельную ошибку выборки ε= Доверительный интервал для генеральной средней: 327—5<
Пример 1.9.8. Используя данные примера 1.9.7, определить объем выборки, необходимый для того, чтобы ошибка выборочной средней с вероятностью 0,95 не превышала 3 рубля. Решение. Мы имеем оценку генеральной дисперсии s2 = 42,4. Вначале находим n 1 по формуле (1.9.25), принимая σ2 = s 2 и определяя z по таблице функции Лапласа:
Теперь обращаемся к таблице функции Стьюдента и по Р = 0,95, v 1 = n 1—1 ≈ 17 находим значение t 1=2,11. Вычисляем По Р = 0,95 и v 2 = n 2—1 = 21 – 1 = 20 находим t2 = 2,09. Вычисляем Поскольку n 3 ≈ n 2 , то необходимый объем выборки устанавливается 21 человек.
Еще раз отметим, что рассмотренные выше схемы решения задач для малых выборок справедливы только при предположении нормального характера генерального распределения. При отсутствии такого предположения распределения
3.5.3. Безвозвратная выборка В случае безвозвратной выборки формула для среднего квадратического отклонения выборочной средней, согласно (2.21), примет вид:
Если генеральное среднее квадратическое отклонение σнеизвестно (наиболее реальная ситуация), то мы заменяем его точечной оценкой s', которая рассчитывается по формуле (1.9.20). В результате получим:
(. s — обычное «исправленное» среднее квадратическое отклонение
Во всем остальном ход решения задач как для случая больших выборок, так и для случая малых выборок остается прежним. Корректирующий множитель
12
Популярное: Почему стероиды повышают давление?: Основных причин три... Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас... Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной... Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... ![]() ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (476)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |