Числовые характеристики выборки
Числовые характеристики выборки – параметры выборки, выражающие наиболее существенные особенности статистического распределения выборки. Выборочной средней
Если статистическое распределение выборки задано интервальным вариационным рядом, тогда при вычислении
Модой Мо называют варианту, которая имеет наибольшую частоту. Для интервального статистического распределения сначала определяют модальный интервал [xm; xm+1), для которого где hi – длина частичного интервала [xi; xi+1), ni – число вариант этого интервала. Далее
Медианой Ме дискретного статистического распределения называют варианту, которая делит вариационный ряд на две части, равных по числу вариант. Если число вариант нечётное, то если чётное, то
Медианой Me интервального статистического распределенияназывается число, для которого выполняется равенство
Формула для вычисления Me имеет вид
(5.8) где [xm; xm+1) – медианный частичный интервал, для которого выполняется неравенство
Дисперсия выборки (выборочная дисперссия) Dв – среднее арифмитическое квадратов отклонений наблюдаемых значений признака от их среднего значения
Вычисление Dв можно упростить, используя следующую формулу
Dв характеризует рассеяние наблюдаемых значений количественного признака вокруг своего среднего значения Выборочным средним квадратическим отклонением (стандартом)
Размахом варьирования R называют разность между наибольшей и наименьшей вариантами.
Размах варьирования является простейшей характеристикой рассеяния вариационного ряда. Средним абсолютным отклонением
Среднее абсолютное значение используется для характеристики рассеяния вариационного ряда. Коэффициентом вариации V называют выраженное в процентах отношение
где Коэффициент вариации V служит для сравнения величин рассеяния по отношению к Сводными характеристиками статистических распределений выступают статистические (эмпирические) моменты. Обычным эмпирическим моментом порядка l называют среднее значение l-х степеней разностей
где с – произвольная постоянное число, т. н. ложный нуль. Начальным эмпирическим моментом порядка l называют обычный момент порядка l при с=0.
В частности
т. е. начальный эмпирический момент первого порядка равен выборочной средней. Центральным эмпирическим моментом порядка l называют обычный момент порядка l при
В частности
т. е. центральный эмпирический момент второго порядка равен выборочной дисперсии. Центральные моменты можно выразить через обычные:
Условным эмпирическим моментом порядка l называют начальный момент порядка l, вычисленный для условных вариант.
где ui – условная варианта. Условными называют варианты, определяемые равенством
где с – любая варианта xi, которая располагается в середине вариационного ряда или является модой; h – шаг, т. е.
Таким образом, для вариационного ряда, состоящего из равноотстоящих вариант с шагом h, условные варианты есть целые числа.
В частности
Отсюда
Выразим обычные моменты через условные:
Тогда
Подставив (5.22) в (5.18), можно получить удобные для вычислений формулы, выражающие центральные моменты через условные. Например, для m2:
Пример. Для статистического распределения рассчитать числовые характеристики.
Решение.
Перейдём к условным вариантам. с=10.
Теория оценок Теория оценок определяет методы и способы статистической оценки неизвестных параметров теоретического распределения случайной величины по совокупности экспериментальных данных. При этом часто допускается, что закон распределения генеральной совокупности известен, но неизвестны параметры этого закона (математическое ожидание, дисперсия), которые необходимо оценить (приближённо найти) по выборочной совокупности. Статистической оценкой неизвестного параметра теоретического распределения называется функция от выборочных значений (вариант), которая даёт приближённое значение оцениваемого параметра. Все оценки делятся на точечные и интервальные.
Точечные оценки. Точечнойназывается оценка, которая определяется одним числом. К точечным оценкам предъявляются следующие требования: - несмещённости; - эффективности; - состоятельности. Пусть Несмещённой называют статистическую оценку
Смещённой называют оценку, математическое ожидание которой не равно оцениваемому параметру, т. е.
Эффективной называют статистическую оценку, которая при заданном объёме выборки n имет наименьшую возможную дисперсию. Состоятельной называют статистическую оценку, которая при
где Оценка генеральной средней выборочной средней В качестве оценки генеральной дисперсии принимают исправленную выборочную дисперсию S2.
или
которая удовлетворяет требованию несмещённости. Очевидно, при достаточно больших значениях n Dв и S2 различаются мало. На практике S2 вычисляется, если n < 30. Для оценки среднего квадратического отклонения генеральной совокупности используется исправленное выборочное среднее квадратическое отклонение S или выборочное среднее квадратическое отклонение
Все рассмотренные оценки (формулы (5.4), (5.11), (5.24), (5.25)) являются точечными. Точечные оценки используются прежде всего тогда, когда с их помощью выполняются другие расчёты. При этом точечные оценки не несут информации о точности конкретной оценки. При малых объёмах выборки точечные оценки могут значительно отличаться от оцениваемого параметра.
Интервальные оценки Интервальной называется оценка, которая определяется двумя числами – началом и концомм интервала, в котором находится оцениваемый параметр теоретического распределения с некоторой вероятностью. Пусть найденная по данным выборки статистическая оценка
то чем меньше Т. к.
Обычно Заменим неравенство в формуле (5.27) равносильным двойным неравенством:
Интервал Доверительный интервал покрывает неизвестный параметр Если случайная величина X распределено нормально с математическим ожиданием равным a и среднеквадратическим отклонением известным и равным
где aн и aв – нижняя и верхняя доверительные границы математического ожидания a; t – коэффициент, определяемый по таблице функции Лапласа, которому соответствует значение функции Лапласа
Анализ формулы (5.29) показывает, что - при возрастании объёма выборки n число - при увеличении надёжности - если требуется оценить математическое ожидание с наперёд заданной точностью
Формула (5.30) используется для повторной выборки, для бесповторной выборки минимальный объём пересчитывают по формуле
где N – генеральной совокупности. Пример 1. Случайная величина X имеет нормальное распределение с известным среднеквадратическим отклонением Решение. При условии
Вычисляем
Получили искомый доверительный интервал:
Пример 2. Найти минимальный объём повторной и бесповторной выборок для генеральной совокупности с объёмом N=1000 с Решение.
Принимаем объём повторной выборки n=385. Для бесповторной выборки
Принимаем объём бесповторной выборки Если случайная величина X распределена нормально с математическим ожидание равным a и среднеквадратическим отклонением
где S – исправленное среднеквадратическое отклонение;
При неограниченном возрастании объёма выборки n распределение Стъюдента стремится к нормальному, поэтому при n>30 в формулах (5.32) Если случайная величина X распределена нормально и среднеквадратическое отклонение
где q – коэффициент распределения Если q<1, то учитывая, что Пример. Случайная величина X имеет нормальное распределение. По выборке объёма n=10 найдено исправленное среднеквадратическое отклонение S=0,16. Найти доверительный интервал, покрывающий неизвестное среднеквадратическое отклонение Решение. По таблице найдём q=1,8 (q>0) при Искомые доверительные границы доверительного интервала:
Практическое применение формулы (5.28) и (5.32) получили для оценки истинного значения измеряемой величины, формулы (5.33) – для оценци точности измерений (точности прибора). Если случайная величина X имеет биноминальное распределение, то оценить неизвестную вероятность p появления события A в каждом испытании можно, рассчитав доверительные границы по формулам
где рн и рв – нижняя и верхняя доверительные границы неизвестного значения вероятности p; w – относительная частота (точечная оценка для p).
где m – число появления события A; n – число испытаний. Пример. Производят независимые испытания с одинаковой, но неизвестной вероятностью p появления события A в каждом испытании. Найти доверительный интервал для оценки p с надёжностью 0,95, если в 80 испытаниях событие A появилось 16 раз. Решение. По условию m=16, n=80, Найдём Найдём t по таблице функции Лапласа из соотношения Подставив n, w, t в формулу (5.34), получим
При больших значениях n (порядка сотен) слагаемые
Популярное: Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... ![]() ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (11370)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |