Определение эмпирической плотности вероятностей
Введение
В практических наблюдениях мы обычно имеем совокупность наблюдений х1, х2, ... , хn, на основе которых требуется сделать те или иные выводы. Часто этих наблюдений много, поэтому возникает задача их компактного описания. В идеале таким описанием могло бы быть утверждение, что х1, х2, ... , хn являются выборкой, т.е. независимыми реализациями случайной величины x с известным законом распределения F(x). Это позволило бы теоретически произвести расчеты всех необходимых исследователю характеристик наблюдаемого явления. Однако далеко не всегда мы можем утверждать, что х1, х2, ... , хn являются независимыми и одинаково распределенными случайными величинами. Во-первых, это необходимо проверить, а во-вторых, часто заведомо известно, что это не так. Поэтому для компактного описания совокупности наблюдений используют другие методы – методы описательной статистики. Методы описательной статистики Методами описательной статистики называются методы описания выборок х1, х2, ... , хn с помощью различных показателей и графиков. Достоинство методов описательной статистики в том, что ее простые и довольно информативные статистические показатели избавляют от необходимости просмотра большого количества значений выборки. Показатели описательной статистики Показатели, описывающие выборку можно разбить на несколько групп: 1. Показатели положения описывают положение данных (или середины совокупности) на числовой оси: - Минимальный и максимальный элементы выборки - Выборочные верхний и нижний квартили - Среднее - Выборочная медиана - Выборочная мода 2. Показатели разброса описывают степень разброса данных относительно своего центра (насколько кучно основная масса данных группируется около середины совокупности) - Дисперсия выборки - Выборочное среднее квадратическое отклонение (стандартное отклонение) - Размах - Коэффициент эксцесса 3. Показатели асимметрии описывают симметричность распределения данных около своего центра - Коэффициент асимметрии - Положение выборочной медианы относительно выборочного среднего и относительно выборочных квартилей - Гистограмма 4. Показатели, описывающие закон распределения, дают представление о законе распределения данных - Гистограмма - Выборочная функция распределения - Таблица частот Из перечисленных выше характеристик на практике по традиции чаще всего используют выборочные среднее, медиану и дисперсию (или стандартное отклонение). Однако для получения более точных и достоверных выводов необходимо использовать и другие показатели. Особое внимание следует обратить на наличие в выборке выбросов – грубых, сильно отличающихся от основной массы, наблюдений. Большинство традиционных статистических методов весьма чувствительны к отклонениям от условий применимости метода. Поэтому выбросы могут не только исказить значение выборочных показателей, но и привести к ошибочным выводам. Подозрение о присутствии таких наблюдений должно возникнуть, если выборочная медиана сильно отличается от выборочного среднего, хотя в целом совокупность симметрична, или, если положение медианы сильно несимметрично относительно минимального и максимального элементов выборки. Проще всего обнаружить выбросы с помощью перехода от выборки к вариационному ряду или гистограмме с большим числом интервалов группировки. Порядок выполнения работы Исходные данные
Исходными данными является набор реализаций случайной величины (например, значения какой-либо величины, полученные при измерении). Размер выборки - n шт. Исходные данные оформить в виде таблицы (таблица 1).
Таблица 1 – Исходные данные
Построение вариационного ряда
Для удобства работы с данными выборку преобразуют в вариационный ряд – ряд, в котором элементы выборки упорядочиваются по возрастанию. Этапы выполнения: 1. Найти наименьший элемент ряда Xmin 2. Найти наибольший элемент ряда Xmax 3. Записать ряд, начиная с наименьшего элемента Xmin и заканчивая наибольшим Xmax (таблица 2) 4. Для упрощения процедуры обработки и с целью уменьшения ошибок при вычислениях необходимо вычесть из каждого элемента ряда постоянное число (например, округленное Xmin) и использовать в расчетах не сами размеры, а их отклонениями. Получившиеся отклонения записать в таблицу 2. Таблица 2 – Вариационный ряд с отклонениями относительно x0 = <значение>[1]
Группировка данных
Этапы выполнения: 1. Разбить весь диапазон R = Xmax – Xmin на r интервалов. Число интервалов r устанавливают в зависимости от числа наблюдений n:
При небольших выборках . 2. Назначить длину интервалов. Длину интервалов Dx чаще всего выбирают одинаковой: Dx = R/r. Ее округляют до значения, удобного для графического отображения. 3. Назначить нижнюю границу xн первого интервала (в отклонениях от x0). Она должна быть меньше xmin и удобной с позиции графического отображения. Результат занести в таблицу 3. 4. Назначить нижние xн и верхние xв границы всех оставшихся интервалов (в отклонениях от x0). Результаты занести в таблицу 3. 5. Определить число размеров, попадающих в интервал mi. Условие попадания размера xj в интервал xiн < xj £ xiв. Результаты занести в таблицу 3. Полученные результаты проверить по условию . Определение частостей
Отношение частоты mi к общему числу наблюдений n называется частостью:
Частость представляет собой эмпирическую оценку вероятности попадания результатов наблюдений Хj в i интервал. Определить частости и результаты занести в таблицу 3. Полученные результаты проверить по условию . Определение эмпирической плотности вероятностей
Эмпирическая плотность вероятностей равна:
Определить эмпирическую плотность вероятности, результаты занести в таблицу 3.
Таблица 3 – Расчетные данные
Для дальнейших геометрических построений необходимы значения середины интервалов xi. Определить их, результаты занести в таблицу 3. Построение полигона
Этапы выполнения[2]: 1. Определить масштабы по осям абсцисс и ординат, исходя их соотношения :R = 5 » 8. 2. На оси абсцисс отложить интервалы значений измеряемой величины. 3. В серединах интервалов отметить ординаты, пропорциональные частостям. 4. Полученные точки соединить прямыми линиями. Пример полигона приведен на рисунке 1.
Рисунок 1 – Пример полигона
Популярное: Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (931)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |