Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий
Теория вероятностей – математический фундамент современной статистики. Известен целый ряд умозрительных опытов и задач, а также их экспериментальные аналоги, которые приводят к классическим вероятностным схемам. Таковыми являются подбрасывание однородной симметричной монеты, игральной кости, карточные игры, игры с урнами, содержащими различные объекты. В результате решения этих задач были заложены формальные основы теории вероятности, которые кратко обсуждаются ниже. Случайное событие и вероятность. В статистических исследованиях фигурируют сложные природные, технологические или социальные механизмы, результаты проявления которых невозможно достоверно предсказать. В качестве примера можно представить многоэтапный технологический процесс производства некоего продукта. Поэтому статистика, как и теория вероятностей, рассматривает изучаемые явления как случайные. В экспериментах случайные явления представлены случайными событиями. Для примера с производством продукта сформулировать статистический эксперимент по оценке качества производственного процесса. Тогда в качестве случайного события может, например, выступать появление в контрольной партии продукции некоторого количества дефектных изделий. Чтобы адекватно описать исследуемое случайное явление, необходимо сопоставить представляющему его случайному событию некую количественную меру, которая отражала бы частоту появления этого события (например, как часто в партии из 100 изделий встречается 5 дефектных). Такая мера в теории получила название вероятности Случайная величина и ее описание. При проведении экспериментов случайные события, как правило, формально соотносят с некоторой величиной
Рис. 1. Функция распределения случайной величины.
Функция распределения – положительная неубывающая функция, принимающая значения от 0 до 1 (рис.1). Для дискретных случайных величин можно указать вероятность
Чтобы понять смысл плотности вероятности, можно воспользоваться аналогией с массой и плотностью тела, представив в качестве массы тела функцию распределения, объема тела – интервал значений случайной величины, плотности тела – плотность вероятности. Это положительная функция, площадь под кривой которой относительно оси значений случайной величины
Рис. 2. Плотность вероятности случайной величины.
Для более компактного (частичного) описания случайной величины служат числовые характеристики (или статистики) случайных величин. Важнейшие из них – среднее значение
Результаты наблюдений трактуются как реализации соответствующей случайной величины. Все возможные (реально или умозрительно) реализации случайной величины составляют ее т.н. генеральную совокупность (популяцию). Генеральная совокупность редко наблюдаема в опыте главным образом по причине ограниченности ресурсов (времени, стоимости обследования, емкости устройств хранения информации и т.п.). Статистический опыт (эксперимент). Совокупность наблюдений с точки зрения практической статистики есть данные. Известно, что с классическими функциями можно производить арифметические действия как с функциями. С вероятностями как с функциями также можно оперировать, и в теории вероятности формализованы законы сложения и умножения вероятностей. Эти формализации, в свою очередь, являются основой статистических вычислений. Получение конкретной реализации случайной величины называется статистическим опытом. При многократном повторении опыта – получении множества реализаций – предполагается (но зачастую явно не оговаривается) неизменность условий опыта. Абсолютную неизменность условий любого опыта, понятно, нельзя обеспечить, поэтому на практике речь идет лишь об обеспечении относительно стабильных условий. Обеспечение стабильности условий эксперимента в значительной степени искусство. Выполнение требований стабильности опыта – предмет методологии сбора данных. Чаще, статистик призван обрабатывать уже кем-то собранные данные. Необходимо, однако, учитывать возможность того, что данные были получены в условиях непостоянства условий опыта; для последующей обработки и анализа таких данных следует использовать адекватные методы. Центральная предельная теорема. Наиболее распространенной вероятностной моделью в статистике является нормальная (гауссова) модель. К ней сводится большое количество практических задач теории вероятности и математической статистики. Генеральной совокупностью данной модели является множество исходов статистического опыта, отражающего аддитивное взаимодействие большого количества независимых случайных явлений (процессов). Данная вероятностная модель относится к классу т.н. параметрических моделей, т.е. моделей, аналитический вид которых однозначно задается с помощью конечного числа параметров. В гауссовом случае параметрами модели являются математическое ожидание μ (среднее значение генеральной совокупности) и дисперсия Распространенность гауссовой модели объясняется фундаментальным свойством природы, характеризующим распределение вероятности суммы большого числа независимых случайных явлений (процессов). Это свойство, формулируемое как центральная предельная теорема, проявляется в том, что, сумма n одинаково распределенных случайных величин, стремится к нормальному (гауссову) распределению при бесконечном увеличении n. (На практике оказывается достаточным эффект аддитивного взаимодействия порядка n=30 независимых случайных величин.) Наряду с параметрическими, в статистике используются также непараметрические модели. В непараметрических моделях закон распределения вероятностей генеральной совокупности полагается неизвестным. Библиография 1. Головина, Г. М., Крылов, В. Ю., Савченко, Т. Н. Математические методы в современной психологии: статус, разработка, применение / Г.М. Головина, В.Ю. Крылов, Т.Н. Савченко. - М.: Изд-во Института психологии РАН. - 1995. – 260с. 2. Суходольский, Г. В. Математические методы в психологии / Г.В. Суходольский. - Харьков: Изд-во Гуманитарный Центр. - 2006. – 512с. 3. Тарасов, С.Г. Основы применения математических методов в психологии. / С.Г. Тарасов. - СПб.: Изд-во: Санкт - Петербург. ун-та. - 1999. – 326с. 4. Глинский, В. В., Ионин, В. Г. Статистический анализ данных / В.В. Глинский, В.Г. Ионин. - М.: Филин. - 2008. – 265с. Лекция 3.
Популярное: Почему стероиды повышают давление?: Основных причин три... Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы... ![]() ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (1176)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |