Мегаобучалка Главная | О нас | Обратная связь


Особенности обработки данных, представленных в разных измерительных шкалах



2018-07-06 792 Обсуждений (0)
Особенности обработки данных, представленных в разных измерительных шкалах 0.00 из 5.00 0 оценок




Существующие измерительные шкалы имеют разную мощность, или дифференцирующую способность, т.е. дают разный объем информации об измеренном параметре психической реальности. По возрастанию мощности шкалы расположены следующим образом: наименований, порядка, интервалов, отношений. Более мощная шкала открывает и большие возможности статистической обработки. В обобщенном виде возможности обработки эмпирических данных для названных шкал измерений представлены в таблице 2.

Как следует из таблицы 2, номинативная шкала как самая слабая по мощности, имеет и самый ограниченный арсенал средств обработки данных. Преобразования шкал могут быть двух видов: понижение мощности шкалы и повышение мощности шкалы. Понижение мощности шкалы означает, что все способы обработки и графического представления результатов, используемые для более слабых шкал, подходят и для более сильной (именно поэтому для шкалы отношений подходит абсолютно любая статистика). Понижение мощности шкалы означает обязательную потерю части эмпирической информации. Другой вид преобразований – повышение мощности шкалы – очень сложная процедура, которую необходимо специально обосновывать.

Таблица 2 – Обработка данных, представленных в различных шкалах

 

Шкала Результат Статистика Графическое представление
Неметрическая Наименований Типологизация, классификация Непараметрическая Диаграмма
Порядка Установление порядка выраженности свойства, ранжирование Непараметрическая График
Метрическая Интервалов Сравнение: на сколько больше/меньше выражено? Параметрическая Гистограмма (полигон распределений)
Отношений Сравнение: во сколько раз больше/меньше? Любые статистики Любая форма

 

 

ОПИСАТЕЛЬНАЯ СТАТИСТИКА

1. Описательная статистика и область ее применения.

2. Меры среднего уровня.

3. Меры вариации.

4. Распределение и его параметры.

 

Описательная статистика и область ее применения

Описательная статистика выступает в качестве базового раздела математической статистики, который называется также дескриптивной статистикой или дескриптивным анализом. Описательная статистика представляет собой способы обработки данных, позволяющие получить компактную информацию о конкретной, эмпирически исследованной выборке. Иначе говоря, в результате дескриптивного анализа появляются такие числа, которые характеризуют некоторую интересующую исследователя ситуацию (среднее количество времени, затрачиваемое на разговоры по телефону; число несчастных случаев в различные времена года; результаты прохождения централизованного тестирования; уровень тревожности сотрудников организации после смены руководства и др.). Назначение описательной статистики – сжать множество значений измеренной психологической переменной в группе респондентов до одного числа. Такое «сжатие», концентрация дает возможность для интерпретации данных и для их дальнейшей статистической обработки.

К базовым методам дескриптивной статистики относятся:

– процентные показатели;

– меры среднего уровня;

– меры рассеяния (или вариации);

– парные коэффициенты связи.

В психологических исследованиях наиболее популярны подсчет частоты встречаемости измеренного признака в процентах, а также меры среднего уровня и вариации, которые различаются в зависимости от типа измерительной шкалы.

 

Меры среднего уровня

Это меры, обеспечивающие усредненную характеристику совокупности объектов по измеренному признаку. Для разных шкал измерений используются разные меры среднего уровня или меры центральной тенденции: мода (для номинативной шкалы), медиана, среднее арифметическое (для порядковой, интервальной и шкал отношений).

Меры центральной тенденции отражают уровень выраженности измеренного признака.

Мода (Мо)значение, которое встречается во множестве наблюдений наиболее часто (в буквальном смысле мода – это популярность, типичность).

Например, 10 респондентов-женщин в качестве наиболее предпочитаемых домашних питомцев назвали следующих животных: хомяк, рыбки, кошка, собака, хомяк, черепаха, кошка, хомяк, собака, морская свинка. В данном примере наиболее частым ответом будет «хомяк» (это и есть мода или модальное значение). В другой выборке из 10 респондентов-мужчин был получен несколько иной ряд животных: собака, кошка, рыбки, попугай, собака, собака, кошка, черепаха, кошка, хомяк. В этом случае одинаково часто среди опрошенных встречаются два выбора – собака и кошка. Это означает, что здесь наблюдается две моды, и такая совокупность называется бимодальной. Если фиксируется три и более мод, то говорится о полимодальной совокупности, и такие выборки еще можно характеризовать по наименьшей и наибольшей моде. Если ни одна мода не прослеживается, тогда считается, что данное распределение моды не имеет.

Мода может рассчитываться и для более мощных, чем номинативная, шкал измерений. К примеру, время решения задач-анаграмм в группе из 9 учащихся составило в минутах: 1, 1, 3, 4, 1, 2, 1, 2, 7 (моду составляет 1 минута как наиболее часто встречающееся число).

Медиана (Ме)значение, делящее упорядоченное (по возрастанию или убыванию) множество значений измеренного признака пополам. Одна половина значений оказывается меньше медианы, а другая – больше.

Исследованная выборка может иметь нечетное или четное количество измерений. Для нечетной медиана выступает центральным значением. Например, для времени решения задач-анаграмм упорядоченный по возрастанию ряд наблюдений (9 измерений) выглядит следующим образом: 1, 1, 1, 1, 2, 2, 3, 4, 7. В этой выборке Ме = 2. Для выборки с четным количеством измерений медиана рассчитывается как среднее между двумя центральными значениями. Допустим, время решения задач для 10 испытуемых выглядит следующим образом: 1, 1, 1, 2, 3, 3, 4, 7. В этом примере центральными значениями в упорядоченном ряду выступают 2 и 3. Соответственно медиана Ме = (2 + 3)/2 = 2,5.

Среднее арифметическое (Х)это суммавсех значений измеренного признака, деленная на количество суммированных значений. Среднее арифметическое обозначается также и другими символами: М – для выборочной совокупности, µ – для генеральной совокупности.

  M = Σxi
n

 

Сумма обозначается буквой Σ, отдельные значения признака как х1, х2 …хi, n – общее количество измеренных значений. Например, в случае времени решения задач-анаграмм М = 2,44 (Σ = 1 + 1 + 3 + 4 + 1 + 2 + 1 + 2 + + 7 = 22, n = 9). Расчеты показывают, что в данном случае среднее арифметическое близко по значению с медианой (Ме = 2). Это говорит о том, что распределение измеренных признаков в данной выборке приближается к симметричному. Однако оно не совпадает с модой (Мо = 1). Такое несовпадение объясняется тем, что среднее арифметическое очень чувствительно к экстремально большим или малым значениям переменной (их еще называют «выбросами», обусловленными индивидуальными вариациями испытуемых). В обсуждаемом случае таким «выбросом» выступает очень длительное время у одного испытуемого, равное 7 минутам. Поэтому при необходимости сравнения нескольких выборок по среднему арифметическому измеренного признака важно, чтобы в этих группах подобные «выбросы» отсутствовали. Если они присутствуют, то в качестве мер центральных тенденций лучше ограничиться модой или медианой, которые не чувствительны к индивидуальным вариациям.

Таким образом, интерпретация мер центральной тенденции заключается в следующем: мода – наиболее частое значение, медиана – срединное в упорядоченном ряду данных, среднее арифметическое – наиболее ожидаемое значение.

 

Меры вариации

Данные меры называются также мерами изменчивости или мерами рассеяния. Они дают исследователю информацию об индивидуальных различиях измеренного признака. Для количественно измеренных переменных нижняя граница мер изменчивости равна 0 (т.е. объекты не отличаются друг от друга по определенному признаку). Верхняя граница – это всегда открытая величина, поскольку она определяется особенностями изучаемой переменной (в качестве иллюстрации открытости верхней границы уместно вспомнить исследования объема памяти, описанные А.Р. Лурией в «Маленькой книжке о большой памяти» и не обнаружившие этот предел у испытуемого Ш.).

К наиболее часто используемым в психологии мерам вариации относятся: размах, дисперсия, стандартное отклонение.

Размах (R)самая простая мера вариации, указывающая на диапазон изменчивости. Это разница между максимальным и минимальным значением измеренного признака. Например, если в студенческой группе минимальный балл, полученный на экзамене, составил 4, а максимальный – 9, то R = 5.

Дисперсия (S²)мера изменчивости для данных, полученных в метрических шкалах (интервалов и отношений). Это характеристика отклонения от среднего. Она вычисляется по формуле:

  S2 = Σ(xi – М)2 ,
n – 1

 

где хi – каждое наблюдаемое значение измеренного признака;

М – среднее арифметическое значение признака;

n – количество наблюдений.

Дисперсия рассчитывается по следующему алгоритму:

– находится среднее арифметическое по выборке;

– для каждого элемента выборки вычисляется его отклонение от среднего арифметического;

– каждый элемент полученного множества значений возводится в квадрат;

– высчитывается сумма этих квадратов;

– сумма делится на число наблюдений, уменьшенное на 1 (n – 1).

Например, две группы взрослых студентов-заочников (n = 10 в каждой) выполняли тесты достижений в разное учебное время. Первая группа работала днем во вторник, вторая – в пятницу вечером. При оценке теста анализировалось количество допущенных ошибок. Рассчитаем дисперсию для этих двух групп.

Таблица 3 – Расчет значений для вычисления дисперсии

 

№ исп. 1 группа 2 группа
хi хi – M (xi – M)² xi xi – M (xi – M)²
4 – 2,8 = 1,2 1,44 3 – 4,5 = – 1,5 2,25
4 – 2,8 = 1,2 1,44 7 – 4,5 = 2,5 6,25
3 – 2,8 = 0,2 0,04 10 – 4, 5 = 5,5 30,25
4 – 2,8 = 1,2 1,44 10 – 4,5 = 5,5 30,25
4 – 2,8 = 1,2 1,44 5 – 4,5 = 0,5 0,25
4 – 2,8 = 1,2 1,44 4 – 4,5 = – 0,5 0,25
0 – 2,8 = – 2,8 7,84 2 – 4,5 = – 2,5 6,25
3 – 2,8 = 0,2 0,04 1 – 4,5 = – 3,5 12,25
1 – 2,8 = – 1,8 3,24 1 – 4,5 = – 3,5 12,25
1 – 2,8 = – 1,8 3,24 2 – 4,5 = – 2,5 6,25
  M = 2,8 Σ+ = 6,4 Σ– = 6,4 Σ = 21,6 М = 4,5 Σ+ = 14 Σ– = 14 Σ = 106,5

 

Следует обратить внимание, что при определении «xi – M» суммы вычисленных отклонений от средней со знаком «+» и со знаком «–» должны быть равны. Их совпадение – это показатель правильности сделанных математических расчетов.

Подставим значения в формулу дисперсии. Дисперсия для первой группы: S² = 21,6/9 = 2,4; дисперсия для второй группы: S² = 106,5/9 = 11,8. Очевидно, что у второй группы дисперсия выше, а значит, показатели отдельных испытуемых значительно больше отклоняются от среднего группового показателя числа допущенных ошибок, чем у участников первой группы.

Вообще дисперсия может принимать значения от 0 до бесконечности. Если S² = 0, то это означает отсутствие изменчивости или постоянство значений измеренного признака в данной группе. Однако для интерпретации психологических данных дисперсия оказывается не всегда удобной величиной, поскольку ее размерность может не совпадать с размерностью измеренного признака (даже в обсуждаемом примере бросается в глаза, что дисперсия во второй группе студентов значительно выше максимального количества ошибок у отдельного испытуемого: S² = 11,8, а xmax = 10). Для того чтобы приблизить размерность данных статистической обработки к тем единицам, в которых измерена переменная, из дисперсии извлекают квадратный корень. Полученную величину называют стандартным отклонением.

Стандартное (или среднеквадратичное) отклонение– положительное значение квадратного корня из дисперсии. Обозначается эта величина буквами S – стандартное отклонение в исследованной выборке – или σ (сигма) – стандартное отклонение в генеральной совокупности. Последнее обозначение считается допустимым использовать и для обозначения данного расчетного показателя в конкретной выборке.

Найдем стандартное отклонение для первой и второй групп по формуле: σ = √S². Для первой группы: σ = √2,4 = 1,54; для второй группы: σ = √11,8 = 3,43. Из примера видно, что переходе от дисперсии к стандартному отклонению их показатели сохраняются, т.е. по-прежнему индивидуальный разброс числа допущенных в тесте ошибок выше во второй группе студентов, чем в первой. Однако теперь изменчивость выражается в таких конкретных числах, которые оказываются более сопоставимы с исходной измерительной шкалой, а потому более удобны исследователю для последующего их объяснения.

В качественной интерпретации числовых значений дисперсии и стандартного отклонения следует руководствоваться правилом: чем выше значения S² или σ, тем больше разбросаны значения переменной относительно среднего, и наоборот.

 



2018-07-06 792 Обсуждений (0)
Особенности обработки данных, представленных в разных измерительных шкалах 0.00 из 5.00 0 оценок









Обсуждение в статье: Особенности обработки данных, представленных в разных измерительных шкалах

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (792)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.008 сек.)