Мегаобучалка Главная | О нас | Обратная связь


Тема 1.2. Табулирование и наглядное



2018-07-06 528 Обсуждений (0)
Тема 1.2. Табулирование и наглядное 0.00 из 5.00 0 оценок




представление данных(2 ч.)

 

П Л А Н

 

1. Генеральная и выборочная совокупности

2. Частотное распределение

3. Графическое представление эмпирических данных

4. Виды частотного распределения

 

1.Как выше сказано, любое исследование начинается с формулировки некоторого предположения – гипотезы – в отношении связи явлений или свойств в некоторой совокупности объектов.

Например, исследователь может предположить, что просмотр телепередач, содержащих сцены насилия, повышает агрессивность подростков. Или что женщины более тревожны, чем мужчины. В первом случае, нас интересуют такие явления, как агрессивность и просмотр телепередач, во втором – тревожность и пол. Объектами-носителями являются все подростки, мужчины и женщины.

Для проверки подобных предположений на фактах необходимо измерить соответствующие свойства у всех носителей, что сделать невозможно. Поэтому при проведении исследования ограничиваются относительно небольшой группой людей. В связи с этим различают две совокупности.

1) Генеральная совокупность – совокупность всех подлежащих изучению объектов или возможных результатов наблюдений над одним объектом.

Число изучаемых объектов, составляющих генеральную совокупность, называется объемом генеральной совокупности. Объем может быть конечным или бесконечным. Если конечен, то наилучшим способом отыскания свойств генеральной совокупности является сплошное обследование, когда психологическому исследованию подвергаются все объекты генеральной совокупности. Например, перепись населения. Тем более, если численность небольшая, например, изучаются студенты-выпускники. Здесь, хотя и допускается сплошное исследование, но полученные выводы могут переноситься и на выпускников последующих лет. Но чаще всего сплошное обследование затруднительно и поэтому отбирают ограниченное число объектов, их изучают, а затем обобщают полученные результаты на всю генеральную совокупность.

2) Выборочная совокупность (выборка) – совокупность случайно отобранных объектов (в психологии – испытуемых, респондентов). Число их n называется объемом выборки. В статистике различают малую (n≤30), среднюю(30<n≤100) и большую выборку (n>100).

Выборка должна быть такой, чтобы была обоснована генерализация выводов выборочного исследования. Основные критерии обоснованности выводов исследования – это репрезентативность выборки и статистическая достоверность эмпирических результатов.

Репрезентативность выборки – ее представительность – обеспечивается следующими условиями:

1) случайностью выбора объектов (т.е. каждый может быть выбран с одинаковой вероятностью);

2) независимостью результатов наблюдений в выборке;

3) качественной однородностью выборки;

4) правильным определением объема выборки с учетом всех конкретных условий.

Остановимся на них подробнее.

1) Случайность выбора достигается при простом случайном отборе (обычной жеребьевкой, с помощью таблиц случайных чисел, каждый n-й объект и.д.) и стратифицированном случайном отборе,т.е. отбор по свойствам генеральной совокупности. Последний предполагает предварительное определение тех качеств, которые могут влиять на изменчивость изучаемого свойства (пол, уровень дохода, национальность, возраст и т.д.) Затем определяется процентное соотношение численности различающихся по этим качествам групп (страт) в генеральной совокупности и обеспечивается идентичное процентное соотношение соответствующих групп в выборке, а далее в каждую подгруппу выборки испытуемые выбираются простым случайным отбором.

2) Независимость результатов зависит от того, влияет ли на данный результат какое-либо событие, явление или нет.

3) Однородность выборки означает, что психолог, изучая, например, подростков, не может включать взрослых. Основаниями для формирования однородной выборки могут служить разные характеристики, такие, как уровень интеллекта, возраст, отсутствие каких-либо заболеваний и т.д.

4) Строгих рекомендаций по предварительному определению требуемого объема выборки не существует. Можно изучать единичные случаи, если они представляют интерес для науки (одаренные дети). Объем выборки зависит, прежде всего, от задач исследования, от однородности изучаемого свойства, от статистических методов, которые предполагается использовать и т.д. Можно сформулировать наиболее общие рекомендации:

- при разработке диагностической методики – от 200 до 1000-2500 человек;

- при сравнении 2-х выборок общая численность должна быть не менее 50 человек;

- при изучении взаимосвязи между какими-либо свойствами, то объем выборки должен быть не меньше 30-35 человек;

- чем больше изменчивость изучаемого свойства, тем больше должен быть объем выборки. Поэтому изменчивость можно уменьшить, увеличивая однородность выборки, например, по полу, возрасту и т.д. Например, уровень тревожности у женщин выше, чем у мужчин… Далее будет рассмотрен расчет минимального объема, если известна точность результатов и степень надежности высказывания;

- кроме того, объем выборки зависит от тех статистических методов, которые предполагается использовать. Одни критерии требуют большого количества испытуемых в выборке, для других достаточен очень малый объем выборки.

Статистическая достоверность (значимость) результатов исследования определяется с помощью методов статистического вывода (см. далее).

Обычна ситуация, когда интересующее свойство изучается на 2-х и более выборках с целью их дальнейшего сравнения. Эти выборки могут быть независимыми (несвязными), когда процедура отбора, самого эксперимента и полученные результаты измерения у испытуемых одной выборки не оказывают влияния на результаты в другой выборке, и зависимыми (связными), когда процедура отбора, самого эксперимента и полученные результаты измерения у испытуемых одной выборки оказывают влияние на другую. Например, зависимыми – родители и дети, измерения «до» и «после» эксперимента и т.д.

2.Главная цель статистического метода в психологии состоит в том, чтобы представить количественные данные в систематизированном, сжатом виде. Действительно, совокупность из тысячи и более показателей, несмотря на их внушительное количество, неинформативна. Поэтому, приступая к обработке эмпирического материала, первое, что необходимо сделать исследователю, - это навести порядок в хаосе цифр. Существуют несколько способов систематизации и представления материала в компактном виде.

Как правило, анализ данных начинается с изучения того, как часто встречаются те или иные значения интересующего исследователя признака.

Пусть из генеральной совокупности извлечена выборка, причем значение признака х1 наблюдалось n1 раз, х2 – n2 раза… хк - nк раз. Σ ni =n. Наблюдаемые значения называются вариантами, а последовательность вариант, записанных в порядке возрастания – вариационным рядом. Числа наблюдений называются абсолютными частотами fa (ni) (просто частотами), они указывают сколько раз встречается данное значение признака. Их отношение к объему выборки n – относительными частотами fо (wi) : o= , они указывают какая доля наблюдений приходится на то или иное значение признака.

Статистическим (частотным) распределениемвыборки называют соответствие между вариантами и соответствующими им частотами или относительными частотами.

Для построения статистического распределения строятся таблицы или графики распределения частот. Построение таблиц зависит от количества возможных значений признака. Если их немного (порядка 15), то может быть таблица, показывающая частоту встречаемости каждого значения признака - распределениятаблица абсолютных частот fa или относительных частот fo.

Например, нас интересуют успеваемость в данном классе по некоторому предмету. Подсчитываем частоту встречаемости каждого балла по проведенной контрольной работе (или оценке за год и т.д.) и строим таблицу:

Значения признака xi Σ (сумма)
Абсол. частота fa
Относит. частота fo 0,029 0,057 0,114 0,171 0,286 0,2 0,143
Накопленная частота fcum 0,029 0,086 0,2 0,371 0,657 0,857 -

Таблица 1.

Очевидно, что сумма всех абсолютных частот равна n, а сумма всех относительных частот равна 1. По таблице видно, что чаще встречаются значения от 6 до 8 и реже - крайние значения.

Еще одной разновидностью таблиц распределения являются таблицы распределения накопленных частот (кумуляты частот). Они показывают, как накапливаются частоты по мере возрастания признака. Для каждого значения признака указывается сумма частот (относительных частот) встречаемости тех вариант, которые не превышают данного значения. Таблицы кумулят (накопленных частот) позволяют быстро получить данные о том, какой процент (или какая их доля) испытуемых имеют выраженность признака не выше определенного значения.

Если же признак принимает достаточно большое множество значений (время решения задачи, результаты тестов по 100-бальной шкале, рост и т.д.), то в этом случае рассматривают таблицу сгруппированных частот, в которых частоты группируются по разрядам или интервалам значений признака.

Например, пусть в группе испытуемых объемом 40 человек проведен тестирование, результаты которого уложились в пределы от 32 до 67 баллов (или время выполнения некоторого задания от 32 до 67 сек и т.п.). Построение таблицы абсолютных или относительных частот нецелесообразно, тогда строят таблицу сгруппированных частот следующим образом:

1) Определяют размах варьирования значений: 67-32=35.

2) Выбирают число m и длину интервала h. Часто это определяется произвольно и существенно зависит от объема выборки. В литературе можно найти некоторые рекомендации по выбору числа интервалов, например: m , m и др. Обычно число разрядов не менее 6. В нашем примере: m 3

3) Определяют границы интервалов: с 32 до 36, с 37до 41,…, с 62 до 66. Учитывая, что значение 67 не попало в интервалы и что лучше начинать с 30 или с 31 и заканчивать на 69 или 70, уточняем размах (70-30=40) и число разрядов (40/5=8). Тогда границы разрядов: с 30 до 34, с 35 до 39 …, с 65 до 69.

При измерении непрерывного признака (времени решения задачи) границы интервалов будут совпадать: 30сек -35сек, 35сек – 40сек…

4) Подсчитывают частоту встречаемости значений признака для каждого интервала. В случае непрерывной переменной, если значения попадают на границу двух интервалов, то их количество (частоту) или равномерно распределяют по двум соседним интервалам, или относят везде только к одному, например, правому, или только к левому интервалу.

Частичные интервалы Абсол. частота fa Относит. частота fo Накопленная частота fcum
30 – 34 0,025 0,025
35 – 39 0,05 0,075
40 – 44 0,125 0,2
45 – 49 0,2 0,4
50 – 54 0,25 0,65
55 – 59 0,2 0,85
60 – 64 0,1 0,95
65 - 69 0,05
Σ(сумма) -

 

 

 

 

Таблица 2.

 

Существуют еще таблицы сопряженности признаков – это таблицы совместного распределения частот двух и более признаков, измеренной на одной группе объектов. Они позволяют сопоставить два и более распределения. Столбцы такой таблицы соответствуют категориям (градациям) одного признака, а строки – другого признака.

Например, при изучении вопроса о соотношении возраста работников и их доходов были получены следующие данные:

 

доход испытуемые
молодые средний возраст старые
высокий
средний
низкий

Таблица 3.

Из таблицы видно, что уровень дохода с возрастом уменьшается.

 

3. Для более наглядного представления строятся различные графики статистического распределения, в частности точечная диаграмма, гистограмма и полигон распределения частот. Они строятся в системе координат, причем на оси ОХ откладываются значения или интервалы значений признака, а на оси ОУ – абсолютные или относительные частоты.

В точечной диаграмме данные отмечаются точками, координаты которых соответствуют таблице распределения. Если некоторые значения встречаются несколько раз, их представляют соответствующим количеством точек. Для таблицы 1:

Рис.2.1.

Полигон частот – это графическое представление частотного распределения в результате построения ломаной, отрезки которой соединяют точки с координатами (х1, n1), (х2, n2)… (хк, nк) или (х1, w1), (х2,w2)… (хк, wк)

Рис. 2.2.

Также наглядное описание данных дает и столбиковая диаграмма – гистограмма. Гистограммой частот называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношениям / (плотность частоты).

Аналогично определяется гистограмма относительных частот. Так как длина интервалов одинакова, то обычно деление на опускают и высоты равны абсолютным или относительным частотам. Для таблицы 2:

Рис. 2.3.

Согласно определению площадь каждого столбца гистограммы равна (или пропорциональна) частоте попадания наблюдений в данный интервал: × = . Тогда площадь гистограммы абсолютных частот равна сумме всех частот, т.е. объему выборки n. Для гистограммы относительных частот площадь каждого столбца равна (или пропорциональна) относительной частоте попадания наблюдений в данный интервал: × = i, а площадь всей гистограммы равна 1.

Ясно, что длина интервала существенно влияет на общий вид гистограммы. Чем меньше она, тем больше колебаний на графике, т.к. каждый интервал содержит при этом лишь небольшое число наблюдений. При увеличении длины интервала характерные черты распределения более скрадываются.

Вместо диаграмм и полигона часто изображают сглаженную кривую распределения частот:

 

Рис. 2.4.

Важная особенность этих графиков в том, что независимо от способа изображения, они показывают приблизительно одинаковые распределения.

 

4.Таблицы и графики распределения частот дают важную информацию о форме распределения признака: о том, какие значения встречаются реже, а какие чаще, насколько выражена изменчивость признака. Рассмотрим несколько типичных видов распределений.

В психологических исследованиях чаще всего ссылаются на нормальное распределение, которое характеризуется тем, что крайние значения встречаются редко и частота постепенно повышается от крайних к серединным значениям признака. В исследованиях оно рассматривается в качестве особого эталона – стандарта.

Рис. 2.5.

Нормальным такое распределение называется потому, что оно очень часто встречалось в научных исследованиях и казалось «нормой» всякого массового случайного проявления признаков. При достаточно большом числе наблюдений распределение показателей, полученных при психологических исследованиях, в большинстве случаев приближается к нормальному распределению.

Симметричное – когда распределение формы графика (или частот в таблице) симметрично относительно некоторой оси, проходящей через среднее значение (которое в последующем будем называть модой). Например, нормальное распределение.

Однако на практике, исходя из специфики психологических признаков, очень часто приходится встречаться с частотными распределениями, у которых показатели дают скошенные, срезанные по краям распределения, которые называют асимметричными. Асимметричные распределения бывают левосторонними (или положительными), когда чаще встречаются более низкие значения признака (Рис. 6а), и правосторонними (отрицательными) - с преобладанием частот более высоких значений (Рис. 6б).

а) б)

Рис.2.6.

Такие распределения характеризуются показателем ассиметрии Аs, который показывает степень отклонения графика распределения частот от симметричного вида относительно среднего значения (формулу рассмотрим позже). Для симметричных распределений Аs=0.

Если же вершина графика распределения по сравнению с нормальным более остроконечна (т.е. средние и близкие к средним значения встречаются с высокой частотой) или более плоская (т.е. часто встречаются крайние значения, причем одновременно и более низкие, и более высокие), то такие распределения характеризуются показателем эксцесса Еk. В первом случае он положителен, во втором – отрицателен.

а) б)

Рис. 2.7.

В случае нормального распределения Еk=0.

Частотное распределение с двумя вершинами (модами) называется бимодальным, с несколькими вершинами (модами) – мультимодальным.

Рис. 2.8.

В случае бимодального распределения частоты вершин могут быть и не равны, тогда выделяют большую и меньшую моду.

Сравнивая распределения по графикам и таблицам, можем судить о том, какие значения встречаются реже, а какие чаще в той или иной группе испытуемых, насколько выражена изменчивость признака в каждой из групп. При сравнении групп разной численности следует использовать таблицы и графики относительных частот.

Пример. В группах юношей и девушек при помощи теста измерена тревожность. По результатам измерений построены сглаженные графики распределения относительных частот отдельно для юношей и девушек.

fо

 

юноши девушки

 

 

 


Уровень тревожности

Рис. 2.9.

 

Сравнивая графики, делаем вывод, что юноши в среднем менее тревожны, чем девушки. Но индивидуальные различия – изменчивость – по тревожности выше у юношей, чем у девушек: девушки в этом отношении более похожи друг на друга. Говорят, что значения данного признака более однородны у девушек.

 

 



2018-07-06 528 Обсуждений (0)
Тема 1.2. Табулирование и наглядное 0.00 из 5.00 0 оценок









Обсуждение в статье: Тема 1.2. Табулирование и наглядное

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация...
Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние...
Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (528)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.012 сек.)