Мегаобучалка Главная | О нас | Обратная связь


Структура файла данных



2018-06-29 521 Обсуждений (0)
Структура файла данных 0.00 из 5.00 0 оценок




 

Перед тем как начать ввод данных, необходимо определить структуру будущего файла. Для этого вы должны ответить себе на вопрос, как будут использоваться

 

в анализах те или иные переменные. К сожалению, многие пользователи начина-ют задумываться об этом гораздо позже, чем следует, и в этом кроется причина многих ошибок при проведении анализа данных: чем сложнее план исследования, тем больше шансов на то, что из-за необдуманных действий исследователя он за-вершится неудачей.

 

Итак, первое, что следует сделать, — определить последовательность действий при обработке данных. Кроме того, необходимо четко представлять себе структуру


42 Глава 3.Создание и редактирование файлов данных

 

 

и взаимосвязи переменных в вашем плане исследования. Ниже перечислены наи-более характерные для файлов данных ошибки и недостатки.

 

ff Отсутствуют ключевые переменные (пол, возраст и т. п.), являющиеся основой для анализа.

 

ff Переменная плохо отражает содержание соответствующей реальной величи-ны (например, на сложный вопрос предусмотрено только два варианта ответа: «да» и «нет»).

 

ff При большом количестве независимых переменных отсутствуют зависимые переменные, отражающие цель исследования (или наоборот).

 

ff Недостаточно независимых переменных, влияющих на заданную зависимую переменную.

 

Эти примеры демонстрируют, что залогом успеха как исследования в целом, так

 

и создания файла данных в частности является тщательно продуманный выбор структуры данных.

 

Следует отметить, что структура файла данных должна соответствовать плану ис-следования. С другой стороны, план исследования должен быть составлен так, чтобы его исходные данные можно было бы обработать в соответствии с задачами

 

и гипотезами исследования. Самый оптимальный и простой путь обеспечения этих соответствий — определение структуры данных на этапе планирования исследо-вания, еще до их сбора. Это позволит избежать большинства типичных ошибок, относящихся как к планированию исследования, так и к организации данных.

 

На этапе планирования исследования структура данных может быть задана в виде предварительного списка переменных с указанием их типов и диапазонов возмож-ных значений, например так, как в табл. 3.1.

 

Таблица 3.1.Предварительный список переменных

 

Название Тип Диапазон возможных значений
Идентификационный Номинальная 1–100
  номер      
Пол Номинальная — жен; 2 — муж
Класс Номинальная — А; 2 — Б; 3 — В
Предполагаемый для Номинальная — гуманитарный; 2 — экономический;
  поступления вуз   — технический; 4 — естественно-научный
Внешкольные увлечения Номинальная — спорт; 2 — компьютер; 3 — искусство
6–10 Показатели тестов 1–5 Количественные 1–20
Средний балл за 10-й класс Количественная 3–5
Средний балл за 11-й класс Количественная 3–5

Структура файла данных

 

Каждая переменная — это имеющее значение для исследователя основание, позво-ляющее отличать объекты друг от друга. На предварительном этапе следует вы-делять два типа переменных: количественные и категориальные (номинальные). Количественная переменная позволяет различать объекты по уровню выражен-ности некоторого свойства, например: средний балл отметки, тестовый показатель

 

и пр. Идентификация количественных переменных на предварительном этапе не составляет труда: обычно они соответствуют тому, что исследователь намеревает-ся измерить. Второй тип — категориальные (номинальные) переменные. Обычно они используются как основания для деления объектов (испытуемых) на груп-пы или категории: пол, класс, возрастная категория, уровень дохода и пр. Типич-ная ошибка начинающего исследователя — игнорирование возможных оснований для деления объектов на группы как самостоятельных номинальных переменных в структуре данных.

 

Важным свойством номинальных переменных является возможность их представ-ления в виде набора целых чисел. Например, трем видам внешкольных увлече-ний (хобби) учащихся (спорт, компьютер, искусство) можно сопоставить числа 1, 2, и 3 соответственно. Числовое представление данных в компьютерных програм-мах всегда предпочтительнее символьного, поскольку обработка чисел происходит быстрее, проще и с меньшей вероятностью ошибок. Кроме того, числовое пред-ставление легко модифицировать: вы можете переназначить числа, соответствую-щие созданным элементам, а также (что часто требуется на практике) без проблем включить в анализ новые элементы. Например, если в группе окажется учащий-ся, увлечение которого не соответствует перечисленным, будет полезно включить

 

в переменную хобби категорию с названием другие и присвоить ей число 4. Эта операция рассмотрена подробнее в главе 4.

 

Порядок создания переменных также важен при вводе данных. Здесь следует при-держиваться простого правила: наиболее важные и часто используемые перемен-ные должны помещаться в начало файла, для остальных данных вопрос порядка следования не столь важен, однако рекомендуется объединять их в группы по их «физическому смыслу». Чаще всего в начало файла следует поместить категори-альные переменные, которые далее предполагается использовать для деления объ-ектов (испытуемых) на группы, например пол, семейное положение и пр. Далее можно перечислять остальные сведения, а логическое объединение переменных производить в зависимости от того, какие аспекты они отражают.

 

Ниже мы приведем инструкции, с помощью которых вы сможете приступить к освоению программы SPSS.

 

Шаг 1 Первое, что необходимо сделать, — запустить программу SPSS. В открыв-шемся диалоговом окне выбора режима работы щелкните на кнопке От-мена. Вы получите доступ к окну редактора данных (рис. 3.1).

 

Шаг 2 Перейдите на вкладку Переменные, щелкнув на ее ярлычке мышью (рис. 3.2).


44 Глава 3.Создание и редактирование файлов данных

 

 

Вкладка Данные, которая отображается сразу после запуска редактора, предназначе-на для ввода значений в создаваемый файл данных. Вкладка Переменные позволяет задать структуру файла данных, то есть определить имена, метки и структуры пере-менных. Заголовки столбцов представляют собой параметры каждой из переменных.

 

 

Рис. 3.1.Исходный вид окна редактора данныхSPSS

 

 

Рис. 3.2.Вкладка просмотра переменных окна редактора данных

 

В следующих пошаговых инструкциях мы возьмем за основу данные из файла ex01.sav. Часть содержимого этого файла приведена в конце этой главы. В про-цессе создания файла можно выделить три основных действия: задание имени переменной, определение ее параметров и ввод данных. Необязательно последова-тельно выполнять каждый из трех этапов для каждой переменной; такой порядок выбран лишь в качестве примера. На практике вам может оказаться удобнее соз-давать файл данных «порциями»: сначала вы полностью зададите параметры части переменных, введете их значения, затем зададите новую группу переменных и т. д. Мы же сейчас обратимся к рассмотрению параметров переменных.

 

Имя переменной

 

Параметр Имя определяет имя переменной. Чтобы задать имя первой переменной, просто введите его с клавиатуры в текущую ячейку. Имя второй переменной вво-дится в том же столбце под именем первой, то есть во второй строке; имя третьей переменной — в третьей строке и т. д. Для перемещения между строками пользуй-тесь клавишами ↓ и ↑.


Структура файла данных

 

Если вы пользуетесь одной из ранних версией SPSS (до 12), возможно, вам не удастся воспользоваться кириллицей для задания имен переменных. Ничего страшного: задавайте имена и параметры переменных латинскими буквами.

 

Шаг 3Для задания имен всем переменным файлаex01.savвыполните следующиедействия (должна быть открыта вкладка Переменные редактора данных).

 

1. Введите символ № и нажмите клавишу ↓.

 

2. Введите слово пол и нажмите клавишу ↓.

 

3. Введите слово класс и нажмите клавишу ↓.

 

Аналогичным образом вводятся оставшиеся имена переменных.

 

Как вы, наверное, уже обратили внимание, при переходе на следующую строку (то есть при окончании ввода имени переменной) оставшиеся параметры перемен-ной автоматически заполняются значениями по умолчанию.

 

Имя переменной не является произвольным. Существует ряд соглашений, кото-рым оно должно удовлетворять:

 

ff длина имени — не более 64 символов (в ранних версиях — до 8 символов);

 

ff в имени могут использоваться любые буквы, цифры, символы @, #, ., _, $, однако имя всегда должно начинаться с буквы, а символ «.» (точка) не может стоять в конце имени;

 

ff имена всех переменных должны быть разными;

 

ff буквы верхнего и нижнего регистров символов не различаются, то есть имена ID, id, Id и iD воспринимаются программой как идентичные;

 

ff имена переменных не должны совпадать с каким-либо из зарезервированных слов (all, ne, eq, to, le, lt, by, or, gt, and, not, ge, with).

 

Чтобы не запоминать все ограничения, может быть, вам будет проще пользоваться следующим простым правилом именования переменных. Имя должно быть корот-ким (не более 8 символов), начинаться с буквы и содержать только буквы, цифры и знак подчеркивания. И конечно, имена не должны повторяться.

 

Тип переменной

 

Параметр Тип определяет тип переменной. Если фокус ввода находится в столбце Имя какой-либо из созданных переменных, переместите его в столбец Тип, напри-мер, нажав клавишу Tab, тогда в правой части ячейки появится кнопка с много-точием. Щелчок на ней приводит к появлению на экране диалогового окна Тип переменной, представленного на рис. 3.3.

 

Как видите, текущим типом переменной является тип Числовая. В подавляющем большинстве случаев вам придется иметь дело именно с числовыми данными.

 

В тех редких случаях, когда значения переменных представляют собой буквы или буквосочетания (слова), необходимо установить переключатель Текстовая. Тексто-


46 Глава 3.Создание и редактирование файлов данных

 

 

вые данные, в отличие от числовых, могут включать буквы и другие символы, то есть нести текстовую информацию. Это могут быть ФИО респондентов, города

 

и т. п. В частном случае строковая переменная может хранить число, однако об-работка такого «числа» будет производиться так, как будто оно является текстом. Как правило, строковые переменные не подлежат обработке. Поэтому их следует избегать, за исключением редких случаев, например, когда данная переменная со-держит имена людей или названия городов.

 

 

Рис. 3.3.Диалоговое окно Тип переменной

 

Необходимость в выборе строкового типа может возникнуть в случае, когда дан-ные переносятся из программы Excel в SPSS путем копирования и вставки. Если значения какой-либо из переменных являются буквенными (например, «м» и «ж»), перед вставкой этой переменной необходимо изменить ее тип на строковый. В про-тивном случае буквенные значения вставлены не будут.

 

Остальные 6 типов переменных, которые можно задать с помощью переключате-лей, присутствующих в диалоговом окне, практически не используются при обра-ботке данных, и поэтому мы не будем на них останавливаться.

 

Поскольку все переменные имеют установленный по умолчанию тип Числовая, никаких дополнительных действий с ними производить не нужно.

 

Ширина переменной

 

Параметр Ширина позволяет задать максимальное количество знаков, которое может иметь значение переменной, включая дробную часть. Например, ширина переменной № (идентификатор) составляет 3 знака, поскольку числа, которые мы намерены вводить, содержат от 1 до 3 знаков. На практике заранее опреде-лить ширину переменной гораздо труднее, поскольку не всегда известно, какие данные нам понадобится вводить в будущем. Поэтому следует задавать ширину переменной с гарантированным запасом: ее можно ограничить потом, после ввода данных.


Структура файла данных

 

В большинстве случаев нет необходимости менять заданную по умолчанию шири-ну переменной.

 

Зададим для всех переменных ширину 3 знака.

 

Шаг 4 Для задания ширины переменных выполните следующие действия.

 

1. С помощью клавиш со стрелками переместите фокус ввода в ячейку столбца Ширина, соответствующую переменной №, и задайте значе-ние 3. В ячейке должно остаться значение ширины, равное 3.

 

2. Наведите курсор мыши на ячейку столбца Ширина, соответствующую переменной №, нажмите правую кнопку мыши и выберите Копировать.

 

3. При помощи мыши вставьте скопированное значение для всех остальных переменных. Для этого выделите ячейки столбца Ширина соответствую-щих переменных, нажмите правую кнопку мыши и выберите Вставить.

 

Дробная часть числа

 

Параметр Десятичные предназначен для задания числа десятичных знаков после запятой в случае, если тип переменной допускает использование дробных чисел. Для строковых переменных значение в ячейке Десятичные автоматически уста-навливается равным нулю, а для числовых переменных — равным 2. У строковых переменных значение параметра Десятичные недоступно для изменения.

 

Когда фокус ввода оказывается в ячейке столбца Десятичные, справа появляются две кнопки счетчика. Щелкая на этих кнопках, вы можете изменять текущее количество знаков после запятой. Изначально у всех числовых переменных оно равно 2.

 

В файле ex01.sav знаки после запятой необходимы для переменных отметка1 и от-метка2, причем количество этих знаков равно 2 и задано программой по умолча-нию. Таким образом, задача заключается в том, чтобы установить для всех осталь-ных числовых переменных значение параметра Десятичные равным 0. Отметим, что это не является необходимым, а служит для удобства отображения данных на экране или в отчете.

 

Шаг 5 Для задания числа десятичных знаков в переменных выполните следую-щие действия.

 

1. С помощью клавиш со стрелками переместите фокус ввода в ячейку столбца Десятичные, соответствующую переменной №, и дважды щелк­ ните на нижней кнопке счетчика. В ячейке должно остаться значение, равное 0.

 

2. С помощью клавиш со стрелками переместите фокус ввода в ячейку столбца Десятичные, соответствующую переменной пол, и дважды щелк­ ните на нижней кнопке счетчика. В ячейке должно остаться значение, равное 0.

 

3. Аналогичные действия повторите для остальных переменных, кроме переменных отметка1 и отметка2.


48 Глава 3.Создание и редактирование файлов данных

 

Метки переменных

 

С помощью параметра Метка можно создать метку переменной. Как правило, метка используется в тех случаях, когда смысл переменной недостаточно точно отражен в названии. По сути, метка — это комментарий к имени переменной. При желании вы можете отобразить метки переменных в окне вывода вместо их имен.

 

Ячейки столбца Метка представляют собой обычные текстовые поля, в которые вы можете вводить текст меток. Длина метки не должна превышать 256 симво-лов. Ограничений на используемые символы нет. Но помните о том, что слишком длинные метки ухудшают удобочитаемость фрагментов, в которых они присут-ствуют. Как показывает практика, 20–30 символов вполне достаточно, чтобы опи-сать назначение переменной. И чем короче метка, тем лучше.

 

Если какая-либо из надписей окажется длиннее текущей ширины столбца, послед-няя автоматически увеличится до необходимого размера. Если вам не обязательно видеть все надписи целиком, вы можете задать ширину столбца вручную. Для этого подведите указатель мыши к правой границе ячейки с меткой столбца — ука-затель примет вид двух стрелок, направленных в разные стороны. Нажмите левую кнопку мыши и, удерживая ее нажатой, перетащите правую границу столбца на новое место. Аналогичным способом можно перетаскивать границу любых столб-цов и тем самым оформлять вкладку Переменные по своему вкусу.

 

Шаг 6 Для ввода меток выполните следующие действия.

 

1. С помощью клавиш со стрелками переместите фокус ввода в ячейку столбца Метка, соответствующую переменной тест1, введите словосо-четание счет в уме и нажмите клавишу Enter.

 

2. С помощью клавиш со стрелками переместите фокус ввода в ячейку столбца Метка, соответствующую переменной тест2, введите словосо-четание числовые ряды и нажмите клавишу Enter.

 

3. Для переменной тест3 введите слово словарь, для переменной тест4 — слово осведомленность, для переменной тест5 — словосочетание крат-

ковременная память.

 

 



2018-06-29 521 Обсуждений (0)
Структура файла данных 0.00 из 5.00 0 оценок









Обсуждение в статье: Структура файла данных

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Организация как механизм и форма жизни коллектива: Организация не сможет достичь поставленных целей без соответствующей внутренней...
Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы...
Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (521)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.011 сек.)