Кластерный анализ матрицы различий (сходства)
Довольно часто исходной информацией для кластерного анализа являются не дан-ные типа «объекты-переменные», а непосредственно данные о различии (сходстве) объектов. Например, респондент может оценивать различие (сходство) объектов, предъявляемых попарно, с перебором всех пар объектов. Или данными могут быть частоты совместной встречаемости для каждой пары объектов. В этих случаях ис-ходные данные представляют собой квадратную матрицу, как правило, симметрич-ную относительно главной диагонали, каждый элемент которой — мера различия (или сходства) пары объектов, которым соответствует строка и столбец матрицы.
В сожалению, кнопочный интерфейс программы SPSS не позволяет обрабатывать матрицы различий методами кластерного анализа (в многомерном шкалировании это возможно). Поэтому для обработки таких данных следует обратиться к ко-мандному языку Синтаксис (Syntax).
в SPSS предусмотрен формат данных для матрицы различия (сходства). При по-мощи синтаксиса такая матрица создается следующим образом1. Для создания командного файла Синтаксис необходимо открыть окно редактора синтаксиса, вы-брав команду Открыть Синтаксис в меню Файл. Предположим, необходимо создать матрицу различий 8 × 8 с именами объектов a b c d e f g h. Для этого в открытом окне Редактор синтаксиса следует ввести следующий текст (не важно, прописными иди строчными буквами):
DATA LIST FREE /ROWTYPE_(a8) VARNAME_(a8) a b c d e f g h.
В Решение проблемы заимствовано с сайта http://www.spsstools.ru (А. Балабанов, Raynald's SPSS Tools по-русски).
END DATA.
EXECUTE.
VALUE LABELS ROWTYPE_ 'PROX' 'DISIMILARITY'.
Результатом выполнения этой команды будет создание матрицы различий 8 × 8 в окне редактора данных.
Матрица может содержать меры не различия, а сходства, например, если каждое значение матрицы — частота совместной встречаемости. Тогда последнюю строку следует заменить на следующую:
VALUE LABELS ROWTYPE_ 'PROX' 'SIMILARITY'.
Чтобы выполнить введенную команду, ее нужно выделить и щелкнуть на кнопке Запустить выделенный фрагмент панели инструментов. Второй вариант запуска — выбрать в меню команду Запуск Все. Имейте в виду, что любой пропущенный знак, включая завершающую точку или неверно написанное слово, приведет к вы-даче программой сообщения об ошибке.
После выполнения команды в редакторе данных можно заменить полученную ма-трицу на свои данные, следя за тем, чтобы количество строк равнялось количеству столбцов, в каждой строке переменной ROWTYPE_ стояло значение DISIMILARITY (или SIMILARITY, если данные — меры сходства), а в строках переменной VARNAME_ присутствовало имя объекта.
Для выполнения кластерного анализа методом межгруппового связывания с выво-дом таблицы шагов агломерации и дендрограммы следует выполнить следующий синтаксис:
CLUSTER
/MATRIX IN (*)
/METHOD BAVERAGE
/PRINT SCHEDULE
/PLOT DENDROGRAM.
Вся синтаксическая конструкция, создающая матрицу различий 8 × 8 (попарных различий 8 объектов) и выполняющая кластерный анализ указанным методом сохранена в папке примеров Examples в файле под именем Synt_Clust.sps1. При желании вы можете открыть этот файл и выполнить его указанным выше спо-собом без предварительной редакции или отредактировав. Например, вы можете заменить указание матрицы различий на задание матрицы сходства. Для этого
и Все файлы данных, включая и указанный файл «синтаксис», вы можете найти по адресу http:// www.piter.com/books/download/978591180318. 302 Глава 21.Кластерный анализ
достаточно заменить в строке VALUE LABELS ROWTYPE_ слово DISIMILARITY на слово
SIMILARITY.
Популярное: Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы... Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация... Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние... Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (1423)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |