Предварительные процедуры.
Прежде чем прибегнуть к помощи методов сравнительного анализа, необходимо выполнить определенные преобразования. Исходным и одновременно самым важным шагом, предопределяющим правильность конечных результатов, является формирование матрицы наблюдений. Эта матрица содержит наиболее полную характеристику изучаемого множества и благодаря этому играет важнейшую роль в проводимом исследовании. В качестве элементов данной матрицы мы можем рассматривать уровни ряда, абсолютные приросты, темпы роста или темпы прироста.
Где m- число единиц, n-число признаков, Признаки, включенные в матрицу наблюдений, неоднородны, поскольку описывают разные свойства объектов. Кроме того, различаются их единицы измерения, что еще более затрудняет выполнение некоторых арифметических действий, необходимых в отдельных процедурах. Поэтому необходимо привести данные в сопоставимый вид, это можно сделать либо с помощью стандартизации или с помощью нормирования. Стандартизация производится в соответствии с формулой
Где k = 1,2,…,n ;
или
После приведения данных в сопоставимый вид переходят к заключительной процедуре – расчету элементов матрицы сходства . Сходство может рассматриваться в 2-х аспектах. 1)сходными считаются годы(моменты времени), между которыми незначимые расстояния, и соответственно в качестве матрицы сходства берется матрица расстояний: чем меньше расстояние между годами тем они имеют больше сходство по данной системе показателей. В настоящее время существует более 10 алгоритмов расчета расстояний между объектами, но чаще используются 2 алгоритма: Среднее абсолютное расстояние Среднее Эвклидово расстояние
Где символ Элементы этой матрицы служат основой для проведения исследований с помощью таксономических процедур. Они обладают следующими свойствами: 1. 2. 3. неравенство треугольника Те методы классификации, в которых используется в качестве матрицы сходства матрица расстояний, называются таксономическими. 2)В качестве матрицы сходства может быть использована матрица коэффициентов корреляции. Эту матрицу можно представить следующим образом:
Где символ Свойства матрицы корреляции: 1. 2. 3. Методы классификации основанные на матрицах корреляции называются факторными. В данном случае чем выше взаимосвязь между моментами времени по изучаемой системе показателей тем выше их сходство. 2.1 Вроцлавская таксономия: дендрит.
Метод вроцлавской таксономии часто называют методом дендритов. Под дендритом понимают ломаную, которая может разветвляться, но не может содержать замкнутых линий, и такая, что любые две точки множества Z ею соединены.Этим методом получают нелинейное упорядочение изучаемых единиц, что, с одной стороны, полнее характеризует действительность, но, с другой стороны, создает больше трудностей при интерпретации. Нелинейное упорядочение характеризуется отсутствием явной иерархии, выражающимся в том, что некоторые единицы могут быть связаны с большим числом других единиц. В этом случае отсутствует четко определяемый порядок, не известно, какой элемент является предшествующим, а какой последующим.
Рис.2.1 Линейное упорядочение единиц
Рис.2.2 Нелинейные упорядочения единиц Предоставленные на рисунках упорядочения, очевидно, не исчерпывают все возможные ситуации. В связи с этим возникает задача выбора наилучшего упорядочения, заключающегося в нахождении такого дендрита, в котором смежные единицы будут иметь различающиеся значения признаков. Выполнение этого условия приведет к упорядочению с наименьшими расстояниями между отдельными элементами. В оптимальном дендрите – с наименьшей суммой длин связей – смежные объекты в наименьшей степени отличаются друг от друга. Поэтому при сравнении различных упорядочений объектов и выборе наилучшего упорядочения исходят из длины связей дендрита. Построение оптимального дендрита заключается в установлении связей между единицами, наименее отличающимися друг от друга. С этой целью из составленной матрицы расстояний выбирают единицы с близкими значениями признаков. Поиск таких единиц проводится путем нахождения наименьших чисел в каждом столбце (или строке) матрицы. Искомые ближайшие единицы обозначены номерами строк(или столбцов), в которых находятся наименьшие числа. Если, например, надо найти единицу, наименее отличающуюся от i, то достаточно отыскать наименьшее число в столбце j. Пусть этим числом будет элемент Способ построения оптимального дендрита состоит из нескольких этапов. На первом этапе устанавливаются связи каждой из исследуемых единиц с ближайшими единицами. Для удобства описания выполняемых операций предположим, что у нас имеется множество единиц, обозначаемых символами 1,2,3,4,5,6,7,8,9. Далее предположим, что в этом множестве из девяти элементов получены следующие сочетания ближайших единиц(рис.3).
Рис.2.3 Сочетание ближайших единиц Нетрудно заметить, что некоторые связи встречаются дважды, например 1-3 и 3-1. Поскольку при построении дендрита очередность установления связей не играет роли, одно из повторяющихся сочетаний всегда исключаются. Подобное исключение проводится для всех выделенных пар связей. Это приводит к тому, что остаются связи 2-7 и 8-9, а связи 7-2 и 9-8 отбрасываются. Для оставшихся двух связей характерно наличие единицы, обозначаемой номером 5, поэтому связи 4-5 и 5-6 объединяют в один общий набор. В результате получаются четыре отдельных конструкций, называемые скоплениями 1-го порядка(рис.4).
Рис.2.4 Скопления 1-го порядка.
Рис.2.5 Дендрит, построенный на единицах исследуемого множества Разбиение оптимального дендрита на группы однородных элементов может осуществляться одним из 2-х способов: 1)Искусственное разбиение. Пусть на основании некоторой априорной информации нам известно число однородных грум и пусть это число равно k. Тогда разбиение осуществляется очень просто: из дендрита удаляются k-1самых длинных связей. 2)Естественное разбиение. Что произвести подобное естественное разбиение, необходимо выполнить следующие действия. Прежде всего, связи дендрита, построенного на единицах изучаемого множества, упорядочиваются по убыванию их длины. Затем строятся отношения длин соседних связей:
Где Следующая операция заключается в нахождении значения k, для которого выполняется соотношение, являющееся основанием разбиения множества естественным образом. Этой цели служит неравенство:
Может оказаться, что в ряду вычисленных отношений приведенное неравенство будет выполнятся несколько раз. В этом случае вводится дополнительное условие. Оно позволяет выбрать лучшее из двух естественных разбиений Метод шаров.
Перед описанием этого метода дадим геометрическую модель для простейшего случая двумерного пространства. Единицы исследуемого множества характеризуются только двумя признаками и изображаются точками на плоскости. Тогда их можно представить как множество точек Для выполнения дальнейших преобразований необходимо знать некоторую величину Дальнейшее разбиение производится подобным же образом, но число элементов множества уменьшается за счет элементов первого подмножества
Рис.2.6 Разбиение множества единиц, характеризуемых двумя признаками. На рис. 2.6 показано расположение пяти точек-единиц. Поскольку эти единицы описываются только двумя признаками, их можно поместить на плоскости. После вычерчивания кругов и подсчета числа точек в них не трудно убедится, что первое подмножество образуют точки- единицы заштрихованного круга. Опишем теперь общий порядок действий, относящихся к пространству произвольной размерности. Пусть дано множество
Затем подсчитывается число точек Если обозначить через Дальнейшие действия производятся таким же самым образом , только относятся не ко всем объектам, а лишь к тем, которые остались после исключения первого подмножества. Это значит, что при дальнейшем выделении подмножеств рассматривается множество Описанная процедура, очевидно, продолжается до момента полного исчерпания множества Теперь осталось выяснить проблему, связанную с оценкой величины В первом Во втором Величина В результате применения рассмотренного метода получаются подмножества, однородные в смысле изотропности, т.е. подмножества точек-данных, которые расположены в многомерном пространстве так, что по форме облако рассеивания больше похоже на шар чем на эллипсоид. С точки зрения потребностей экономического моделирования подобные подмножества представляют собой результат искусственного , навязанного, а не естественного разбиения исследуемой совокупности объектов. При таком способе разбиения существует потенциальная возможность разделить действительно однородные объекты. Подобное нежелательное разбиение может возникнуть вследствие того, что в значениях признаков присутствуют обе компоненты( структуры и потенциала).
Популярное: Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы... Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... Личность ребенка как объект и субъект в образовательной технологии: В настоящее время в России идет становление новой системы образования, ориентированного на вхождение... ![]() ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (262)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |
|||||||||||||||||||||||||||||||||||||||||||||