Основные типы задач кластер-анализа и основные типы кластер-процедур
Типы задач кластер-анализа выделяются в зависимости от объема n совокупности классифицируемых Х1, Х2, …Хn Тип Б1: задачи классификации сравнительно небольших по объему совокупностей наблюдений, не более чем несколько десятков (например, страны, города, пр-ия и тд) Тип Б2: задачи классификации больших массивов многомерных наблюдений n-порядка нескольких сотен и тысяч (например, семьи, изделия, индивидуумы и тп) С точки зрения априорной информации об окончательном числе разбиваемой совокупности объектов задачи кластер-анализа можно подразделить на три основных типа: (а) число классов априори задано; (б) число классов подлежит определению (оценке); (в) число классов неизвестно, но его определение не входит в условие задачи; требуется построить так называемое иерархическое дерево исследуемой совокупности , или дендограмму. Три типа обслуживающих кластер-анализ кластер-процедур: · Процедуры иерархические, предназначенные в основном для решения задач типа Б1,(в). Процедуры параллельные, предназначены для решения задач типов Б1 (а) и Б1 (б). Реализуются с помощью итеративных алгоритмов. · Процедуры последовательные предназначены для решения задач типов Б2(а) и Б2 (б). 48. Основное содержание задачи снижения размерности исходной системы данных. Метод главных компонент. Априорное допущение: существует небольшое число (в сравнении с числом р исходных анализируемых признаков 1. Отбор наиболее информативных показателей (включая выявление латентных факторов).Имеется в виду решение задачи от отборе из исходного (априорного) множества признаков Пример 1. Если критерий Пример 2. Если критерий Пример 3. Критерий 2. Сжатие массивов обрабатываемой и хранимой информации.Этот тип задач тесно связан с предыдущими, в частности, требует в качестве одного из основных приемов решения построения экономной системы вспомогательных признаков, обладающей автоинформированностью, т.е. свойством автопрогноза. Классификации зачастую позволяют перейти от массива, содержащего информацию по всем nстатистически обследованным объектом, к соответствующей информации только по k эталонным образцам Визуализация данных. При формировании рабочих гипотез, исходных допущений о геометрической и вероятностной природе совокупности анализируемых данных 3. Построение условных координатных осей (многомерное шкалирование. Латентно-структурный анализ).В данной постановке задачи исходной координатной системы не существует вовсе, а подлежащие статистическому анализу и моделированию данные представлены в статистическом варианте, т.е матрица из элементов Ставится задача: для заданной, сравнительно невысокой размерности
Метод главных компонент – переход к новым объясняющим переменным, линейным комбинациям старых. 1) Центрирование переменных 2) Решение характеристического уравнения a) Нахождение собственных чисел b) Нахождение для каждого собственного числа 3) Переход к новым переменным 4) Построение линейной регрессии 5) Проверка гипотез 6) При необходимости переход к исходной модели
Популярное: Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... Личность ребенка как объект и субъект в образовательной технологии: В настоящее время в России идет становление новой системы образования, ориентированного на вхождение... ![]() ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (581)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |