Мегаобучалка Главная | О нас | Обратная связь


Исходные данные для решения поставленной задачи



2020-02-04 223 Обсуждений (0)
Исходные данные для решения поставленной задачи 0.00 из 5.00 0 оценок




 

Хотя нейросетевые модели являются весьма эффективными в задачах оценки, их построение связано с двумя группами проблем, которые необходимо учитывать при предобработке данных. Во-первых, в отличие от ряда развитых стран (например, США, за исключением нескольких штатов), в Украине отсутствует система обязательного публичного раскрытия информации о сделках с недвижимостью, при которой сумма сделки и основные характеристики помещения, подлежащего продаже или сдаче в аренду, предоставляются в форме анкеты в соответствующие органы и агрегируются на открытых веб-сайтах. В связи с этим информация о сделках с недвижимостью крайне ограничена и не вполне достоверна.

Для решения этой проблемы были применены несколько методов, что позволило существенно повысить качество исходных данных. Семантические анализаторы, основанные на регулярных выражениях, применялись для анализа текстов объявлений и выявления в них максимума информации, заданной в неформализованном текстовом виде. Набор решающих правил позволил исключить заведомо абсурдные анкеты, содержащие неправдоподобное сочетание признаков объекта недвижимости. Матрицы граничных значений, составленные на основе эмпирических данных рынка недвижимости и статистического анализа выбросов, позволили отсечь объявления с заведомо недостоверной ценовой информацией.

Во-вторых, классические приёмы математического моделирования экономических процессов лучше всего работают в случае, когда все зависимые факторы являются количественными. В задаче определения цены объекта недвижимости факторное пространство устроено значительно сложнее. Большинство ценообразующих факторов являются неупорядоченными (например, престижность района) или упорядоченными категориями (близость к реке: район граничит с рекой или нет). Важную роль играет также расположение объекта – географический фактор, кодирование которого представляет собой нетривиальную задачу. Простое использование географических координат не является решением проблемы, т.к. координаты – не ценообразующие факторы.

Первичный набор факторов, определявшийся экспертным путём с учётом наличия достаточного количества информации в основных риэлтерских базах, составил:

– выходная переменная: цена продажи объекта недвижимости;

– количественные факторы: общая площадь помещения (кв.м.);

– географические факторы: расположение объекта.

Количественные факторы (с учётом преобразований) используются в модели в неизменном виде.

Преимущество нейронных сетей перед моделями множественной регрессии состоит в том, что нет необходимости преобразовывать упорядоченные категории в набор бинарных переменных, теряя порядок значений, обусловленный экономическими причинами. Т.к. зависимости в нейронных сетях нелинейны, достаточно указать произвольные числовые значения, монотонно связанные с уровнями фактора, например, последовательные целочисленные значения или усреднённые значения цены в разрезе соответствующих категорий.

Статистические данные цен продаж, индексы стоимости жилья города Киева, а также основная первичная информация была предоставлена агентством недвижимости «Планета Оболонь».

Данные о ценах продаж квартир на вторичном рынке Киева приведены в таблице 5.1. Анализируя их, необходимо учитывать, что статистика цен продаж построена на основе ограниченного количества сделок.

 

Таблица 5.1 – Статистические данные цен реальных продаж в первом квартале 2010 года

Тип жилья

Дата

Однокомнат-ные

Двухкомнат-ные

Трехкомнат-ные

Многокомнат-ные

Цена в $ за м2 Изме-нение в % Цена в $ за м2 Изме-нение в % Цена в $ за м2 Изме-нение в % Цена  в $ за м2 Изме-нение в %

Дореволюционные

01.01.2010 3382

-2,9

4176

-3,0

3699

-1,9

2055

-4,4

01.05.2010 3283 4052 3627 2185

Сталинки

01.01.2010 2673

-4,6

2968

-8,3

3006

-8,3

3231

-7,1

01.05.2010 2550 2721 2758 3001

Старая панель

01.01.2010 1971

-1,5

1746

-0,4

1829

-3,8

2129

-0,7

01.05.2010 1941 1739 1759 2114

Старый кирпич

01.01.2010 2062

-0,1

2072

-3,2

2170

-8,3

2340

1,3

01.05.2010 2060 2005 1990 2371

Типовая панель

01.01.2010 1916

-1,9

1831

-0,9

1747

-1,8

1753

-5,8

01.05.2010 1879 1815 1716 1652

Украинская панель

01.01.2010 1656

0,0

1613

-3,8

1604

-11,5

1740

-3,3

01.05.2010 1656 1552 1419 1683

Украинский кирпич

01.01.2010 1974

-3,4

2127

-0,5

2246

-2,9

2913

1,0

01.05.2010 1906 2117 2181 2943

Улучшенная типовая панель

01.01.2010 1795

-2,0

1697

-3,4

1711

-3,3

1848

-4,5

01.05.2010 1759 1640 1655 1765

Улучшен-ный кирпич

01.01.2010 2104

-4,6

2368

-9,6

2422

-4,5

4252

-5,9

01.05.2010 2007 2140 2313 4448

 

К некоторым из факторов были применены соответствующие функциональные преобразования. Цены и площади помещения были прологарифмированы. Все факторы были нормированы путём вычитания минимального значения и деления на размах вариации.

Для наглядности ниже приведена (таблица 5.2) реальная выборка, содержащая 13 входных параметров, которые необходимо использовать для построения прогностической системы оценки стоимости жилья в Киеве. Выборка составила суммарно 496 наблюдения. Она была случайно разделена на обучающую (80%), валидационную (10%) и тестовую (10%).

 

Таблица 5.2 – Входные данные, построенные по индексам «Планеты Оболонь»

месяц

Входы ИНС(Хi)

Выход ИНС

Январь

0,0063 18 2,31 0 0,538 6,575 65,2 4,09 1 296 15,3 396,9 4,98 24
0,0273 0 7,07 0 0,469 6,421 78,9 4,9671 2 242 17,8 396,9 9,14 21,6
0,0272 0 7,07 0 0,469 7,185 61,1 4,9671 2 242 17,8 392,83 4,03 34,7
0,0323 0 2,18 0 0,458 6,998 45,8 6,0622 3 222 18,7 394,63 2,94 33,4

…..

Февраль

0,0690 0 2,18 0 0,458 7,147 54,2 6,0622 3 222 18,7 396,9 5,33 36,2
0,0298 0 2,18 0 0,458 6,43 58,7 6,0622 3 222 18,7 394,12 5,21 28,7
0,0882 12,5 7,87 0 0,524 6,012 66,6 5,5605 5 311 15,2 395,6 12,43 22,9
0,1445 12,5 7,87 0 0,524 6,172 96,1 5,9505 5 311 15,2 396,9 19,15 27,1
…. …. ….. …. ….. …… ….. …… ….. ….. …… ……. …… ……
Май 0,17899 0 9,69 0 0,585 5,67 28,8 2,7986 6 391 19,2 393,29 17,6 23,1

 

При этом формируя выборку определенного размера, можно всегда скорректировать количество входных и выходных данных (взять меньше чем присутствует в таблице, таким образом оставшиеся наборы просто не будут участвовать в обучении). Т.е. выборка не будет терпеть каких- либо изменений что упростит работу при моделировании.

Пример прогнозирования оценки рыночной стоимости недвижимости.Исследования проводились на основе модели сети с разными архитектурами (РБФ и МП) и были выбраны наилучшие сети по ряду характеристик. Целью проводимых экспериментов было построение нейросетевой прогностической системы с наименьшей ошибкой тестирования. Для достижения данной цели было проведено исследованиевлияния представления исторических и прогнозируемых данных на ошибкупрогнозирования. Также были рассмотрены вопросы влияния структурынейронной сети на скорость обучения и ошибку прогнозирования.

 



2020-02-04 223 Обсуждений (0)
Исходные данные для решения поставленной задачи 0.00 из 5.00 0 оценок









Обсуждение в статье: Исходные данные для решения поставленной задачи

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы...
Организация как механизм и форма жизни коллектива: Организация не сможет достичь поставленных целей без соответствующей внутренней...
Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (223)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.009 сек.)