Показатели качества работы нейронной сети
Обучение нейронной сети с учителем — это настройка ее весов и смещений, минимизирующая некоторый функционал ошибки, зависящий от ошибок сети, то есть разности между желаемыми и реальными сигналами на выходе сети. В процессе обучения сети оцениваются три вида ошибок: 1. Ошибка конкретного выхода сети на конкретном входном векторе. 2. Ошибка всех выходов сети, например, средняя ошибка, при конкретном входном векторе. Эта ошибка показывает, насколько правильным является ответ сети на конкретный входной вектор. 3. Ошибка всех выходов сети по всему набору обучающих примеров. Эта ошибка показывает, насколько хорошо сеть усвоила закономерности обучающего набора данных. При обучении сети наиболее применяемыми градиентными методами не гарантируется достижение глобального минимума функционала ошибки. Обычно достигается один из локальных минимумов. Поэтому производятся многократные эксперименты по обучению сети. Из-за случайного задания начальных значений весов и смещений средняя ошибка в каждом эксперименте будет различной. По минимуму средней ошибки выбирается лучший вариант параметров сети. Для выбора лучшего варианта желательно оценивать не только среднее значение ошибки, но и среднеквадратическое отклонение ошибки, по которому можно получить погрешность вычисления функционала ошибки. В качестве функционалов ошибок используются следующие функционалы [1, 2, 38]. Чаще всего функционалы основаны на сумме квадратов ошибок (SSE — sum squared error)
где Для упрощения записи в и в последующих формулах используется один индекс. В случае вычисления ошибки всех выходов сети по всему набору обучающих примеров подразумевается суммирование по всем выходам и всем примерам. Очень часто используется среднеквадратическая ошибка (MSE — mean-square error)
При выводе формул обучения будем использовать вариант ошибки MSE
Коэффициент Иногда используется ошибка RSE — root squared error
Дляпредотвращает чрезмерного роста весов и смещений в процессе обучения используется комбинированная ошибка [2, 38]
где Функционал Средняя квадратическая ошибка с учетом уровня надежности обучения [2] используется в классификаторах
где Рекомендуются [2] следующие значения Среднеквадратическая ошибка с весами позволяет корректировать влияние отдельных обучающих примеров
где Например [2], если обучающие примеры принадлежат нескольким классам и Известно [1], что при решении задач классификации в качестве функции активации целесообразно применять функцию softmax . Тогда выход сети трактуется как вероятность принадлежности входного вектора определенному классу. В качестве функционала ошибки в этом случае используется кросс‑энтропия (перекрестная энтропия) [39]. Если сеть производит классификацию входных векторов на два класса, то сеть имеет единственный выход. В качестве функции активации логистическая функция (2.7). В случае пакетного режима обучения ошибка по всему набору обучающих примеров равна [1]
где Если сеть производит классификацию входных векторов более чем на два класса, то в качестве функции активации рекомендуется использовать функцию softmax (2.11). Функционал ошибки всех выходов сети по всему набору обучающих примеров тогда будет иметь вид [1]
где Чем ближе вероятностное распределение выходных величин сети к целевому, тем меньше значение кросс‑энтропии.
Популярное: Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние... ![]() ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (2828)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |