Нейронные сети - теория и приложения. — различия между версиями
Строка 75: | Строка 75: | ||
Набор данных для обучения | Набор данных для обучения | ||
inputs = [1:10]; | inputs = [1:10]; | ||
− | targets =inputs.*inputs; | + | targets =inputs.*inputs; |
− | |||
Создание сети с i*2 нейронами | Создание сети с i*2 нейронами | ||
hiddenLayerSize = i*2; | hiddenLayerSize = i*2; | ||
net = fitnet(hiddenLayerSize); | net = fitnet(hiddenLayerSize); | ||
− | |||
subplot(2,3,i) | subplot(2,3,i) | ||
plot(inputs,targets,'r') | plot(inputs,targets,'r') | ||
Строка 88: | Строка 86: | ||
net.divideParam.valRatio = 20/100; | net.divideParam.valRatio = 20/100; | ||
net.divideParam.testRatio = 0/100; | net.divideParam.testRatio = 0/100; | ||
− | |||
− | |||
Обучение | Обучение | ||
[net,tr] = train(net,inputs,targets); | [net,tr] = train(net,inputs,targets); | ||
− | |||
Тестирование | Тестирование | ||
inputs=[1:0.1:20] | inputs=[1:0.1:20] |
Текущая версия на 16:17, 24 мая 2012
Содержание
Искуственные нейронные сети[править]
Нейронная сеть это вычислительная модель, созданная на основании исследований работы нервной системы человека как попытка создания искуственного интелекта. Разумеется это лишь упрощенная модель, которая не отражает всей сложности процессов происходящих в мозгу человека, однако она нашла применение в областях, где традиционные методы расчета не применимы.В основном это решение задач, сформулировать которые математически крайне сложно, а зачастую и невозможно. Искуственные нейронные сети применяются для:
- Распознование образов
Символов,звуков,анализ изображений. Сеть обучается набором известных образов, а затем может самостоятельно классифицировать до этого не известные ей образы.
- Управление
Создание так называемых мастер-систем, способных принимать решение подобно человеку, управлять техникой даже в случае поломок. Мастер-системы характеризуются значительной адаптивностью. Как правило на вход подаются данные о состоянии системы (Например ориентация самолета в пространстве, его скорости,параметры среды и желаемое направление полета),а на выходе сеть сообщает управление,которое необходимо применить к систем, с целью минимизации функции оценки(например расхождение текущего курса с желаемым).
- Составление прогнозов
Например на котировки акций, сеть обучается по архивам биржи,а затем строит предположение о развитии ситуации на рынке.
- Ассоциативная память
Сети способны запоминать информацию подобно человеческому мозгу, что способствует эффективному сжатию
Структура сети[править]
Сеть состоит из элементов называемых нейронами, соединенных связями, причем каждая связь характеризуется весом. Вес - это коэффициент на который умножается сигнал при прохождении через связь. Нейроны объединяются в слои, нейронная сеть обязательно имеет входной и выходной слои. Количество внутренних или скрытых слоев может быть произвольным, однако по мере увеличения их количества усиливается память сети, что негативно влияет на обучение. Поэтому обычно используются сети с меньшим количеством слоев, но с большим количеством нейронов в каждом.
Активация нейронов[править]
Каждый нейрон представляет из себя некоторую функцию,ее называют функцией активации. В зависимости от предназначения сети испольуются различные типы :
- Бинарные
В зависимости от значения поступившего на вход, нейрон возвращает либо 0 либо 1. Чаще всего используется Функция Хевисайда
- Линейные
- Нелинейные
Нелинейные функции акивации позволяют добиваться результатов меньшим числом нейронов. Наиболее используемой является сигмоидная функция.
Обучение[править]
Для обучения применяется алгоритм обратного распространения ошибки. У сети есть множество входов
, Обозначим через вес, стоящий на ребре, соединяющем i-й и j-й узлы, а через — выход i-го узла. Если нам известен обучающий пример (правильные ответы сети ), то функция ошибки, полученная по методу наименьших квадратов, выглядит так:
На каждом шаге будем добавлять к весу.
- ,
где
-- множитель, задающий скорость "движения".
Алгоритм[править]
При программировании алгоритм выглядит следующим образом:
- Для всех d от 1 до m:
- Подать на вход сети и подсчитать выходы каждого узла.
- Для всех
- .
- Для каждого уровня l, начиная с предпоследнего:
- Для каждого узла j уровня l вычислить
- .
- Для каждого ребра сети {i, j}
- .
- .
- Выдать значения .
где
- коэффициент инерциальнности для сглаживания резких скачков при перемещении по поверхности целевой функцииИспользование[править]
На практике, удобнее разрабатывать алгоритмы в пакете Matlab, где для работы с нейронным сетями есть Neural Network Toolbox. Его средствами можно построить сеть и обучить ее на наборе данных. Для удобства пользователя предусмотрен GUI который запускается командой >>nnstart
Кроме того, можно использовать инструменты NNToolbox прямо в коде
Попробуем решить простейшую задачу экстраполяции на примере параболы.
for i=1:6 Набор данных для обучения inputs = [1:10]; targets =inputs.*inputs; Создание сети с i*2 нейронами hiddenLayerSize = i*2; net = fitnet(hiddenLayerSize); subplot(2,3,i) plot(inputs,targets,'r') hold on Разделение данных на набор для обучения,валидации и тестирования net.divideParam.trainRatio = 80/100; net.divideParam.valRatio = 20/100; net.divideParam.testRatio = 0/100; Обучение [net,tr] = train(net,inputs,targets); Тестирование inputs=[1:0.1:20] outputs = net(inputs); plot(inputs,outputs) end
Результат для 2,4,6,8,10,12 нейронных сетей. Красная линия - тренировочный набор. Синяя - результат работы сети.