Многослойные и полносвязные нейронные сети могут быть обучены с помощью похожих алгоритмов, основанных на вычислении на каждой итерации градиента функции ошибки.
Несмотря на сходство алгоритмов, процессы обучения многослойных и полносвязных сетей протекает по-разному.
Основное различие в обучении многослойных и полносвязных сетей - скорость сходимости. Обучение многослойных сетей проходит в 2-3 раза быстрее, чем обучение полносвязных на одних и тех же обучающих выборках.
Другое различие состоит в том, что при обучении полносвязных сетей очень часто достигается локальный минимум адаптивного рельефа с большим значением функции ошибки. Это означает, что функция ошибки перестает уменьшаться несмотря на то, что сеть еще не способна выдавать правильные выходные сигналы на соответствующие входные сигналы примеров обучающей выборки.
И многослойные, и полносвязные нейронные сети реализуют векторные функции векторных аргументов. К построению таких функций может быть сведено подавляющее большинство практических задач:
Не смотря на принципиальную универсальность и многослойных и полносвязных сетей для решения практических задач предпочтительнее использовать многослойные сети.
Кроме хорошей сходимости процесса обучения можно указать и еще одно преимущество многослойных сетей по сравнению с полносвязными. Для многослойных нейронных сетей строго математически доказывается, что они могут представлять любую вещественную непрерывную векторную функцию любого вещественного непрерывного векторного аргумента. То есть многослойные сети могут быть использованы для решения любой задачи, которая может быть сведена к построению функций.