Четвертый этап — нейронные сети

Отправной точкой четвертого этапа развития в области ИИ можно назвать резкое увеличение интереса к бионическому направлению и, в первую очередь, к нейронным сетям в середине–конце 80-х годов. Это было обусловлено несколькими причинами.

Во-первых, сложности представления знания и обучения в ЭС заставили обратиться к более пристальному и подробному изучению того, как это делает человек.

Во-вторых, нейробиологи и нейроанатомы к этому времени достигли значительного прогресса. Усердно изучая структуру и функции нервной системы человека, они значительно расширили свои знания об организации восприятия, мышления, памяти и моторике.

В-третьих, к этому времени был решен ряд теоретических проблем в области обучения многослойных нейронных сетей, сформулированных в конце 60-х годов, и преодолен ряд технологических вопросов. Немаловажную роль сыграл и коммерческий интерес к ИС, который был направлен на поиск инновационных подходов и подогрет возможностью патентования аппаратной реализации нейросетевых парадигм.

Одной из проблем ЭС в частности, и ИС в целом является сложность в приобретении новых знаний, обучение. Вопросами обучения и понимания традиционно занималась психология. Развитие вычислительной техники, появление теории информации, интеллектуализация компьютеров оказали сильное влияние на гуманитарные науки и не только как инструментарий. Появились, например, такие науки (направления) как когнитивная психология и компьютерная лингвистика.

Искусственные нейронные сети (НС) имитируют естественный прототип, который играет главенствующую роль в организации высшей нервной деятельности человека и его интеллектуальных способностях.

Лучшее понимание функционирования нейрона и картины его связей позволило исследователям создать математические модели для проверки своих теорий. Появилась возможность проводить эксперименты на цифровых компьютерах без привлечения человека или животных, что решает многие практические и морально-этические проблемы. В первых же работах выяснилось, что эти модели не только повторяют свойства мозга, но и способны выполнять функции, имеющие свою собственную ценность. Поэтому возникли и остаются в настоящее время две взаимно обогащающие друг друга цели нейронного моделирования: первая – понять функционирование нервной системы человека на уровне физиологии и психологии и вторая – создать вычислительные системы (искусственные нейронные сети), выполняющие сходные с человеческим мозгом функции.

Параллельно с прогрессом в нейроанатомии и нейрофизиологии психологами были созданы модели человеческого обучения. Одной из таких моделей, оказавшейся наиболее плодотворной, была модель Д.Хэбба, который в 1949г. предложил закон обучения, явившийся стартовой точкой для алгоритмов обучения искусственных нейронных сетей. Дополненный сегодня множеством других методов он продемонстрировал ученым того времени, как сеть нейронов может обучаться.

В пятидесятые и шестидесятые годы группа исследователей, объединив эти биологические и физиологические подходы, создала первые искусственные нейронные сети.

Выполненные первоначально как электронные сети, они были позднее перенесены в более гибкую среду компьютерного моделирования, сохранившуюся и в настоящее время. Первые успехи вызвали взрыв активности и оптимизма. Минский, Розенблатт, Уидроу и другие разработали сети, состоящие из одного слоя искусственных нейронов. Часто называемые персептронами, они были использованы для такого широкого класса задач, как предсказание погоды, анализ электрокардиограмм и искусственное зрение. В течение некоторого времени казалось, что ключ к интеллекту найден, и воспроизведение человеческого мозга является лишь вопросом конструирования достаточно большой сети.

Но эта иллюзия скоро рассеялась. Сети не могли решать задачи, внешне весьма сходные с теми, которые они успешно решали. С этих необъяснимых неудач начался период интенсивного анализа. Минский, используя точные математические методы, строго доказал ряд теорем, относящихся к функционированию нейронных сетей.

Его исследования привели к написанию книги, в которой он вместе с Пайпертом доказал, что используемые в то время однослойные сети теоретически неспособны решить многие простые задачи, в том числе реализовать функцию «Исключающее ИЛИ». Минский также не был оптимистичен относительно потенциально возможного здесь прогресса.

Персептрон показал себя заслуживающим изучения, несмотря на жесткие ограничения. У него много привлекательных свойств: линейность, теорема об обучении, простота модели параллельных вычислений.

Блеск и строгость аргументации Минского, а также его престиж породили огромное доверие к книге – ее выводы были неуязвимы. Разочарованные исследователи оставили поле исследований ради более обещающих областей, а правительства перераспределили свои субсидии, и искусственные нейронные сети были забыты почти на два десятилетия.

Тем не менее, несколько наиболее настойчивых ученых, таких как Кохонен, Гроссберг, Андерсон продолжили исследования. Наряду с плохим финансированием и недостаточной оценкой ряд исследователей испытывал затруднения с публикациями.

Поэтому исследования, опубликованные в семидесятых и начале восьмидесятых годов, разбросаны в массе различных журналов, некоторые из которых малоизвестны. Постепенно появился теоретический фундамент, на основе которого сегодня конструируются наиболее мощные многослойные сети. Оценка Минского оказалась излишне пессимистичной, многие из поставленных в его книге задач решаются сейчас сетями с помощью стандартных процедур.

За несколько лет теория стала применяться в прикладных областях, появились новые корпорации, занимающиеся коммерческим использованием этой технологии. Нарастание научной активности носило взрывной характер. В 1987 г. было проведено четыре крупных совещания по искусственным нейронным сетям и опубликовано свыше 500 научных сообщений – феноменальная скорость роста.

С одной стороны, блестящая научная работа Минского задержала развитие искусственных нейронных сетей, но с другой стороны, нет сомнений в том, что область пострадала вследствие необоснованного оптимизма и отсутствия достаточной теоретической базы. И возможно, что шок, вызванный книгой «Персептроны», обеспечил необходимый для созревания этой научной области период.

В настоящее время имеется много впечатляющих демонстраций возможностей искусственных нейронных сетей: сеть научили превращать текст в фонетическое представление, которое затем с помощью уже иных методов превращалось в речь; другая сеть может распознавать рукописные буквы; сконструирована система сжатия изображений, основанная на нейронной сети. Все они используют сеть обратного распространения – наиболее успешный, по-видимому, из современных алгоритмов. Обратное распространение, независимо предложенное в трех различных работах, является систематическим методом для обучения многослойных сетей, и тем самым преодолевает ограничения, указанные Минским.

Разработано много других сетевых алгоритмов обучения, имеющих свои специфические преимущества. Следует подчеркнуть, что никакая из сегодняшних сетей не является панацеей, все они страдают от ограничений в своих возможностях обучаться и вспоминать.

Область нейронных сетей, продемонстрировала свою работоспособность и имеет уникальные потенциальные возможности, но в то же время и много ограничений, множество открытых вопросов. Такая ситуация настраивает на умеренный оптимизм. Существует, однако, опасность, что искусственные нейронные сети начнут продавать раньше, чем придет их время, обещая функциональные возможности, которых пока невозможно достигнуть.

Если это произойдет, то область в целом может пострадать от потери кредита доверия и вернется к застойному периоду семидесятых годов. Для улучшения существующих сетей требуется много основательной работы. Должны быть развиты новые технологии, улучшены существующие методы и расширены теоретические основы, прежде чем данная область сможет полностью реализовать свои потенциальные возможности.

Искусственные нейронные сети предложены для задач, простирающихся от управления боем до присмотра за ребенком. Потенциальными приложениями являются те, где человеческий интеллект малоэффективен, а обычные вычисления трудоемки или неадекватны. Этот класс приложений не меньше класса, обслуживаемого обычными вычислениями, и можно предполагать, что искусственные нейронные сети займут свое место наряду с обычными вычислениями в качестве дополнения такого же объема и важности.

Одним из перспективных направлений развития нейронных сетей является их интеграция с экспертными системами и другими ИС.

Прежде чем искусственные нейронные сети можно будет использовать там, где поставлены на карту человеческая жизнь или ценное имущество, должны быть решены вопросы, относящиеся к их надежности. Подобно людям, структуру мозга которых они копируют, искусственные нейронные сети сохраняют в определенной мере непредсказуемость. Единственный способ точно знать выход состоит в испытании всех возможных входных сигналов. В большой сети такая полная проверка практически неосуществима, и должны использоваться статистические методы для оценки функционирования.

Одной из ключевых проблем НС заключается в их неспособности "объяснить", как они решают задачу. Внутреннее представление, получающееся в результате обучения, часто настолько сложно, что его невозможно проанализировать, за исключением самых простых случаев. Это напоминает неспособность объяснить, как происходи процесс узнавания человека, несмотря на различие в расстоянии, угле, освещении и на прошедшие годы. Эта особенность НС противопоставляется возможностям экспертных систем, которые могут проследить процесс своих рассуждений в обратном порядке для проверить разумности полученного результата.

Нейронные сети традиционно считаются второй волной интеллектуальных программ, которая постепенно оттесняет ЭС и занимает значительное место на рынке систем искусственного интеллекта. Наибольшее распространение нейронные сети получили в прогнозирующих и аналитических программах. Меньшее распространение они получили в системах распознавания. Тем не менее, задачу обучения новым знаниям нейронные сети не могут решать эффективно. Причины этого сложность представления и организации знаний (значительные размеры сети), трудность извлечения знаний и неоптимальные процедуры (алгоритмы) обучения.