Обновленная теория обучения нейронной сети

Новое исследование обновило теорию, первоначально разработанную, чтобы объяснить, как люди учатся и подчеркивает ее значение как базу для ИИ.

Последние достижения в создании искусственных систем, которые обыгрывают людей в самых разнообразных сложных игр имеют свои корни в нейронных сетях, обработку информации в мозге. В обзоре, опубликованном 14 июня в тенденциях в когнитивных науках, исследователи из Google DeepMind и Стэнфордского университета обновили теорию, первоначально разработанную, чтобы объяснить, как люди и другие животные учатся — и подчеркнуть ее потенциальное значение в качестве основы для разработки с искусственного интеллекта.

Впервые опубликованная в 1995 году, теория утверждает, что обучение является продуктом двух взаимодополняющих систем. Первая система постепенно приобретает знания и навыки от воздействия ощущений, а вторая от конкретного опыта, так что они могут быть воспроизведены для и их эффективной интеграции в первой системе.

«Доказательство кажется убедительным, что мозг этих двух видов систем обучения дополняют друг друга для того чтобы обеспечить мощное решение ключевых проблем, с которыми сталкивается мозга», — говорит Стэнфордский профессор психологии Джеймс Макклелланд.

Первая система в предлагаемой теории, размещена в неокортексе мозга, и является предшественником сегодняшнего глубокого обучения нейронных сетей. В глубоком обучении нейронный сетей, эти системы содержат несколько слоев нейронов между входом и выходом. Кроме того, их соединения постепенно изменяются во время обучение, что является основанием для их способности распознавать объекты, воспринимать речь, понять и воспроизводить язык, и даже для выбора оптимального действия в игре и другие параметры, где разумные действия зависят от полученных знаний.

Такие системы сталкиваются с дилеммой, когда новая информация радикально искажает все остальные знания которые уже хранятся сети.

«Вот где и приходят взаимодополняющие системы обучения», — говорит Макклелланд. У человека и у других млекопитающих, это вторая система находится в структуре, называемой гиппокамп. «Изначально информация о новом опыте хранится в гиппокампе, мы делаем его доступным для немедленного применения и мы также храним его, так, что он может быть воспроизведен в коре головного мозга, чередованием информации которая хранится в гиппокампе с текущим опытом или другими соответствующими переживаниями.» Эти две системы позволяют быстро обучатся, и также постепенно интегрировать структурированное представление знаний в неокортексе.

«Компонентам архитектуры нейронной сети, удалось достичь производительности человеческого уровня в различных компьютерных играх, таких как „космические захватчики“ в них была интегрирована взаимодополняющая теория систем обучения», — говорит DeepMind когнитивный нейробиолог Dharshan Кумаран. «Как в теории, эти нейронные сети используют буферную память сродни гиппокамп, который хранит последние эпизоды игры и воспроизводит их поочередного. Это значительно усиливает использование фактического опыта игры и устраняет склонность к определенному доминированию обучения в системе.»

«На мой взгляд», — говорит Хассабис, «расширенная версия дополнительного обучения систем, вероятно, будет продолжать служить основой для будущих исследований не только в неврологии, но и в стремлении развивать ИИ, это главная цель в Google DeepMind.»

Добавить комментарий


Защитный код
Обновить