Исследователи из MIT создали нанофотонный процессор для технологий глубинного обучения (deep learning)

Компьютерные системы «Deep Learning», основанные на искусственных нейронных сетях, которые имитируют то, как мозг учится на накопленных примерах, стали горячей темой в информатике. В дополнение к разрешающим технологиям, таким как программное обеспечение для распознавания лиц и голоса, эти системы могут анализировать огромное количество медицинских данных, чтобы находить шаблоны, которые могут быть полезны диагностировать или сканировать химические формулы для возможных новых фармацевтических препаратов.

Но вычисления, которые должны выполнять эти системы, очень сложны даже для самых мощных компьютеров.

Теперь группа исследователей из Массачусетского технологического института и других стран разработала новый подход к таким вычислениям, используя свет вместо электричества, который, как они говорят, может значительно улучшить скорость и эффективность некоторых вычислений глубокого обучения. Их результаты появились сегодня в журнале Nature.

«Многие исследователи на протяжении многих лет заявляли о своих компьютерах, основанных на оптике. Хотя многие предлагаемые применения таких фотонных компьютеров оказались непрактичными, световая система нейронных сетей, разработанная этой командой, «может быть применима для глубокого обучения некоторых приложений» — рассказывает один исследователей.

Традиционные компьютерные архитектуры не очень эффективны, когда речь идет о типах вычислений, необходимых для определенных важных задач нейронной сети. Такие задачи обычно включают в себя повторное умножение матриц, которое может быть очень интенсивно вычислительным в обычных чипах CPU или GPU.

После нескольких лет исследований команда MIT придумала способ выполнения этих операций оптически. «Этот чип, как только вы его настроите, может выполнять матричное умножение, в принципе, с нулевой энергией, почти мгновенно», — говорит Soljacic, один из исследователей. «Мы продемонстрировали важнейшие строительные блоки, но еще не полную систему».

По аналогии, Soljacic указывает, что даже обычная линза для очков выполняет комплексный расчет (так называемое преобразование Фурье) на проходящих через него световых волнах. То, как лучи света выполняют вычисления в новых фотонных чипах, гораздо более общие, но имеет аналогичный принцип. Новый подход использует множество световых лучей, направленных таким образом, что их волны взаимодействуют друг с другом, создавая интерференционные картины, которые передают результат предполагаемой операции. Полученное устройство — это то, что ученые называют программируемым нанофотонным процессором.

Результат, по словам Шена, заключается в том, что оптические чипы, использующие эту архитектуру, в принципе могли бы выполнять вычисления, выполненные в типичных алгоритмах искусственного интеллекта, намного быстрее и используя менее одной тысячной энергии на операцию, чем обычные электронные чипы. «Естественное преимущество использования света для матричного умножения играет большую роль в ускорении и экономии энергии, потому что плотные матричные умножения являются наиболее энергоемкой и трудоемкой частью алгоритмов AI», — говорит он.

Новый программируемый нанофотонный процессор, который был разработан в лаборатории Englund Харрисом и сотрудниками, использует массив волноводов, которые взаимосвязаны таким образом, который может быть изменен по мере необходимости, программируя этот набор лучей для конкретного вычисления. «Вы можете программировать в любой матричной операции, — говорит Харрис. Процессор направляет свет через ряд связанных фотонных волноводов. Полное предложение команды требует чередующихся слоев устройств, которые применяют операцию, называемую нелинейной функцией активации, по аналогии с работой нейронов в головном мозге.

Чтобы продемонстрировать концепцию, команда установила программируемый нанофотонный процессор для реализации нейронной сети, которая распознает четыре основных гласных звука. Даже с этой рудиментарной системой они смогли достичь 77-процентного уровня точности, по сравнению с примерно 90 процентами для обычных систем. Солячич говорит, что «нет существенных препятствий» для расширения системы для большей точности.

Энглунд добавляет, что программируемый нанофотонный процессор может иметь и другие приложения, включая обработку сигналов для передачи данных. «Высокоскоростная аналоговая обработка сигналов — это то, что можно было бы управлять» быстрее, чем другие подходы, которые сначала преобразуют сигнал в цифровую форму, поскольку свет является неотъемлемой аналоговой средой. «Этот подход может выполнять обработку непосредственно в аналоговой области», — говорит он.

Команда заявляет, что по-прежнему потребуется гораздо больше усилий и времени, чтобы сделать эту систему полезной; Однако, как только система будет увеличена и будет полностью функционировать, она может найти множество пользовательских случаев, таких как центры обработки данных или системы безопасности. Система также может быть благом для самоходных автомобилей или беспилотных летательных аппаратов, говорит Харрис, или «всякий раз, когда вам нужно много вычислений, но у вас нет большой мощности или времени».

Добавить комментарий


Защитный код
Обновить