Ученые работают над технологиями, в которых наиболее интенсивные вычислительные задачи переносятся с энергозатратной электроники на сверхбыструю фотонику с низким энергопотреблением, что приводит к появлению нового поколения систем искусственного интеллекта, принимающих решения в режиме реального времени
Многие современные приложения на основе искусственного интеллекта (ИИ), такие как хирургическая робототехника и финансовая торговля в режиме реального времени, зависят от способности быстро извлекать ключевые характеристики из потоков необработанных данных. В настоящее время этот процесс сдерживается традиционными цифровыми процессорами. Физические ограничения обычной электроники не позволяют сократить время ожидания и увеличить пропускную способность, необходимые для новых сервисов, интенсивно использующих данные.
Ответ на этот вопрос может заключаться в использовании возможностей света. Оптические вычисления, то есть использование света для выполнения сложных вычислений, могут значительно ускорить извлечение признаков. В частности, оптические дифракционные операторы, представляющие собой пластинчатые структуры, которые выполняют вычисления по мере прохождения через них света, являются весьма перспективными благодаря своей энергоэффективности и способности к параллельной обработке. Однако на практике заставить эти системы работать на скорости выше 10 ГГц остаётся технической проблемой. В основном это связано с трудностями поддержания стабильного когерентного света, необходимого для оптических вычислений.
Чтобы решить эту проблему, исследовательская группа, возглавляемая профессором Хунвэем Ченом из Университета Цинхуа, Китай, разработала замечательное решение. Как сообщается в Advanced Photonics Nexus, они разработали механизм извлечения оптических объектов (получивший название OFE2), который выполняет извлечение оптических объектов для различных практических применений.
Ключевое новшество заключается в модуле подготовки данных OFE2. Обеспечение высокоскоростной и параллельной передачи оптических сигналов для оптических ядер, работающих в когерентной среде, является сложной задачей, поскольку использование оптоволоконных компонентов для разделения мощности и задержки приводит к сильным фазовым возмущениям. Команда решила эту проблему, разработав интегрированную систему на кристалле с настраиваемыми делителями мощности и точными линиями задержки. Этот модуль эффективно десериализует поток данных, разбивая входной сигнал на несколько стабильных параллельных ветвей. Кроме того, регулируемый встроенный фазовый массив позволяет при необходимости перенастраивать OFE2.
После подготовки данных оптические волны проходят через дифракционный оператор. Этот процесс можно математически смоделировать как матрично-векторное умножение, которое выполняет извлечение признаков. Ключевым моментом в этой операции является то, что дифрагированный свет образует на выходе сфокусированное «яркое пятно», которое можно частично отклонить в сторону определённого выходного порта, регулируя фазу параллельных входных сигналов. Это движение и соответствующие изменения выходной мощности позволяют OFE2 эффективно фиксировать признаки, связанные с изменениями входного сигнала во времени.
OFE2, работающий на частоте 12,5 ГГц, может выполнить одно матрично-векторное умножение менее чем за 250,5 пс — это самая короткая задержка среди аналогичных реализаций оптических вычислений. «Мы твёрдо убеждены, что эта работа является важным этапом на пути к созданию интегрированных оптических дифракционных вычислительных систем, способных работать на частоте более 10 ГГц в реальных приложениях», — говорит Чен.
Исследовательская группа успешно продемонстрировала возможности предложенной системы при решении различных задач. Для обработки изображений OFE2 смогла выделить границы на входных изображениях, создав две взаимодополняющие карты признаков «рельефа и гравировки». Признаки, сгенерированные OFE2, позволили повысить эффективность классификации изображений и точность семантической сегментации (например, при идентификации органов на снимках компьютерной томографии). Примечательно, что сетям ИИ, использующим OFE2, требовалось меньше электронных параметров, чем базовым сетям. Это доказывает, что оптическая предварительная обработка может сделать гибридные системы ИИ более лёгкими и эффективными.
Кроме того, команда добилась аналогичных результатов в задаче цифровой торговли, где OFE2 получал рыночные данные в виде временных рядов и предлагал прибыльные торговые операции на основе оптимизированной стратегии. В этой задаче трейдеры вводили в OFE2 ценовые сигналы в режиме реального времени. После предварительного обучения оптимально настроенный OFE2 генерировал выходные сигналы, которые можно было напрямую преобразовать в действия по покупке или продаже с помощью простого процесса принятия решений, что обеспечивало стабильную прибыльность. Поскольку весь процесс выполняется со скоростью света, он обеспечивает значительное преимущество в плане задержки, позволяя получать прибыль с минимальной задержкой.