«Термодинамические вычисления» могут сократить энергопотребление при создании изображений с помощью ИИ в десять миллиардов раз.
Генеративный ИИ такие инструменты, как DALL-E, Midjourney и Stable Diffusion, создают фотореалистичные изображения. Однако они потребляют огромное количество энергии. Два новых исследования показывают, что так называемые термодинамические вычисления могут генерировать изображения, потребляя в десять миллиардов раз меньше энергии, сообщается в авторитетном техническом журнале IEEE Spectrum со ссылкой на недавнюю научную статью в журнале Physical Review Letters.
В основе многих генераторов изображений на основе ИИ лежат машинное обучение алгоритмы, известные как диффузионные модели. Программисты загружают в модели большие наборы изображений, к которым постепенно добавляют шум, пока они не начинают напоминать помехи на расстроенном аналоговом телевидении. Затем они обучают нейронные сети выполнять обратный процесс, что позволяет диффузионным моделям генерировать совершенно новые изображения по запросу.
Однако цифровые вычисления ИИ, которые добавляют шум, а затем создают изображения из статических данных, требуют больших затрат энергии. Новая технология, основанная на термодинамических вычислениях, может генерировать изображения «с гораздо меньшими затратами энергии, чем позволяет современное цифровое оборудование», говорит Стивен Уайтлэм, научный сотрудник Национальной лаборатории имени Лоуренса в Беркли в Калифорнии.
В термодинамических вычислениях используются физические схемы, которые изменяются в ответ на шум, например вызванный случайными тепловыми колебаниями в окружающей среде, для выполнения вычислений с низким энергопотреблением. Например, прототип чипа нью-йоркского стартапа Normal Computing состоит из восьми резонаторов, соединённых друг с другом с помощью специальных соединителей. Программисты используют соединители для создания своего рода калькулятора, настроенного на решение конкретной задачи. Затем они извлекают резонаторы, которые вносят шум в сеть резонаторов-соединителей, выполняя вычисления. После того как система достигнет равновесия, программисты смогут считать решение с новой конфигурации резонаторов.
Новая стратегия Уайтлэма предполагает, что термодинамический компьютер будет получать набор изображений. Затем эта технология позволит сохранённым изображениям деградировать в результате естественных случайных взаимодействий между компонентами компьютера до тех пор, пока связи между этими компонентами естественным образом не достигнут состояния равновесия. Далее стратегия будет вычислять вероятность того, что термодинамический компьютер с заданным состоянием связей сможет обратить процесс разрушения вспять. Затем она будет корректировать значения этих связей, чтобы максимизировать эту вероятность.
В ходе моделирования на обычных компьютерах, результаты которого были опубликованы 20 января в Physical Review Letters, Уайтлэм обнаружил, что этот процесс обучения может привести к созданию термодинамического компьютера, настройки которого позволяют генерировать изображения рукописных цифр. Это можно сделать без энергозатратных цифровых нейронных сетей или генератора псевдослучайных чисел, создающего шум.