Радиоэлектроника и новые технологии
- по вопросам размещения рекламы -

Секция «Высокопроизводительные вычислительные системы» на форуме «Микроэлектроника-2025»

0 1

На форуме «Микроэлектроника-2025» состоялась секция «Высокопроизводительные вычислительные системы», в рамках которой представители основных российских разработчиков микропроцессорных систем и ПАК для ИИ представили свои результаты.

Предлагаем тезисную выжимку из выступлений докладчиков сессии.

Козлов Александр Владимирович, технический директор CloudBEAR:
Представляю новую разработку нашей команды — процессорный сложно-функциональный блок с внеочередным исполнением команд второго поколения, совместимый с системой команд RISC-V. По сравнению с первым поколением его производительность повышена до 60-100% за счет множества оптимизаций и новых подходов. Имплементации кристалла мы делали по технологии 28 нм у себя и по 12 нм у клиента. Оба варианта показали хорошие результаты в бенчмарках SPEC, в том числе, по сравнению с популярными чипами на ARM A55. Процессор пригоден для приложений Edge AI, промышленных компьютеров, встраиваемых и сетевых систем, телекома и мн.др.

Мякочин Юрий Олегович, директор департамента проектирования АО «Байкал Электроникс»:
На этой конференции мы представляем наш новый трёхъядерный микроконтроллер U1000 для ресурсоемких задач и систем промышленной автоматизации. Кластер ядер построен на базе микроархитектуры CloudBEAR – это два мощных ядра BR-350 с большим кэшем каждое и одно экономичное ядро BM-310. Встроенная флеш-память имеет объём 256 кбайт, ОЗУ — 192 кбайт. Наша компания официально поддерживает SDK для Windows и Linux. Отладка — через JTAG или USB. Уникальной особенностью нашего микроконтроллера является объединение всех отладочных интерфейсов в единый USB с выбором механизма через программный драйвер и возможностью трассировки. Измеренное энергопотребление — около миллиампера на мегагерц.

Маслов Максим Владимирович, директор департамента разработки спецпроектов АО «Байкал Электроникс»:
Новейшая микроархитектура высокопроизводительного GPGPU для задач ИИ от «Байкал Электроникс» основана на базе диспетчера на ядре RISC-V и многопоточных тензорных процессоров Baikal-AI для параллельных вычислений с общим кэшем второго уровня. Сравнение Baikal-AI с ядрами-конкурентами Xavier AGX от Nvidia на компиляторе CUDA показывает средний прирост скорости около 9% с заметным разбросом в зависимости от типа задачи и требует оптимизации компилятора. В дальнейшем ядра Baikal-AI планируется интегрировать в конечные решения.

Советов Пётр Николаевич, с.н.с. Лаборатории специализированных вычислительных систем РТУ МИРЭА, представил компилятор специализированных регулярных выражений для проектирования программируемой и ресурсоэффективной аппаратной архитектуры.

Миронов Сергей Эльмарович, доцент СПбГЭТУ «ЛЭТИ»:
Мы проанализировали аппаратные средства реализации нейронных сетей, кратно снижающие их время задержки и площадь на кристалле. Аппаратное распараллеливание процессов сложения позволяет существенно ускорить вычисления, но занимает много места на кристалле. Комбинирование этого подхода с уменьшением разрядности и оптимизацией топологии вычислительных ячеек Бута позволяет добиться оптимального сочетания подходов для получения наилучшего результатата для конкретных задач матричного умножения. Наши подходы мы стремимся реализовать в заказной микросхеме, поскольку стандартные ПЛИС при таком подходе не обеспечивают оптимальной конфигурации.

Фролов Михаил Алексеевич, зам. генерального директора по научной работе ООО «Хайтек»:
Мы — ведущий разработчик высокопроизводительных отечественных тензорных вычислителей для инференса нейронных сетей в реальном времени. Наши изделия внесены в реестр отечественной продукции Минпромторга. На их базе был разработан спектр ускорителей нейронных сетей LinQ. Серийное производство в России — до 10 тыс. модулей. Наши ускорители импортозамещают решения Nvidia и Huawei и предназначены для задач аналитики, безопасности и научных расчетов. Наш новый ПАК HPC выполняет инференс более 80 нейронных сетей без потери производительности на вычислительном узле.

Тарасов Илья Евгеньевич, профессор РТУ МИРЭА:
Нами разработан и испытан ускоритель специализированных вычислений массового параллелизма на базе частично динамически реконфигурируемой ПЛИС XC7A200 в составе ПАК на базе процессора «Эльбрус», где блоки реконфигурируются в зависимости от тех данных, которые надо анализировать (например, для глубокого анализа пакетов интернет-трафика в составе актуальной аппаратуры ТСПУ). Далее существует возможность аппаратной реализации данного подхода на 90-нм СБИС в НИИМЭ или на ПЛИС 5510.

Шантаев Эдуард Борисович, директор ФГАУ «ЦИТ»:
ФГАУ «ЦИТ» ежемесячно анализирует потребности федеральных органов исполнительной власти и госкорпораций — ПАК, ЭКБ для ИИ и пр. — с целью формирования потребности отрасли и помощи производителям. Сейчас рынку требуется около 4500 единиц вычислительной техники в сфере ИИ. Основная номенклатура — графические карты для ЦОД, глубокого обучения, научных исследований и высокопроизводительных вычислений. Мы также предоставляем различные ИИ-сервисы внутри нашего ЦОД, который сейчас 6-й по мощности в РФ. Планируем подключать к нему отечественных разработчиков чипов и сформировать наиболее актуальные направления для будущих разработок кристаллов под задачи отечественных заказчиков.

Недбайло Юрий Александрович, с.н.с. ИНЭУМ им. И.С.Брука:
Современные методы моделирования многоядерных процессоров имеют множество недостатков. RTL-симуляция и прототипирование на ПЛИС не позволяет полноценно оценить проект разрабатываемого процессора, особенно многоядерного. Другой подход — снятие трасс обращений с последующим их воспроизведением на модели uncore. Кластерная выборка — наиболее точный и универсальный подход, но очень ресурсоемкий. Наиболее актуальный симулятор Gem5 тоже не свободен от многих недостатков; стоит задача создать его отечественный аналог.

Молчанов Игорь Анатольевич, ведущий инженер ИНЭУМ им. И.С. Брука:
Ключевой задачей организации стабильной Wi-Fi-связи для робототехнических комплексов является выбор одноплатных компьютеров и сетевых адаптеров, способных обеспечить достаточную производительность при передаче качественного видео, организацию mesh-сети и удобство управления и конфигурирования системы. Выбор среди «одноплатников» типа Raspberry Pi, Banana Pi, Repka Pi и Orange Pi весьма неоднозначен, но оптимальным стал именно Orange Pi 5+. В качестве эталонной для него взята операционная система Armbian. Wi-Fi-адаптер – Atheros WLE600VX, только он смог обеспечить динамическую маршрутизацию в mesh-сетях на B.A.T.M.A.N.

Литература

«Микроэлектроника-2025»: производители ЭКБ для ИИ предложат властям РФ меры по поддержке отрасли

Оставить комментарий