Со скоростью света в будущее ИИ
Со скоростью света в будущее ИИ
Люди уже удивляются возможностям ChatGPT и других приложений искусственного интеллекта, но они могли бы быть гораздо более мощными, если бы существовали более совершенные компьютеры. Но современные вычислительные системы достигают своего предела; закон Мура, согласно которому вычислительная мощность компьютерных чипов удваивается каждые два года, уже несколько лет не применяется.
Выход может быть найден в процессорах, работающих не с электронами, а со светом. Исследовательская группа из Берлинского университета и Массачусетского технологического института (MIT) в США разработала первый в мире чип, способный это делать. Свои результаты они опубликовали в научном журнале «Nature».
Обычные микросхемы на пределе возможностей
Проблема обычных микросхем заключается в их центральных элементах – транзисторах. По термодинамическим причинам они не могут переключаться так быстро, как хотелось бы, и в то же время быть энергоэффективными. «Лучшие коммерчески доступные микросхемы практически уже достигли этого предела», – говорит Стефан Райценштайн. Он возглавляет рабочую группу «Оптоэлектроника и квантовые устройства» в TU Berlin.
Этот физический предел для микросхем, основанных на протекании тока, также принципиально ограничивает развитие приложений искусственного интеллекта, поясняет ученый. «Например, для создания более мощных нейронных сетей мы не можем просто соединить вместе несколько суперкомпьютеров. Для этого нам нужна компактная и мощная система в целом».
По данным«Вся электроника», на центры обработки данных уже приходится около пяти процентов мирового энергопотребления. С ростом использования искусственного интеллекта через несколько лет этот показатель может вырасти до 30%. Для обучения модели искусственного интеллекта процессоры сотен видеокарт, каждая из которых потребляет около 1000 Вт, должны работать в течение нескольких недель, цитирует журнал Ральфа Хербриха из Института Хассо Платтнера в Потсдаме. «1000 Вт – это столько же, сколько потребляет духовка».
Да будет свет!
Научное решение проблемы заключается в замене электронов на световые частицы (фотоны). Для этого используются лазеры диаметром всего около десяти микрометров (сотые доли миллиметра). Они называются лазерами с вертикальным резонатором (Vertical Cavity Surface Emitting Lasers, VCSEL). Они могут воздействовать друг на друга с помощью физических эффектов, что позволяет выполнять математические операции с высокой скоростью и в небольшом пространстве.
Миниатюрные лазеры не нужно было специально разрабатывать, они уже существуют, и многие люди их используют. В частности, они уже несколько лет используются в смартфонах для распознавания лиц(Face ID). Еще одно распространенное применение – телекоммуникационные сети (оптическое волокно), где они служат источником света.
Оптические нейронные сети (ОНС) используются для искусственного интеллекта, где искусственные нейроны уже созданы в виде структур на оптическом чипе. «Лазер генерирует свои высокоэнергетические и параллельные световые пучки, направляя их с помощью зеркал несколько раз через резонаторную камеру, содержащую оптически активную среду», – поясняет Рейценштейн. «В VCSEL имеется несколько слоев частично отражающих материалов, которые в совокупности отражают почти все световые пучки обратно в резонатор».
Очень эффективный и мощный
«Основываясь на этом ноу-хау, мы адаптировали и оптимизировали VCSEL для использования в микросхеме ONN», – говорит Рейтценштайн. При этом, по его словам, важно было добиться максимально возможного светового потока и привести расположение 25 VCSEL на одном сегменте чипа к точно такой же длине волны света.
По словам ученых, первые испытания с лазерным чипом ONN прошли очень успешно. Результат: новые чипы в 100 раз более энергоэффективны и способны обеспечить в 20 раз большую вычислительную мощность на единицу площади, чем лучшие электронные цифровые процессоры. И это далеко не конец истории. «Увеличив тактовую частоту лазеров, что сравнительно легко сделать, можно, вероятно, увеличить эти показатели еще в 100 раз», – говорит Рейценштейн.
Разблокированный ChatGPT
«Размер ChatGPT ограничен мощностью современных суперкомпьютеров. Обучать модели гораздо большего размера просто не имеет экономического смысла. Наша новая технология может позволить перейти к моделям машинного обучения, которые иначе были бы недостижимы в ближайшем будущем, – говорит Дирк Энглунд из Массачусетского технологического института. Но это можно сделать и в меньшем масштабе: чрезвычайно мощные, но в то же время чрезвычайно экономичные чипы в будущем можно будет использовать в смартфонах и других мобильных устройствах.
Это может произойти раньше, чем ожидалось. Полученные знания сначала должны быть реализованы в промышленных масштабах. Но поскольку компоненты системы VCSEL могут быть изготовлены с помощью уже используемых сегодня производственных процессов, «мы предполагаем, что она может быть масштабирована для коммерческого использования в течение нескольких лет», – пишут ученые.