Точность является критически важным фактором при проведении лучевой терапии. Как правило, процесс нацеливания на пораженные раком области выполняется вручную. Однако интеграция оптимизированного с точки зрения устойчивого развития инструмента на базе искусственного интеллекта (ИИ) может повысить точность наведения, сэкономить время медицинских работников и потреблять на 20% меньше энергии для достижения этих улучшенных результатов. Это лишь один из примеров перспективных вычислений, направленных на устойчивое развитие, который может предложить огромные улучшения для операций в различных отраслях, одновременно снижая углеродный след.
Инвестиции в «зеленые» вычисления сейчас могут обеспечить инновационные результаты для будущего, как утверждает Джен Хаффстетлер, директор по устойчивому развитию продуктов и вице-президент, генеральный менеджер по стратегии будущей платформы и устойчивому развитию в Intel. Однако переход к устойчивым практикам может стать серьезным испытанием для многих предприятий. Главное, по словам Хаффстетлер, начать с малого и провести аудит, чтобы понять свое энергопотребление и выявить области, требующие наибольшего внимания. Достижение устойчивых вычислений требует внимания всей компании: от ИТ-директоров до отделов разработки продуктов, производства и ИТ-команд.
«Для достижения устойчивых вычислений в будущем потребуется участие каждого элемента организации», — говорит Хаффстетлер.
Новейшие инструменты ИИ находятся на переднем крае инноваций, но часто требуют значительных вычислительных мощностей и энергии. «По мере созревания технологий ИИ мы получаем четкое представление о некоторых его ограничениях, — отмечает Хаффстетлер. — Этот прогресс обладает практически безграничным потенциалом для решения крупномасштабных проблем, но достигается очень высокой ценой».
Смягчение этого энергопотребления при сохранении потенциала ИИ требует тщательной оптимизации моделей, программного и аппаратного обеспечения этих инструментов ИИ. Эта оптимизация сводится к фокусировке на качестве данных, а не на их количестве при обучении моделей, использованию развитых языков программирования и применению программного обеспечения, осведомленного о выбросах углерода (carbon-aware software).
Поскольку приложения ИИ возникают в непредсказуемых условиях реального мира с ограничениями по энергии, стоимости и времени, необходимы новые подходы к вычислениям.
***
В рамках нашего подкаста «Business Lab» мы обсуждаем построение устойчивой стратегии ИИ — от суперкомпьютеров до цепочек поставок и кремниевых чипов. Решения, принятые в области «зеленых» вычислений и инноваций, сегодня могут изменить ситуацию для будущего.
Мой гость — Джен Хаффстетлер, директор по устойчивому развитию продуктов, вице-президент и генеральный менеджер по стратегии будущей платформы и устойчивому развитию в Intel.
Когда я спрашиваю Джен о ее инженерном пути и о том, как обучение на MIT в области химической инженерии повлияло на ее нынешний взгляд на мир, она объясняет, что ее знакомство с микроэлектроникой и стажировка в Intel сформировали понимание того, как технологии могут содействовать прогрессу общества, обеспечивая доступ к образованию, улучшая здравоохранение и поддерживая работу в целом, что стало очевидно во время пандемии благодаря технологической инфраструктуре.
Энергопотребление ИТ-инфраструктуры уже опережает общий мировой спрос на энергию. В связи с этим ИТ-инфраструктура должна стать более энергоэффективной. Джен подчеркивает, что 76% ИТ-лидеров считают сложной задачей достижение целей по энергоэффективности при одновременном повышении производительности. Более того, 70% заявляют о прямом конфликте между устойчивостью и производительностью вычислений. Intel считает, что этот конфликт можно преодолеть при правильном использовании программного обеспечения, аппаратного обеспечения и инфраструктуры. Рекомендуется начать с аудита для выявления областей наибольшего воздействия, а не пытаться решить все проблемы сразу.
«Устойчивость — это не домен одной группы в компании. Для достижения устойчивых вычислений в будущем потребуется участие каждого элемента организации», — настаивает Хаффстетлер, упоминая, что это затрагивает как ИТ-директоров, так и команды по продуктам и производству.
Что касается энергоемких технологий, таких как ИИ, Джен приводит шокирующую статистику: модель ChatGPT-3 потребляет 1,28 гигаватт-часа электричества, что эквивалентно потреблению 120 домов в США за год. Она указывает, что 70–80% энергопотребления приходится на инференс (работу модели), а не на ее обучение. Стратегии снижения энергопотребления включают оптимизацию моделей, ПО и аппаратного обеспечения. В области моделей важна **качество данных важнее количества**. Исследования показывают, что до 99% параметров обученной нейронной сети могут быть удалены (прунинг), что приводит к более компактной сети и снижению энергопотребления. Также важна настройка моделей на меньшую точность (например, квантование, использование 8-битных целых чисел вместо 32-битных чисел с плавающей запятой для инференса).
Использование **доменно-специфичных моделей** (не переобучать большие языковые модели, а использовать их знания) также повышает энергоэффективность.
В области программного обеспечения Джен отмечает, что современные высокоуровневые языки программирования оставляют много возможностей для оптимизации по сравнению с более примитивными вроде ассемблера, которые были тесно связаны с оборудованием. Она приводит пример библиотеки Modin, ускоряющей Pandas-приложения до 90 раз всего одной строкой кода. В Scikit-оптимизация через патч или дистрибутив Anaconda может обеспечить 8-кратное ускорение времени вычислений при гораздо меньшем потреблении энергии. Кроме того, критически важно правильно подбирать процессорное оборудование, так как около 65–70% инференса выполняется на ЦП.
Отдельным направлением является **carbo-aware software** (программное обеспечение, осведомленное о выбросах углерода). Благодаря партнерству с Green Software Foundation и разработке Carbon Aware SDK, можно запускать рабочие нагрузки там, где энергосистема наименее углеродоемка — например, когда дует ветер или светит солнце.
ИИ активно применяется в Intel для повышения производительности: в чип-дизайне для размещения IP-блоков, что снижает занимаемую площадь и задерживает коммуникации на 30–50%; в тестировании чипов, где ИИ сокращает тысячи тестов на 70%; и в производстве, где обработка изображений с помощью ИИ позволяет выявлять до 90% дефектов на пластине. Все это заменяет медленные ручные методы.
С точки зрения эффективности ИИ на границе сети (edge) и в облаке, Джен подчеркивает, что не всем задачам требуются модели с сотнями миллиардов параметров; часто достаточно 7 миллиардов с применением техник оптимизации. Это позволяет запускать модели на одном ЦП, а не на кластерах ускорителей. Растущую роль играет **жидкостное охлаждение**, которое может снизить энергопотребление на 30%, учитывая, что до 40% энергии в дата-центрах идет на охлаждение. Погружное охлаждение или прямое охлаждение чипа (cold plate) становятся стандартом в кластерах ИИ.
В качестве лучших практик для ускорения устойчивого развития с помощью ИИ Джен выделяет: фокусировку на качестве данных, правильный подбор уровня точности (INT8 вместо FP32), использование доменно-специфичных моделей, балансировку аппаратного и программного обеспечения, применение аппаратных ускорителей и интеграцию принципов carbon-aware software.
Intel стремится к нулевому уровню выбросов к 2040 году. Процессоры для ЦОДов Intel используют 93% возобновляемой электроэнергии, что помогает клиентам снизить эмиссию Scope 3. Встроенные ускорители в Xeon обеспечивают до 14 раз лучшую энергоэффективность. Аппараты вроде Intel Gaudi максимизируют эффективность обучения и инференса.
В качестве примера успешного внедрения Джен приводит SK Telecom, который оптимизировал свой ИИ-пайплайн, достигнув 4-кратной оптимизации по сравнению с GPU-решениями. Другой пример — Siemens Healthineers: ИИ ускорил контурирование органов для лучевой терапии в 35 раз, используя на 20% меньше энергии, высвобождая время врачей. KDDI (Япония) использовала ИИ для прогнозирования трафика 5G, что позволило снизить частоту работы ЦП и достичь значительной экономии энергии, не нарушая соглашений об уровне обслуживания (SLA).
Говоря о будущем, помимо распространения жидкостного охлаждения, Хаффстетлер с нетерпением ждет развития **нейроморфных вычислений**. Это фундаментальный пересмотр архитектуры, вдохновленный биологическими сетями мозга. Нейроморфные процессоры, такие как исследовательский процессор Loihi, могут обеспечить на 1000x–2500x большую энергоэффективность по сравнению с традиционными архитектурами, потребляя менее ватта для многих задач. Именно такие инновации, по мнению Джен, определяют будущее вычислений.