Nvidia: жидкостное охлаждение дата‑центров и ИИ‑кластеров нового поколения

Новая разработка NVIDIA меняет подход к охлаждению дата‑центров и ИИ‑кластеров, решая сразу несколько критических проблем - от гигантского энергопотребления до плотности размещения серверов и шума в серверных залах.

Компания представила полностью жидкостную систему охлаждения, в которой тепло от процессоров и других горячих компонентов отводится напрямую через специальные теплопередающие пластины. Ключевой парадокс решения в том, что теплоноситель в контуре работает при температурах, которые интуитивно кажутся "слишком высокими": жидкость заходит в сервер при температуре до 45 °C и покидает его уже нагретой примерно до 55 °C. Это горячее, чем вода во многих джакузи, но на производительность серверного железа такая температура не влияет.

Главная идея новой технологии - не охлаждать весь воздух в дата‑центре, а работать точечно, только с теми элементами, которые действительно нагреваются. Вместо батарей мощных вентиляторов и огромных холодильных установок система направляет охлаждающую жидкость прямо к процессорам через специальные пластины-"холодные пластины" (cold plates). Это радикально сокращает объём перемещаемого воздуха, а значит - потребление энергии на вентиляцию и кондиционирование.

В качестве теплоносителя NVIDIA использует смесь из 75% воды и 25% пропиленгликоля. Такой состав обеспечивает оптимальный баланс между теплопроводностью, безопасностью и устойчивостью к замерзанию и коррозии. При входе в сервер жидкость имеет до 45 °C, затем, отбирая тепло у процессоров и прочих компонентов, нагревается до примерно 55 °C. За счёт тщательно рассчитанного теплового режима оборудование не выходит за допустимые температурные пределы, а система не требует интенсивного охлаждения снаружи.

По оценкам NVIDIA, классические дата‑центры тратят на охлаждение до 40% всей потребляемой электроэнергии. То есть почти половина счёта за электричество уходит не на вычисления, а на борьбу с их побочным эффектом - теплом. Компания подчёркивает: повышение рабочей температуры охлаждающего контура всего на 1 °C даёт около 4% экономии энергии на охлаждение. При мощностях современных центров обработки данных это превращается в огромные суммы.

Для крупного ЦОД с энергопотреблением порядка 50 МВт переход на новую жидкостную архитектуру, по расчётам NVIDIA, способен сократить ежегодные расходы на электроэнергию и воду более чем на 4 млн долларов. Экономия достигается за счёт отказа от традиционных чиллеров, уменьшения количества вспомогательного оборудования и перехода на замкнутый контур, в котором вода практически не расходуется. В регионах с подходящим климатом это даёт возможность и вовсе убрать энергоёмкие холодильные машины, используя естественное охлаждение или простые сухие градирни.

Новая система меняет и физическую организацию серверных стоек. Поскольку массивные вентиляторы и сложные воздушные трактовки больше не нужны, серверы становятся компактнее, а плотность размещения вычислительных узлов в стойке заметно увеличивается. Это особенно важно для ИИ‑кластеров, где в ограниченном пространстве приходится размещать огромное количество ускорителей и высокопроизводительных процессоров. Чем выше плотность, тем дешевле каждый условный "юнит" вычислительной мощности в квадратном метре дата‑центра.

Полный отказ от вентиляторов приносит ещё один немаловажный бонус - резкое снижение уровня шума. Серверные помещения перестают напоминать взлётную полосу с постоянным гулом воздушных турбин. Для крупных операторов это не только вопрос комфорта персонала, но и возможность строить ЦОД ближе к городской инфраструктуре без сложных шумозащитных решений.

Отдельное направление, на которое делает ставку NVIDIA, - повторное использование тепла. Поскольку жидкость на выходе имеет относительно высокую температуру, это тепло можно утилизировать с пользой: направлять на обогрев жилых домов, офисных и торговых зданий, теплиц или на технологические нужды предприятий. В европейских странах уже распространены проекты, где дата‑центры подогревают воду для систем отопления - новая архитектура NVIDIA идеально ложится в такую модель, повышая общий КПД инфраструктуры.

Компания подчёркивает, что переход к полностью жидкостному охлаждению - это уже не просто вопрос экономии, а необходимость, продиктованная ростом ИИ‑нагрузок. Современные системы искусственного интеллекта, особенно крупные модели, требуют колоссальной вычислительной мощности. Плотные стойки с GPU и специализированными ускорителями быстро выходят за пределы, которые можно эффективно обслуживать воздухом. Чтобы продолжать масштабировать ИИ‑инфраструктуру без пропорционального роста энергозатрат и тепловых рисков, индустрии нужен именно такой подход.

Важно и то, что работа при более высокой температуре помогает улучшить общий показатель энергоэффективности дата‑центра (PUE). Чем меньше разница между температурой окружающей среды и температурой охлаждающего контура, тем проще и дешевле отводить тепло наружу. Системы, рассчитанные на "лёгкий перегрев" по сравнению с традиционными стандартами, позволяют операторам ЦОД оставаться в допустимых пределах по температуре оборудования, но не строить вокруг него "морозильную камеру".

При этом речь не идёт о снижении надёжности: современные чипы и серверные комплектующие сертифицируются для работы при достаточно высоких температурах. Жидкостное охлаждение, наоборот, обеспечивает более стабильный тепловой режим по сравнению с воздушным, где температура сильно зависит от загрузки и потоков воздуха. Равномерный отвод тепла через пластины уменьшает тепловые перепады и снижает риск локального перегрева.

Новая архитектура может стать стандартом не только для гигантских облачных площадок, но и для корпоративных ЦОД среднего масштаба, особенно там, где работают тяжёлые ИИ‑нагрузки, системы анализа больших данных, высокопроизводительные вычисления и рендеринг. Для таких заказчиков критичны и экономия на эксплуатации, и возможность наращивать мощности, не упираясь в лимиты по питанию и охлаждению здания.

Интерес представляет и экологический аспект. Меньшая потребность в электроэнергии означает снижение углеродного следа дата‑центров, что важно для компаний, ориентированных на ESG‑повестку и "зелёные" сертификаты. Переход на замкнутые контуры охлаждения с минимальным расходом воды помогает решать проблему водопотребления, актуальную для регионов с дефицитом ресурсов и жёсткими экологическими нормами.

В перспективе подобные системы могут стимулировать и новые форматы интеграции ЦОД с городской инфраструктурой. Тепло от серверов способно стать частью городской энергетической экосистемы: обогревать жилые кварталы, бассейны, бизнес‑центры, участвовать в локальных низкотемпературных сетях. Для операторов это шанс превратить побочный продукт - избыточное тепло - в отдельный источник дохода или фактор снижения затрат на коммунальные услуги.

Таким образом, технология NVIDIA не просто решает локальные проблемы перегрева ИИ‑серверов. Она предлагает целостный подход к проектированию дата‑центров следующего поколения: более плотных, более тихих, ощутимо экономичных и потенциально менее вредных для окружающей среды. В условиях стремительного роста спроса на ИИ‑вычисления именно такие решения будут определять, насколько быстро и по какой цене удастся масштабировать цифровую инфраструктуру в ближайшие годы.

Прокрутить вверх