Nvidia Представляет Vera Rubin: Новая Эра в Инфраструктуре ИИ

10

Nvidia в понедельник представила Vera Rubin, комплексную платформу ИИ, построенную вокруг семи новых чипов, поддерживаемую крупными игроками, включая Anthropic, OpenAI, Meta и Mistral AI. Этот шаг подчеркивает продолжающееся доминирование Nvidia в быстро развивающейся сфере ИИ. Платформа обещает до десяти раз более высокую производительность при выводе на ватт и десятикратное снижение стоимости на токен по сравнению с существующими системами Blackwell. Генеральный директор Дженсен Хуанг описал это как «поколенческий скачок», стимулирующий «самое масштабное расширение инфраструктуры в истории», с поддержкой от всех основных облачных провайдеров и более 80 производственных партнеров.

Основа Vera Rubin: Архитектура из Семи Чипов

Платформа Vera Rubin объединяет процессор Nvidia Vera CPU, графический процессор Rubin GPU, коммутатор NVLink 6, высокоскоростную сетевую карту ConnectX-9 SuperNIC, процессор обработки данных BlueField-4 DPU, коммутатор Ethernet Spectrum-6 и специализированный ускоритель вывода Groq 3 LPU. Эти компоненты функционируют как единый суперкомпьютер в рамках пяти взаимосвязанных систем масштаба стойки. Флагманская стойка NVL72 объединяет 72 графических процессора Rubin и 36 процессоров Vera CPU, соединенных NVLink 6. Nvidia утверждает, что эта конфигурация может обучать большие модели, используя меньше графических процессоров, чем Blackwell, что потенциально меняет экономику разработки передовых моделей ИИ.

Стойка Vera CPU содержит 256 жидкостно-охлаждаемых процессоров, поддерживающих более 22 500 одновременных сред CPU, что необходимо для запуска ИИ-агентов. Nvidia заявляет, что это первый процессор, разработанный специально для агентного ИИ, оснащенный 88 пользовательскими ядрами Olympus и памятью LPDDR5X с пропускной способностью 1,2 терабайта в секунду при половинной мощности традиционных процессоров. Стойка Groq 3 LPX содержит 256 процессоров вывода с 128 гигабайтами SRAM на чипе, предназначенных для обработки с низкой задержкой для моделей с триллионами параметров. BlueField-4 STX обеспечивает высокоскоростное хранилище для рассуждений ИИ, а Ethernet Spectrum-6 SPX объединяет все это вместе с копакетированной оптикой для повышения эффективности.

Переход к Агентному ИИ: Почему Это Имеет Значение

Стратегия Nvidia сосредоточена на переходе от чат-ботов к «агентному ИИ» — системам, способным к автономному рассуждению, выполнению программного обеспечения и постоянному совершенствованию. Это требует изменения в конструкции инфраструктуры. В отличие от запросов чат-бота, которые потребляют миллисекунды времени графического процессора, агентные системы требуют постоянных ресурсов ЦП, графического процессора и хранилища для таких задач, как открытие лекарств или отладка кода. Это требует другого баланса вычислительных мощностей, памяти, хранилища и сетевых ресурсов, которые Vera Rubin призван обеспечить.

В поддержку этой эволюции Nvidia представила Agent Toolkit, включая OpenShell, среду выполнения с открытым исходным кодом, обеспечивающую безопасность и конфиденциальность для автономных агентов. Крупные предприятия, такие как Adobe, Atlassian и Salesforce, интегрируют этот набор инструментов в свои платформы. Компания также запустила Dynamo 1.0, описанную как «операционную систему» для масштабного вывода ИИ, которую приняли AWS, Azure, Google Cloud и другие.

Открытые Модели и Рост Экосистемы

Расширение Nvidia в сферу открытых моделей отражает стратегическое усилие по развитию экосистемы разработчиков, стимулирующей спрос на ее аппаратное обеспечение. Nemotron Coalition, глобальное сотрудничество между лабораториями ИИ, будет совместно разрабатывать открытые передовые модели, обученные на DGX Cloud от Nvidia. В число основателей входят Mistral AI и Perplexity, которые предоставляют данные и опыт. Первая модель, разработанная совместно с Mistral AI, будет лежать в основе семейства Nemotron 4.

Nvidia также расширила свой портфель открытых моделей, включив Nemotron 3 Ultra, Nemotron 3 Omni и Nemotron 3 VoiceChat, обеспечивая повышенную производительность и мультимодальные возможности. GR00T N2, роботизированная фундаментальная модель нового поколения, демонстрирует прогресс в выполнении роботизированных задач. Этот переход к открытым моделям служит двойной цели: поощрять внедрение разработчиками, одновременно позиционируя Nvidia как нейтрального поставщика платформы.

За Пределами Центра Обработки Данных: Вертикальные Применения

Применения Vera Rubin выходят далеко за рамки традиционных центров обработки данных. Roche развертывает более 3500 графических процессоров Blackwell для биологических фундаментальных моделей и открытия лекарств, ускоряя сроки разработки. BYD, Geely и Nissan интегрируют платформу Drive Hyperion от Nvidia в автономные транспортные средства 4-го уровня с планами расширения посредством партнерства с Uber. Nvidia также выпустила первую специализированную физическую платформу ИИ для робототехники здравоохранения, используя Open-H, крупнейший в мире набор данных робототехники здравоохранения.

Платформа также распространяется на космические вычисления, с модулем Vera Rubin Space, предлагающим до 25 раз больше вычислительной мощности ИИ для орбитального вывода, привлекая партнеров, таких как Aetherflux и Axiom Space. Nvidia также запустила DGX Station, настольный суперкомпьютер для локального экспериментирования с ИИ, поддерживающий модели до одного триллиона параметров.

Проект «Фабрика ИИ»: Масштабирование Производства Интеллекта

Самым амбициозным шагом Nvidia является эталонный дизайн Vera Rubin DSX AI Factory, план для строительства целых объектов, оптимизированных для производства ИИ. Это включает интеграцию вычислений, сетей, хранилища, питания и охлаждения в системы, максимизирующие «токены на ватт». Программный стек включает DSX Max-Q для динамического выделения мощности и DSX Flex для подключения к сетевым службам. Nscale и Caterpillar строят одну из крупнейших в мире фабрик ИИ в Западной Вирджинии, используя этот эталонный дизайн.

Заключение: Платформа Nvidia Vera Rubin представляет собой значительный шаг к будущему, где инфраструктура ИИ оптимизирована для автономных агентов. Хотя заявления о производительности требуют независимой проверки, масштаб и согласованность этой интегрированной системы позиционируют Nvidia как центральную силу в следующем этапе развития ИИ. Видение компании выходит за рамки аппаратного обеспечения, охватывая программное обеспечение, экосистемы и даже целые фабрики, предназначенные для производства интеллекта.