NVIDIA ابررایانه هوش مصنوعی Vera Rubin POD با 40 رک را برای بارهای کاری عاملی رونمایی کرد
Iris Coleman 1404/12/25 19:48
NVIDIA اعلام کرد که Vera Rubin POD با 1,152 GPU در 40 رک، 60 اگزافلاپ و عملکرد استنتاج 10 برابر بهتر به ازای هر وات نسبت به Blackwell ارائه میدهد.
NVIDIA به تازگی مشخصات جاهطلبانهترین زیرساخت هوش مصنوعی خود را منتشر کرد. Vera Rubin POD دارای 1,152 GPU Rubin در 40 رک است که 60 اگزافلاپ قدرت محاسباتی و 10 پتابایت در ثانیه پهنای باند کل مقیاسپذیری را ارائه میدهد. واحدهای تولیدی در نیمه دوم سال 2026 ارسال میشوند.
اعداد اینجا شگفتانگیز هستند: 1.2 کوادریلیون ترانزیستور، نزدیک به 20,000 دای NVIDIA، همه برای عملکرد به عنوان یک ابررایانه منسجم واحد طراحی شدهاند. NVIDIA ادعا میکند عملکرد آموزش 4 برابر بهتر و عملکرد استنتاج 10 برابر بهتر به ازای هر وات در مقایسه با معماری فعلی Blackwell دارد - با کاهش هزینههای توکن به یک دهم سطح فعلی.
پنج سیستم رک با هدف خاص
POD پنج سیستم مختلف در مقیاس رک را ترکیب میکند که هر کدام گلوگاههای خاصی در بارهای کاری مدرن هوش مصنوعی را هدف قرار میدهند:
Vera Rubin NVL72 به عنوان موتور محاسباتی اصلی عمل میکند. هر رک 72 GPU Rubin و 36 CPU Vera را که از طریق NVLink 6 متصل شدهاند، یکپارچه میکند که 3.6 TB/s پهنای باند به ازای هر GPU را فشار میدهد - بیشتر از کل پهنای باند اینترنت جهانی، طبق گفته NVIDIA. این سیستم تمام چهار قانون مقیاسپذیری هوش مصنوعی را هدف قرار میدهد: پیشآموزش، پسآموزش، مقیاسپذیری زمان تست و مقیاسپذیری عاملی.
رکهای Groq 3 LPX مشکل تأخیر را حل میکنند. با 256 واحد پردازش زبان در هر رک با استفاده از معماری SRAM فقط، اینها با NVL72 جفت میشوند تا آنچه NVIDIA ادعا میکند 35 برابر بیشتر توکن و 10 برابر بیشتر فرصت درآمد برای مدلهای تریلیون پارامتری در مقابل Blackwell ارائه دهند.
رکهای Vera CPU محیطهای sandbox برای تست عامل فراهم میکنند. یک رک واحد بیش از 22,500 محیط یادگیری تقویتی همزمان را حفظ میکند - که برای اعتبارسنجی خروجیهای هوش مصنوعی عاملی قبل از استقرار بسیار مهم است.
رکهای BlueField-4 STX آنچه را که NVIDIA "ذخیرهسازی بومی هوش مصنوعی" مینامد از طریق پلتفرم حافظه متنی CMX معرفی میکنند. با انتقال کش KV به ذخیرهسازی اختصاصی با پهنای باند بالا، سیستم ادعا میکند توکن در ثانیه 5 برابر بالاتر و کارایی انرژی 5 برابر بهتر نسبت به رویکردهای سنتی دارد.
رکهای شبکه Spectrum-6 SPX همه چیز را با سوئیچهای 102.4 Tb/s که دارای اپتیک بستهبندی شده مشترک هستند، به هم متصل میکنند.
استدلال اقتصاد توکن
NVIDIA این را پیرامون یک واقعیت بازار خاص قاببندی میکند: مصرف توکن اکنون از 10 کوادریلیون سالانه فراتر رفته است و تغییر از تعاملات انسان-هوش مصنوعی به هوش مصنوعی-هوش مصنوعی این رشد را به طور چشمگیری تسریع خواهد کرد. سیستمهای عاملی مدرن حجم عظیمی از توکنهای استدلال تولید میکنند در حالی که نیازهای کش KV را گسترش میدهند - دقیقاً گلوگاهی که این معماری هدف قرار میدهد.
معیارهای SemiAnalysis InferenceMax شخص ثالث که توسط NVIDIA ذکر شده نشان میدهد سیستمهای فعلی Blackwell در حال حاضر عملکرد 50 برابر بهتر به ازای هر وات و هزینه 35 برابر کمتر به ازای هر توکن در مقایسه با H200 ارائه میدهند. Vera Rubin قصد دارد این پیشتاز را گسترش دهد.
مهندسی حرارتی و انرژی
معماری رک MGX نسل سوم صافسازی هوشمند انرژی را با 6 برابر بیشتر ذخیره انرژی در سطح رک (400 ژول به ازای هر GPU) نسبت به نسلهای قبلی معرفی میکند. این تقاضاهای جریان اوج را تا 25٪ کاهش میدهد و نیاز به بستههای باتری عظیم را از بین میبرد.
تمام رکها در دماهای ورودی آب گرم 45 درجه سانتیگراد کار میکنند که به مراکز داده در بسیاری از آب و هواها امکان میدهد از خنککننده هوای محیط استفاده کنند. NVIDIA ادعا میکند این قدرت کافی را آزاد میکند تا 10٪ رک بیشتر را در همان بودجه انرژی تسهیلات اضافه کند.
نگاه به آینده
فراتر از پیکربندی اولیه POD، NVIDIA پیشنمایش Vera Rubin Ultra NVL576 را با مقیاسپذیری به 576 GPU در هشت رک و معماری نسل بعدی Kyber را با هدف NVL1152 با 144 GPU در هر رک ارائه داد. نقشه راه نشان میدهد که NVIDIA دامنههای چند رکی NVLink را به عنوان آینده زیرساخت هوش مصنوعی میبیند - نه فقط GPU های بزرگتر، بلکه معماریهای سیستمی اساساً متفاوت.
برای شرکتهایی که سرمایهگذاریهای زیرساخت هوش مصنوعی را برنامهریزی میکنند، پیام واضح است: اقتصاد محاسبات هوش مصنوعی در حال تغییر از بهینهسازی سطح تراشه به سطح تسهیلات است. کسانی که اکنون مراکز داده را میسازند با انتخابی بین سیستمهای نسل فعلی و انتظار برای در دسترس بودن Vera Rubin در اواخر سال 2026 مواجه هستند.
منبع تصویر: Shutterstock- nvidia
- زیرساخت هوش مصنوعی
- vera rubin
- مراکز داده
- هوش مصنوعی سازمانی



