NVIDIA ابررایانه هوش مصنوعی Vera Rubin POD با 40 رک را برای بارهای کاری عاملی رونمایی کرد

Iris Coleman 1404/12/25 19:48

NVIDIA اعلام کرد که Vera Rubin POD با 1,152 GPU در 40 رک، 60 اگزافلاپ و عملکرد استنتاج 10 برابر بهتر به ازای هر وات نسبت به Blackwell ارائه می‌دهد.

NVIDIA ابررایانه هوش مصنوعی Vera Rubin POD با 40 رک را برای بارهای کاری عاملی رونمایی کرد

NVIDIA به تازگی مشخصات جاه‌طلبانه‌ترین زیرساخت هوش مصنوعی خود را منتشر کرد. Vera Rubin POD دارای 1,152 GPU Rubin در 40 رک است که 60 اگزافلاپ قدرت محاسباتی و 10 پتابایت در ثانیه پهنای باند کل مقیاس‌پذیری را ارائه می‌دهد. واحدهای تولیدی در نیمه دوم سال 2026 ارسال می‌شوند.

اعداد اینجا شگفت‌انگیز هستند: 1.2 کوادریلیون ترانزیستور، نزدیک به 20,000 دای NVIDIA، همه برای عملکرد به عنوان یک ابررایانه منسجم واحد طراحی شده‌اند. NVIDIA ادعا می‌کند عملکرد آموزش 4 برابر بهتر و عملکرد استنتاج 10 برابر بهتر به ازای هر وات در مقایسه با معماری فعلی Blackwell دارد - با کاهش هزینه‌های توکن به یک دهم سطح فعلی.

پنج سیستم رک با هدف خاص

POD پنج سیستم مختلف در مقیاس رک را ترکیب می‌کند که هر کدام گلوگاه‌های خاصی در بارهای کاری مدرن هوش مصنوعی را هدف قرار می‌دهند:

Vera Rubin NVL72 به عنوان موتور محاسباتی اصلی عمل می‌کند. هر رک 72 GPU Rubin و 36 CPU Vera را که از طریق NVLink 6 متصل شده‌اند، یکپارچه می‌کند که 3.6 TB/s پهنای باند به ازای هر GPU را فشار می‌دهد - بیشتر از کل پهنای باند اینترنت جهانی، طبق گفته NVIDIA. این سیستم تمام چهار قانون مقیاس‌پذیری هوش مصنوعی را هدف قرار می‌دهد: پیش‌آموزش، پس‌آموزش، مقیاس‌پذیری زمان تست و مقیاس‌پذیری عاملی.

رک‌های Groq 3 LPX مشکل تأخیر را حل می‌کنند. با 256 واحد پردازش زبان در هر رک با استفاده از معماری SRAM فقط، اینها با NVL72 جفت می‌شوند تا آنچه NVIDIA ادعا می‌کند 35 برابر بیشتر توکن و 10 برابر بیشتر فرصت درآمد برای مدل‌های تریلیون پارامتری در مقابل Blackwell ارائه دهند.

رک‌های Vera CPU محیط‌های sandbox برای تست عامل فراهم می‌کنند. یک رک واحد بیش از 22,500 محیط یادگیری تقویتی همزمان را حفظ می‌کند - که برای اعتبارسنجی خروجی‌های هوش مصنوعی عاملی قبل از استقرار بسیار مهم است.

رک‌های BlueField-4 STX آنچه را که NVIDIA "ذخیره‌سازی بومی هوش مصنوعی" می‌نامد از طریق پلتفرم حافظه متنی CMX معرفی می‌کنند. با انتقال کش KV به ذخیره‌سازی اختصاصی با پهنای باند بالا، سیستم ادعا می‌کند توکن در ثانیه 5 برابر بالاتر و کارایی انرژی 5 برابر بهتر نسبت به رویکردهای سنتی دارد.

رک‌های شبکه Spectrum-6 SPX همه چیز را با سوئیچ‌های 102.4 Tb/s که دارای اپتیک بسته‌بندی شده مشترک هستند، به هم متصل می‌کنند.

استدلال اقتصاد توکن

NVIDIA این را پیرامون یک واقعیت بازار خاص قاب‌بندی می‌کند: مصرف توکن اکنون از 10 کوادریلیون سالانه فراتر رفته است و تغییر از تعاملات انسان-هوش مصنوعی به هوش مصنوعی-هوش مصنوعی این رشد را به طور چشمگیری تسریع خواهد کرد. سیستم‌های عاملی مدرن حجم عظیمی از توکن‌های استدلال تولید می‌کنند در حالی که نیازهای کش KV را گسترش می‌دهند - دقیقاً گلوگاهی که این معماری هدف قرار می‌دهد.

معیارهای SemiAnalysis InferenceMax شخص ثالث که توسط NVIDIA ذکر شده نشان می‌دهد سیستم‌های فعلی Blackwell در حال حاضر عملکرد 50 برابر بهتر به ازای هر وات و هزینه 35 برابر کمتر به ازای هر توکن در مقایسه با H200 ارائه می‌دهند. Vera Rubin قصد دارد این پیشتاز را گسترش دهد.

مهندسی حرارتی و انرژی

معماری رک MGX نسل سوم صاف‌سازی هوشمند انرژی را با 6 برابر بیشتر ذخیره انرژی در سطح رک (400 ژول به ازای هر GPU) نسبت به نسل‌های قبلی معرفی می‌کند. این تقاضاهای جریان اوج را تا 25٪ کاهش می‌دهد و نیاز به بسته‌های باتری عظیم را از بین می‌برد.

تمام رک‌ها در دماهای ورودی آب گرم 45 درجه سانتیگراد کار می‌کنند که به مراکز داده در بسیاری از آب و هواها امکان می‌دهد از خنک‌کننده هوای محیط استفاده کنند. NVIDIA ادعا می‌کند این قدرت کافی را آزاد می‌کند تا 10٪ رک بیشتر را در همان بودجه انرژی تسهیلات اضافه کند.

نگاه به آینده

فراتر از پیکربندی اولیه POD، NVIDIA پیش‌نمایش Vera Rubin Ultra NVL576 را با مقیاس‌پذیری به 576 GPU در هشت رک و معماری نسل بعدی Kyber را با هدف NVL1152 با 144 GPU در هر رک ارائه داد. نقشه راه نشان می‌دهد که NVIDIA دامنه‌های چند رکی NVLink را به عنوان آینده زیرساخت هوش مصنوعی می‌بیند - نه فقط GPU های بزرگتر، بلکه معماری‌های سیستمی اساساً متفاوت.

برای شرکت‌هایی که سرمایه‌گذاری‌های زیرساخت هوش مصنوعی را برنامه‌ریزی می‌کنند، پیام واضح است: اقتصاد محاسبات هوش مصنوعی در حال تغییر از بهینه‌سازی سطح تراشه به سطح تسهیلات است. کسانی که اکنون مراکز داده را می‌سازند با انتخابی بین سیستم‌های نسل فعلی و انتظار برای در دسترس بودن Vera Rubin در اواخر سال 2026 مواجه هستند.

منبع تصویر: Shutterstock

nvidia
زیرساخت هوش مصنوعی
vera rubin
مراکز داده
هوش مصنوعی سازمانی

NVIDIA ابرکامپیوتر هوش مصنوعی Vera Rubin POD 40-Rack را برای بارهای کاری عاملی رونمایی کرد

NVIDIA ابررایانه هوش مصنوعی Vera Rubin POD با 40 رک را برای بارهای کاری عاملی رونمایی کرد

پنج سیستم رک با هدف خاص

استدلال اقتصاد توکن

مهندسی حرارتی و انرژی

نگاه به آینده

محتوای پیشنهادی

اخراج‌های استراتژیک و تغییرات رهبری غول تحلیل کریپتو را متحول می‌کند

آمار صنعت بیمه بریتانیا ۲۰۲۶: داده های رشد

اورانگوتان تازه متولد شده 'کیکو' از باغ وحش آتلانتا ربوده شد

اخبار محبوب

اخراج‌های استراتژیک و تغییرات رهبری غول تحلیل کریپتو را متحول می‌کند

آمار صنعت بیمه بریتانیا ۲۰۲۶: داده های رشد

اورانگوتان تازه متولد شده 'کیکو' از باغ وحش آتلانتا ربوده شد

GODS از $0.04 عبور کرد — افزایش 24 درصدی هیجان ایجاد کرد

مدیریت اعتبار و تاب‌آوری عملیاتی: بهترین شیوه‌های Absa

قیمت‌ های ارز دیجیتال