GB200 NVL72 de la NVIDIA stabilește un nou record STAC-AI pentru inferența LLM în tranzacționarea financiară, oferind performanțe de până la 3,2x față de arhitectura Hopper. (Citește mai mult)GB200 NVL72 de la NVIDIA stabilește un nou record STAC-AI pentru inferența LLM în tranzacționarea financiară, oferind performanțe de până la 3,2x față de arhitectura Hopper. (Citește mai mult)

NVIDIA Blackwell spulberă benchmark-ul AI pentru finanțe cu câștiguri de viteză de 3,2x

2026/03/06 02:17
4 min de lectură
Pentru opinii sau preocupări cu privire la acest conținut, contactează-ne la crypto.news@mexc.com
```html

NVIDIA Blackwell pulverizează benchmark-ul AI financiar cu câștiguri de viteză de 3,2x

Iris Coleman 05 mar. 2026 18:17

GB200 NVL72 de la NVIDIA stabilește un nou record STAC-AI pentru inferența LLM în tranzacționarea financiară, oferind performanțe de până la 3,2x față de arhitectura Hopper.

NVIDIA Blackwell pulverizează benchmark-ul AI financiar cu câștiguri de viteză de 3,2x

Arhitectura Blackwell de la NVIDIA tocmai a înregistrat cele mai rapide rezultate din toate timpurile la benchmark-ul STAC-AI pentru inferența LLM financiară, cu GB200 NVL72 oferind îmbunătățiri de performanță de până la 3,2x pe un singur GPU față de generația anterioară Hopper. Rezultatele din 5 martie 2026 sunt importante pentru firmele de tranzacționare care se grăbesc să extragă alpha din analiza datelor nestructurate.

Strategic Technology Analysis Center, care a evaluat sarcini de lucru din tehnologia financiară de peste 15 ani, a testat Blackwell în scenarii din lumea reală folosind declarațiile EDGAR 10-K—rapoartele anuale dense pe care fondurile cantitative le analizează pentru semnale de investiții. Rulând modelele Llama 3.1 de la Meta, GB200 NVL72 a atins 37.480 de cuvinte pe secundă la prompturi financiare de lungime medie, comparativ cu 8.237 WPS pentru sistemele duble GH200.

Cifrele brute spun povestea

Pe modelul Llama 3.1 8B cu date EDGAR4, Blackwell a procesat 224 de cereri pe secundă versus 51,5 RPS pentru Hopper—o îmbunătățire de 4,3x la nivel de sistem. Diferența s-a lărgit la sarcinile mai grele din punct de vedere computațional: modelul cu parametri 70B pe declarațiile EDGAR5 cu context lung a văzut throughput-ul sărind de la 41,4 WPS la 150 WPS.

Ce face posibile aceste câștiguri? Noul format de cuantizare NVFP4 al NVIDIA, exclusiv pentru Blackwell, comprimă modelele în amprente de memorie mai mici fără a sacrifica acuratețea. Hopper rula cuantizare FP8; saltul arhitectural la precizie de patru biți pe Blackwell deblochează delta throughput-ului.

Performanța interactivă contează pentru tranzacționare

Procesarea în loturi este un lucru. Deciziile de tranzacționare în timp real necesită răspunsuri rapide. Aici, Blackwell a menținut timpi de reacție mai mici (analogi cu timpul până la primul token) și latență inter-cuvinte mai bună chiar și când a fost împins spre throughput maxim. La niveluri de utilizare potrivite, GB200 NVL72 a depășit constant GH200 la metricile de reactivitate în majoritatea scenariilor de testare.

Pentru birourile de tranzacționare care rulează analize de sentiment la apelurile privind câștigurile sau analizează știri de ultimă oră, acel avantaj de latență se traduce direct în luarea mai rapidă a deciziilor. Benchmark-ul a testat explicit întregul pipeline de inferență, inclusiv tokenizarea—muncă pe care implementările reale nu o pot omite.

Context de piață

Acțiunile NVIDIA s-au tranzacționat la 181,41 USD pe 5 martie, în creștere cu 1,1% în ziua respectivă, cu capitalizarea de piață a companiei situându-se la 4,42 trilioane USD. Arhitectura Blackwell, anunțată la GTC 2024, a fost concepută special pentru sarcini de lucru AI generative. CEO-ul Jensen Huang a poziționat-o ca alimentând „o nouă revoluție industrială", iar aceste rezultate de benchmark oferă dovezi concrete pentru această afirmație în sectorul financiar.

Superchip-ul GB200 Grace Blackwell combină două GPU-uri B200 cu un CPU Grace, cu AI Tensor Cores reproiectate și NVLink de a cincea generație pentru scalare până la 576 de GPU-uri. Rezultatele anterioare MLPerf au arătat câștiguri de antrenament de 2,2x pe Llama 3.1 405B; aceste cifre STAC-AI confirmă că avantaje similare se extind la inferență.

Hopper încă relevant

Demn de menționat: arhitectura Hopper în vârstă de trei ani a înregistrat cifre respectabile. Firmele de tranzacționare cu implementări GH200 existente nu devin obsolete peste noapte. Dar pentru construcții noi sau firme unde viteza de inferență afectează direct randamentele, economia lui Blackwell pare atractivă—NVIDIA pretinde o reducere de până la 25x a costurilor operaționale de inferență LLM față de generațiile anterioare.

Rapoartele complete STAC, inclusiv metricile detaliate din modul interactiv la diferite rate de sosire, sunt disponibile prin canalele oficiale STAC. Instituțiile financiare care evaluează upgrade-uri ale infrastructurii AI au acum date auditate de la terți pentru a informa deciziile de achiziție.

Sursa imaginii: Shutterstock
  • nvidia
  • blackwell
  • inferență ai
  • tranzacționare financiară
  • llm
```
Declinarea responsabilității: Articolele publicate pe această platformă provin de pe platforme publice și sunt furnizate doar în scop informativ. Acestea nu reflectă în mod necesar punctele de vedere ale MEXC. Toate drepturile rămân la autorii originali. Dacă consideri că orice conținut încalcă drepturile terților, contactează crypto.news@mexc.com pentru eliminare. MEXC nu oferă nicio garanție cu privire la acuratețea, exhaustivitatea sau actualitatea conținutului și nu răspunde pentru nicio acțiune întreprinsă pe baza informațiilor furnizate. Conținutul nu constituie consiliere financiară, juridică sau profesională și nici nu trebuie considerat o recomandare sau o aprobare din partea MEXC.