NVIDIA tocmai a lansat cele mai noi sisteme GB300 NVL72. Acestea pot gestiona de 50 de ori mai multă muncă per megawatt de electricitate comparativ cu platforma Hopper mai veche. Asta înseamnă că costurile scad de 35 de ori pentru fiecare bucată de informație procesată.
Signal65 a efectuat teste separate pe GB200 NVL72 și a constatat că procesează de peste 10 ori mai multe informații per watt, reducând costurile la o zecime din ceea ce erau.
Îmbunătățirile continuă să apară. Actualizările bibliotecii TensorRT-LLM de la NVIDIA au oferit singure GB200 o creștere de performanță de cinci ori în doar patru luni pentru sarcini care necesită răspunsuri instantanee. Echipele care lucrează la instrumentele Dynamo, Mooncake și SGLang împing eficiența și mai sus.
Aceste instrumente AI se defectează dacă există timp de întârziere sau nu pot reține suficient context. Companiile au nevoie ca ele să funcționeze efectiv în situații de afaceri reale, nu doar în demonstrații.
Instrumentele de inteligență artificială care scriu cod și funcționează ca asistenți digitali reprezintă acum aproape jumătate din toate căutările legate de AI, în creștere de la doar 11% acum un an.
Cifrele provin din raportul State of Inference al OpenRouter și arată cât de rapid se schimbă lucrurile în acest spațiu.
Această creștere bruscă îi face pe companii să se lupte să construiască hardware care să țină pasul. Acești asistenți AI trebuie să răspundă imediat și să rețină contextul din întreaga proiecte software, ceea ce pune cerințe serioase asupra puterii de calcul.
Explozia pieței alimentează bătălia giganților tech pentru dominație
Banii implicați sunt uriași. Piața agenților AI a fost evaluată la 4,92 miliarde de dolari în 2024. Estimările o plasează la 6,016 miliarde de dolari pentru 2025, apoi umflându-se la 44,97 miliarde de dolari până în 2035. Asta înseamnă o creștere de 22,28% în fiecare an pentru următorul deceniu. Băncile, spitalele, magazinele și fabricile sunt primii adoptatori.
Companiile introduc acești agenți în sistemele de management al clienților, instrumentele de planificare și configurațiile de securitate pentru a economisi bani și a realiza mai mult. Ceea ce a început ca tehnologie opțională devine infrastructură de bază.
Conform raportărilor Cryptopolitan, Alibaba tocmai a lansat Qwen3.5 vizând piața Chinei, pretinzând costuri de procesare cu 60% mai mici decât înainte. Modelul poate privi ecrane și efectua sarcini pe telefoane și computere. Merge cap la cap cu aplicația Doubao a ByteDance, iar vine și o actualizare DeepSeek.
OpenAI l-a angajat pe Peter Steinberger pe 15. El a construit OpenClaw, un agent AI open-source. CEO-ul Sam Altman a spus că Steinberger va conduce munca pe agenții personali de generație următoare și l-a numit geniu cu idei grozave despre asistenți inteligenți care pot face lucruri utile.
Criza de talente pe care nimeni nu o poate rezolva
94% dintre liderii de afaceri spun că le lipsesc abilitățile AI. Până în 2028, 44% se așteaptă să mai aibă deficite de 20 până la 40%. Workera spune că aceste lacune ar putea costa economia globală 5,5 trilioane de dolari în 2026 din cauza produselor întârziate, problemelor de calitate și vânzărilor pierdute.
Chiar acum cererea pentru talente AI depășește oferta cu 3,2 la unu la nivel mondial. Locurile de muncă AI plătesc cu 67% mai mult decât pozițiile software obișnuite. Totuși, 85% dintre lucrătorii de birou învață despre aceste lucruri în timpul lor liber, iar 83% spun că se auto-educă în principal în loc să primească formare formală.
Când companiile cumpără instrumente AI de la furnizori specializați, reușesc în 67% din timp. Construcțiile interne funcționează doar de aproximativ o treime din ori.
Salesforce a înregistrat o creștere de 119% a agenților la începutul lui 2025 și a depășit 500 de milioane de dolari în venituri recurente pentru aceste produse. Au adăugat 6.000 de clienți enterprise în trei luni.
Companiile vor cumpăra probabil soluții în loc să le construiască. Asta indică concentrarea pieței în jurul câtorva jucători mari care pot oferi ceea ce funcționează efectiv.
Sursă: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/


