於AI PC領域,NVIDIA持續與AI相關領域合作積極提升RTX GPU與AI的最佳化,NVIDIA CES宣布有越來越多的AI模型可支援NVFP4、NVFP8,相對BF16可進一步減少記憶體使用與提升性能;另外NVIDIA也將釋出LTX-2影像生成模型,主打支援NVFP8格式,可在20秒內產生4K影片;同時NVIDIA也預計在2月釋出結合生成式AI的影片超解析技術,可在僅3分鐘完成過往需15分鐘自720p升級至4K的10秒影片。
▲借助支援NVFP4、NVFP8格式,NVIDIA GPU執行特定AI模型的性能再次獲得顯著提升
▲使用原生NVFP4、NVFP8使消費級顯示卡也能執行資料中心等級的AI模型
NVIDIA的RTX顯示卡率先支援NVFP4、NVFP8等量化格式,並證實可在不損失正確性且占用更少記憶體實現更好的效果,越來越多的開放AI模型也開始支援NVFP4、NVFP8這兩種格式,相較BF16格式,NVFP8可減少40%記憶體占用,NVFP4則進一步僅需BF16約40%記憶體,在降低系統記憶體需求的同時也增加執行效率,除了可在相同的VRAM執行更大參數模型外,在結合將部分未使用模型區塊轉移到系統記憶體的技術,16GB的RTX顯示卡足以執行占用26GB的模型。
▲NVIDIA的開源生成式AI影片模型LTX-2可產生20秒的4K影片,並原生支援NVFP8量化
另外NVIDIA也公布新一代影像生成模型LTX-2,由於導入NVFP8量化格式,較LTX影像模型效能提升一倍,大幅縮減執行時間,並可產生最多20秒的4K解析度影像,此外LTX-2也維持與前一代相同的開源模式,即日起可在HuggingFace與ComfyUI下載。
▲結合生成式AI的影片超解析技術不僅可將720p影片細緻的提升至4K,同時透過FP8量化大幅縮減處理時間
▲相較原本需費時15分鐘處理影片升頻,原生支援低精度量化與最佳化微調把處理時間縮短至3分鐘
另外,NVIDIA也預計在2026年2月於ComfyUI推出結合生成式AI的影片超解析技術,利用支援NVFP8量化格式以及Py-Torch最佳化的Cuda,相較使用BF16的AI模型需耗時15分鐘才能完成720p至4K的10秒短片處理,NVIDIA的生成式AI影片超解析技術把處理程序大幅縮減為3分鐘。


