如今 AI 已經(jīng)進入到全新的智能體 AI ( AI agent ) 階段,也就是說 PC 從原來單個推理工具轉(zhuǎn)變成了 AI 智能體中樞,從而對于 Token 的消耗量也是成倍提升,有巨頭表示相比較單個推理,智能體 AI 對于 Token 的消耗將會提升 1000 倍,因此想要玩轉(zhuǎn)智能體 AI 就需要強大的算力。

如今的智能體 AI 對于 PC 的要求達到了前所未有的程度,特別是許多特殊行業(yè),更是需要將 AI 模型本地化運行,從而保證數(shù)據(jù)的低延遲與高隱私,我們看到許多基于 Strix Halo 處理器打造的 AI 工作站都擁有超大容量的內(nèi)存。例如這一次 AMD 與合作伙伴所展示的一款 AI 工作站就搭載了 AMD 銳龍 AI MAX+ 395 處理器,其中的 Radeon 8060S 集顯擁有 40 個 CU,算力遠(yuǎn)超傳統(tǒng)內(nèi)置顯卡,已經(jīng)和部分高端獨立顯卡不相上下,并且這款工作站也搭載了 128GB 的 LPDDR5X 內(nèi)存,結(jié)合統(tǒng)一內(nèi)存架構(gòu)設(shè)計和 AMD 可變顯存技術(shù)(VGM)最多分配 96GB 用作顯存,從而輕松滿足包括 AI 智能體在內(nèi)的各種 AI 模型的本地化運行。

除了上述這些面向工作站以及消費級領(lǐng)域產(chǎn)品之外,AMD 也與合作伙伴一起展示了面向超大型 AI 模型訓(xùn)練的服務(wù)器產(chǎn)品,例如采用 AMD Instinct 計算卡打造的 AI 服務(wù)器就擁有 2U 規(guī)格,搭載雙路霄龍 9004/9005 系列處理器,最高支持 12 通道的 24 條 DDR5 內(nèi)存,并且也支持 4 路 PCIe GPU,還配備了 8 個 2.5 英寸的 U.2 SSD 插槽,這款服務(wù)器自然是為那些大中型企業(yè)所打造,能夠高效地進行 AI 模型的訓(xùn)練,也為企業(yè)員工提供高效且安全的 AI 推理,同時借助先進的冷卻系統(tǒng)減少能源的浪費,降低企業(yè)進行 AI 訓(xùn)練以及推理的成本。
