NVIDIA於今日在CES上宣布推出可在NVIDIA RTX AI PC本機端運行的基礎模型,為數位人、內容創作、生產力和開發工作增添更強大的能力。這些以NVIDIA NIM 微服務形式提供的模型,由全新的GeForce RTX 50系列GPU加速,GPU具備每秒高達3,352兆次(TOPS)的AI運算效能及32GB的VRAM。採用NVIDIA Blackwell架構的RTX 50系列,是首款加入支援FP4運算能力的消費性GPU,可將AI推論效能提升兩倍,且與前一代硬體相比,能夠以更小的記憶體用量在本機端執行生成式AI模型。
GeForce一直以來都是AI開發者所使用的重要平台。2012年,開發者即使用GeForce GTX 580訓練第一個GPU加速的深度學習網路AlexNet,而去年已有超過三成發表的AI研究論文引用其使用GeForce RTX。現在,有了生成式AI和RTX AI PC,任何人都可以成為開發者。愛好者使用AnythingLLM、ComfyUI與LM Studio等新一波的低程式碼與無程式碼工具,透過簡單的圖形使用者介面在複雜的工作流程中使用AI模型。
使用者透過連接到這些圖形使用者介面(GUI)的NIM微服務,便能輕鬆存取與部署最新的生成式AI模型。建構在NIM微服務上的NVIDIA AI Blueprints,為數位人、內容創作等領域提供預先設定好又易用的參考工作流程。
為了滿足AI開發者與愛好者層出不窮的需求,每一家頂級PC製造商與系統建置商皆會推出搭載GeForce RTX 50 Series GPU的NIM-ready RTX AI PC。NVIDIA創辦人暨執行長黃仁勳表示:「AI正以光速發展,從感知式AI到生成式AI,再到現在的代理型AI。NIM微服務及AI Blueprints為PC開發者和愛好者提供了探索AI魔法的基礎。」
將AI變成NIM微服務
基礎模型,也就是使用大量原始資料訓練的神經網路,可以說是生成式AI的基礎。NVIDIA將推出一系列適用於RTX AI PC,來自Black Forest Labs、Meta、Mistral和Stability.AI等頂尖模型開發商的NIM微服務。使用案例涵蓋大型語言模型(LLM)、視覺語言模型、圖像生成、語音,以及用於檢索增強生成(RAG)、PDF擷取和電腦視覺的嵌入模型。 Black Forest Labs執行長Robin Rombach表示:「具備FP4運算功能的GeForce RTX 50系列GPU將開啟大量可以在PC上運行的模型,而這些模型過去只能在大型資料中心運行。讓FLUX變成NVIDIA NIM微服務,可以提高部署AI的速度,讓更多使用者體驗到AI的魅力,同時提供驚人出色的效能。」
NVIDIA今日還發表了Llama Nemotron開放模型系列,能夠以高準確度執行多樣化的代理型任務。Llama Nemotron Nano模型將以一項NIM微服務提供給RTX AI PC和工作站使用,在處理指令追蹤、函式呼叫、聊天、編碼和數學這一類代理型AI任務方面帶來精湛的表現。
NIM微服務包含在PC上執行AI所有必要元件,且無論是在RTX PC與工作站還是在雲端,皆可針對跨NVIDIA GPU的部署進行最佳化。開發者與愛好者將可透過Windows Subsystem for Linux(WSL),在Windows 11 PC上快速下載、設定和執行這些NIM微服務。
微軟Windows業務部門副總裁Pavan Davuluri表示:「AI正在快速推動Windows 11 PC創新,Windows Subsystem for Linux(WSL)與Windows Copilot Runtime為在Windows 11上的AI開發工作,提供了絕佳的跨平台環境。針對Windows PC最佳化的NVIDIA NIM微服務,讓開發者與愛好者可以隨時為他們的Windows應用程式整合AI模型,進一步為Windows使用者加速AI功能的部署。」
在RTX AI PC上運行的NIM微服務將相容於頂級的AI開發和代理框架,包括AI Toolkit for VSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、Langflow及LM Studio。開發者可以透過業界標準端點,將建立在這些框架上的應用程式和工作流程,連接到運行NIM微服務的AI模型,讓他們可以在雲端、資料中心、工作站和PC上,以統一介面使用最新技術。愛好者也可以使用即將推出的NVIDIA ChatRTX技術示範內容,體驗一系列NIM微服務。
為代理型AI帶來全新面貌
NVIDIA今日發表支援視覺的PC數位化身Project R2X,展示愛好者與開發者如何使用NIM微服務來建立AI代理與助理。R2X可以讓使用者輕鬆掌握資訊、協助桌面應用程式和視訊電話會議,以及進行閱讀和摘要文件等工作。
Project R2X數位化身以全新的生成式AI演算法NVIDIA RTX Neural Faces渲染而成,利用完全生成的像素來增強傳統的柵格化技術。接著使用全新的擴散式NVIDIA Audio2Face-3D模型來製作臉部動畫,並加強唇部和舌頭動作。可以透過CrewAI、Flowise AI和Langflow等開發者框架,將R2X連接至OpenAI的GPT4o和xAI的Grok等雲端AI服務,以及NIM微服務和AI Blueprints,例如PDF檢索器或替代LLM。
AI Blueprints即將登陸PC
NIM微服務也將透過AI Blueprints提供給PC使用者。AI Blueprints是可以在RTX PC上本機端運行的參考AI工作流程。開發者使用這些藍圖,可以執行從PDF文件建立Podcast、在3D場景的引導下產生精美的影像等作業。
PDF to podcast的藍圖能夠從PDF中提取文字、影像和表格,以建立可供使用者編輯的Podcast腳本。它還可以使用藍圖所得到的語音,或是根據使用者的語音樣本從腳本中產生完整的錄音內容。此外,使用者也能即時與AI Podcast主播對話,進一步了解特定主題。這個藍圖使用Mistral-Nemo-12B-Instruct等NIM微服務來處理語言,使用NVIDIA Riva來處理文字轉語音和自動語音辨識,並使用一系列NeMo Retriever微服務來擷取PDF檔案。
用於3D引導生成式AI的AI Blueprint可以讓藝術家更精細地控制圖像生成。AI可以從簡單的文字提示產生精美影圖像,不過單純使用文字來控制影像構圖卻非易事。創作者藉由這個藍圖,便能使用在Blender等3D渲染器中佈局出的簡單3D物件來引導產生AI圖像。藝術家可以手動建立3D資產或使用AI產生資產,將它們放在場景裡及設定3D視埠相機。接著由FLUX NIM微服務支援預先打包好的工作流程,就會用當前的構圖產生符合3D場景的高品質圖像。
NVIDIA NIM微服務與AI Blueprints將於二月推出,初步支援的硬體包括GeForce RTX 50系列、GeForce RTX 4090與4080,以及NVIDIA RTX 6000與5000專業級GPU。其他GPU將陸續加入支援系列。NIM-ready的RTX AI PC將透過Acer、ASUS、Dell、GIGABYTE、HP、Lenovo、MSI、Razer和Samsung,以及各地系統製作商陸續推出。
延伸閱讀:
史上最活潑有趣的 MINI Countryman SE ALL4 電動車試駕
《【我推的孩子】電影版》邁入完結齋藤飛鳥驚爆「出生就在說謊」
CASETiFY Ultra終極多功能背帶《CASETiFY Ultra Bounce Utility Lanyard》開箱動手玩
PHILIPS黑金剛磁吸三強:三合一磁吸行動電源+三合一磁吸充電座+磁吸手錶救急行動電源 開箱動手玩