星期五, 19 4 月, 2024

NVIDIA藉由Tensor核心GPU、LLM與供RTX PC和工作站工具 帶來可增強生成式AI人工智慧

spot_img

【新聞照片一】全新GeForce-RTX-SUPER-GPU、AI筆記型電腦和NVIDIA-TensorRT加上TensorRT-LLM將推動AI-PC時代向前邁進。

NVIDIA於1/9宣布推出可增強生成式AI人工智慧執行表現的GeForce RTX SUPER桌上型電腦GPU、各大電腦製造商推出的全新AI筆記型電腦,以及針對開發者和玩家推出的全新NVIDIA RTX加速的AI軟體和工具。NVIDIA數十年來始終在PC領域處於領導地位,隨著超過一億顆RTX GPU推動了AI PC時代的到來,NVIDIA現在將提供這些工具,利用生成式AI讓人們擁有更佳的PC使用體驗:NVIDIA TensorRT加速用於熱門Stable Diffusion模型從文字到影像的工作流程、NVIDIA RTX Remix搭配生成式AI工具、NVIDIA ACE微服務,以及更多使用DLSS 3技術和畫格生成(Frame Generation)的遊戲。

此外,NVIDIA TensorRT-LLM(TRT-LLM)開源函式庫可加速並最佳化上最新大型語言模型(LLM)的推論效能,且現在支援更多針對PC預先最佳化的模型。NVIDIA於1/9推出的技術展示內容Chat with RTX在TRT-LLM的加速下,可以讓AI技術愛好者與他們的筆記、文件和其他內容進行互動。NVIDIA創辦人暨執行長黃仁勳表示:「生成式AI是運算史上最重要的平台轉換,將改變包含遊戲在內等各產業的發展樣貌。

NVIDIA龐大的安裝基礎包含超過一億台的RTX AI PC和工作站,將讓開發者和玩家們得以享受生成式AI的魔法。」在PC本地端運行生成式AI,對於隱私、延遲和成本敏感型應用程式來說極為重要。它需要安裝大量的AI-ready系統,再加上合適的開發工具來將PC平台的AI模型調整至最佳狀態。NVIDIA正積極創新它的完整技術堆疊,推動新的體驗,並且在500多款已經獲得NVIDIA RTX加速技術且支援AI的PC應用程式和遊戲基礎上更進一步發展,以滿足這些需求。

RTX AI PC與工作站

NVIDIA RTX GPU能夠以最高效能運行各種應用程式,可徹底解放PC上生成式AI的潛力。在工作和娛樂方面,這些GPU中的Tensor核心能夠顯著提升各種最高需求的應用程式的AI執行效能。

於1/9在CES大會上發布的全新GeForce RTX 40 SUPER系列顯示卡,包括可提供頂級AI執行效能的GeForce RTX 4080 SUPER、4070 Ti SUPER和4070 SUPER。GeForce RTX 4080 SUPER產生AI影片的速度,比GeForce RTX 3080 Ti GPU快上1.5倍,產生圖片的速度比GeForce RTX 3080 Ti GPU快1.7倍。SUPER GPU中的Tensor核心每秒可進行多達836兆次運算,為遊戲、創作等領域及日常生產力帶來了變革性的AI功能。

【新聞照片四】4K效能猛獸:-GeForce-RTX-4080-SUPER,支援4K全光線追蹤遊戲。在AI工作負載方面,生成影片的速度比-RTX-3080-Ti-快-1.5-倍以上,生成圖片的速度比-RTX-3080-Ti-快-1.7-倍以上。 ▲4K效能猛獸:GeForce RTX 4080 SUPER,支援4K全光線追蹤遊戲。在AI工作負載方面,生成影片的速度比RTX 3080 Ti快1.5倍以上,生成圖片的速度比RTX 3080 Ti快1.7倍以上。

包括宏碁、華碩、Dell、HP、Lenovo、微星、Razer和三星在內的各大電腦製造商,都將推出新一波的RTX AI筆記型電腦,為使用者帶來一整套開箱即用的生成式AI功能。這些全新系統將在本月開始出貨,可提供與使用神經處理器相比,達20至60倍不等的效能提升。。

搭載RTX GPU的行動工作站能夠運行NVIDIA AI Enterprise軟體,包括TensorRT和NVIDIA RAPIDS,以更簡單安全的方式來發展生成式AI和資料科學。每顆NVIDIA A800 40GB Active GPU均提供NVIDIA AI Enterprise三年使用授權,為AI和資料科學提供了一個理想的工作站開發平台。

用於構建AI模型的全新PC開發者工具

NVIDIA此前推出統一易用的工具套件NVIDIA AI Workbench,以協助開發人員利用PC等級效能和記憶體佔用空間,快速建立、測試和自訂預先訓練好的生成式AI模型和LLM。AI Workbench將於本月推出測試版,讓使用者能夠更輕鬆取得Hugging Face、GitHub和NVIDIA NGC等熱門儲存庫,並且開發者還能透過簡單易用的使用者介面,輕鬆複製、協作和遷移項目。

此外,專案可以擴展到幾乎任何地方,無論是資料中心、公有雲或NVIDIA DGX Cloud,然後再帶回PC或工作站上的本地端RTX系統進行推論和輕度的自訂工作。NVIDIA也透過跟HP合作,將包括RTX加速的AI模型和軟體開發套件在內的NVIDIA AI Foundation模型與端點,與資料科學集中平台HP AI Studio進行整合,讓開發AI模型一事變得更簡單。這將使用戶能夠在PC和雲端環境中,輕鬆搜尋、導入和部署經過最佳化調整的模型。

開發者為PC使用個案建立AI模型後,可以使用NVIDIA TensorRT將其調整至最佳狀態,以充分利用RTX GPU的Tensor核心。NVIDIA最近透過用於加速LLM的開源函式庫TensorRT-LLM for Windows,將TensorRT的使用範圍擴大到以文字為基礎的應用程式上。TensorRT-LLM現已推出最新更新版本,在不斷增加的PC預先最佳化模型清單中加入了Phi-2,運行速度較其他推論後端處理快上5倍。

RTX加速的生成式AI支援帶來全新PC使用體驗

NVIDIA在今年的CES大會中,將與開發者合作夥伴為PC推出全新的生成式AI應用程式和服務項目,包含:

  • NVIDIA RTX Remix是一個用於建立經典遊戲RTX復刻版的平台。NVIDIA RTX Remix平台將於本月稍晚推出測試版,提供生成式AI工具,可將經典遊戲中的基本紋理換成更現代 、4K解析度、符合物理原理的渲染材質。
  • NVIDIA ACE微服務,包括生成式AI語音和動畫模型,使得開發者能夠為遊戲加入有著智慧、活靈活現的數位化身。
  • 用於Stable Diffusion裡Stable Diffusion XL(SDXL)Turbo和latent consistency這兩個最熱門模型的TensorRT加速方法。與之前最高的執行速度相比,TensorRT將這兩種方法的執行效能提高了60%。Stable Diffusion WebUI TensorRT擴充項目的更新版本現在也已經推出,包括SDXL、SDXL Turbo、LCM – Low-Rank Adaptation(LoRA)加速和改進後的LoRA支援功能。
  • 包括《地平線:西域禁地(Horizon Forbidden West)》、《Pax Dei》和《龍族教義2(Dragon’s Dogma 2)》等已公布的14款全新RTX遊戲中,都將採用帶有畫格生成技術的NVIDIA DLSS 3,該技術利用AI將畫格率提高到原生渲染的四倍。
  • NVIDIA的技術展示項目Chat with RTX讓AI愛好者能夠使用一種名為檢索增強生成(Retrieval-Augmented Generation,簡稱RAG)的熱門技術,輕鬆將PC LLM與自己的數據資料連接起來。該展示內容由TensorRT-LLM加速,可讓使用者快速與自己的筆記、文件和其他內容進行互動。它還能當成開源參考專案來使用,因此開發人員可以輕鬆在自己的應用程式中使用相同功能。

延伸閱讀:
Apple推出搭載A17 Pro晶片、動作按鈕、USB-C的鈦金屬iPhone 15 Pro|15 Pro Max
Google Pixel 8 Pro搭載Gemini Nano模型成為首款內建AI的智慧型手機

野外露營車遊最佳供電夥伴 PHILIPS 600W儲能行動電源開箱動手玩
蘋果推出首批碳中和產品Apple Watch Series 9智慧型手錶

Dustin
Dustin
汽車、3C編輯出身,提供平面雜誌、網站平台、數位媒體的整合性內容,曾任Stuff國際中文版主編,《汽車小百科2》書籍作者,目前自創數位媒體公司,創立ZEEK玩家誌並擔任總編一職,供稿於MSN汽車頻道、Yahoo!奇摩汽機車、FHM男人幫...等媒體,提供汽車試駕、產品測試、專題訪問、特別企劃...等文章。歡迎廠商來信合作!
- Advertisement -spot_img

最新文章