隨著NVIDIA在2018年推出RTX技術,以及首款專為AI人工智慧打造的消費級GPU──GeForce RTX,加速推動向AI運算領域邁進的轉變起,RTX與工作站上的AI持續蓬勃發展,如今已茁壯成擁有超過一億名使用者和500款AI應用程式的生態系統。生成式AI現正迎來從PC到雲端運算的新一輪功能浪潮。而NVIDIA在AI領域的豐富經驗與專業知識,有助於確保所有使用者都能獲得處理各種AI功能的優異執行效能。
家庭和辦公室裡的使用者已經開始運用RTX上的AI軟體以提高生產力,並提升娛樂性。遊戲玩家可以享受GeForce RTX GPU所蘊含的AI優勢,以更高的畫格率及出色的解析度來運行他們最愛玩的遊戲。創作者可以把重心放在發揮天馬行空的創意上,而不用浪費時間盯著螢幕畫面上顯示著「執行中」不停轉動的圈圈,或重複平凡枯燥的工作。開發人員則可以利用生成式AI來製作原型及自動除錯,簡化他們的工作流程。AI高速發展中,隨著更進一步深入研究,AI將用於處理更複雜的工作,而使用者對效能的嚴苛要求則由RTX來滿足。
什麼是AI?
從最基本的形式來看,AI是一種更聰明的運算方式。它是電腦程式或機器在沒有明確用指令編寫程式碼的情況下,思考、學習和採取行動的能力,即使用者無需控制每一個指令。AI可以理解為一種裝置消化和分析海量數據資料,然後找出其中的模式(通常被稱為「經過訓練」),從而自主執行任務的能力。
AI的研發始終圍繞著開發系統來進行,這些系統可以完成原本需要一般人類智慧及大量輸入資料才能完成的工作,並且以超出任何個人或群體的效率來完成。因此,AI被認為具有顛覆性和高度變革性。
AI系統的一大關鍵優勢便是能夠從經驗或資料模式中學習,在獲得新的輸入項目或資料時自行調整結論。這種自我學習能力使得AI系統能夠完成各種驚人的工作,包括影像識別、語音辨識、語言翻譯、醫療診斷、車輛導航、圖片和影片增強,還有其他數百種應用案例。
AI下一步將朝內容生成的功能發展,即生成式AI。它能夠讓使用者基於不同種輸入,包括文字、圖片、聲音、動畫、3D模型或其他類型的資料,快速建立新的內容,並對其進行迭代,然後以相同或新的形式生成新內容。
使用者可以運用如基於雲端的ChatGPT等這類熱門語言應用程式,根據簡短的文字請求生成長格式文案。而Stable Diffusion這類影像生成器可以將輸入的描述性文字變成所需的影像。更有其他新的應用程式將可以把文字變成影片,將2D平面圖片變成3D立體渲染結果。
GeForce RTX AI PC與NVIDIA RTX工作站
AI PC是一種配備專用硬體的電腦,用於協助AI運行得更快,具體展現在過往需耗費時間等待3D影像載入,如今透過AI降噪器便能夠看到影像的即時更新。RTX GPU上這些專門的AI加速器被稱為Tensor核心,它們能夠顯著提高需要高效能的工作和娛樂應用程式裡的AI表現。
TeraOps/s或每秒兆次運算(TOPS)是衡量AI效能的方法之一。TOPS跟引擎的馬力等級類似,可以讓使用者透過單一指標了解PC的AI效能。目前GeForce RTX GPU的AI效能選擇範圍,大約介於200至1,300以上AI TOPS不等,也提供許多介於筆記型電腦和桌上型電腦兩者之間的效能選擇。此外,專業人士可選擇提供更高AI效能的NVIDIA RTX 6000 Ada世代GPU。從這個角度來看,目前未搭載GPU的AI PC的效能在10到45 TOPS之間。
越來越多類型的AI應用程式將需要一台能夠在本地端或裝置上執行特定AI工作,而非在雲端環境裡運行的PC。在AI PC上運行的優點包括,PC在未連接網路的環境下也能隨時進行運算;藉系統的低延遲實現高度的反應速度;並且帶來更高的隱私性,使用者無需將敏感資料上傳到線上資料庫,AI在本地端就能使用這些資料。
可供所有人使用的AI
RTX GPU帶來的不光是效能,它們還帶來了只有RTX技術才能做到的功能。無論使用者的技術水準,數百萬人都可以使用其中的許多AI功能,並且感受AI技術對人帶來的影響。從運用AI來將影像升頻、提升視訊會議品質,再到智慧化、個人專屬的聊天機器人,帶給使用者各種類型的應用工具。
RTX Video採用AI技術對串流影片進行升頻,並以HDR格式顯示。將標準動態範圍的低解析度影片,提升到清晰生動、高達4K畫質的高解析度高動態範圍。RTX使用者在Chrome或Edge瀏覽器中的絕大多數串流影片上,僅需點擊一次便能啟用並享受這項功能。
NVIDIA Broadcast是可供RTX使用者免費使用、界面操作簡單的應用程式,擁有一系列可改善視訊會議和直播效果等的AI功能。它可以透過噪音和回音消除(Noise and Echo Removal)功能消除不需要的背景聲音,例如敲鍵盤聲、吸塵器聲和孩子的哭鬧尖叫聲;它能利用虛擬背景(Virtual Background)功能,透過更強大的邊緣偵測功能來替換或模糊背景;它還能運用影像噪音消除(Video Noise Removal)功能讓低解析度的攝影機影像變得平滑。此外,無論使用者走到哪裡,它都能透過自動取景(Auto Frame)和眼神接觸(Eye Contact)功能,讓眼睛注視著攝影鏡頭,並且保持在螢幕畫面中央。
▲Chat With RTX是一個本地端、個人專屬的AI聊天機器人展示項目,容易上手且可以免費使用。
使用者只要把檔案放入一個資料夾中,然後將展示程式指向該位置,就能輕鬆將PC上本地端的檔案連接到有支援的大型語言模型。使用者可以進行查詢,快速獲得與前後文有關的答案。
由於Chat With RTX是在Windows系統的GeForce RTX PC和NVIDIA RTX工作站上的本地端運行,它的運行速度非常快,且使用者的數據資料可以保留在裝置上,也不會丟失。與依賴雲端環境的服務不同,Chat With RTX允許使用者能夠在PC本地端處理敏感資料,無需分享給第三方或是連接到網路。
供遊戲玩家使用的AI
在過去的六年裡,遊戲效能在AI加速技術的協助下突飛猛進。玩家們從2019年開始便開始使用NVIDIA DLSS來提升畫格率及改善影像品質。這是一種利用AI在遊戲裡自動生成畫素的技術,經過不斷改良,現在DLSS可以將畫格率提高至最高四倍。
在最新版本DLSS 3.5中引入光線重建技術後,更進一步強化了全球頂尖遊戲大作的視覺品質,為視覺效果更豐富、更具有臨場感的遊戲樹立了新標準。現有超過500款遊戲和應用程式利用光線追蹤、DLSS和AI技術,徹底改變了玩家享受遊戲和進行創作的方式。除了提升畫格率,AI還將改善遊戲玩家與角色的互動方式及重新製作經典遊戲。
包括生成式AI語音和動畫模型在內的NVIDIA ACE微服務,讓開發人員能夠在遊戲中加入有著智慧且生動的數位化身。在CES大會上展示的ACE項目以其創造出寫實逼真遊戲角色的能力贏得了多個獎項,更讓人們看到了PC遊戲領域未來的發展趨勢。
供遊戲修改者建立經典遊戲RTX重製版的NVIDIA RTX Remix平台,提供生成式AI工具,可將經典遊戲中的基本材質紋理,轉化成現代 、擁有4K解析度、符合物理原理的渲染材料。部分項目已經推出或正在製作中,其中包括《戰慄時空2 RTX(Half-Life 2 RTX)》及《傳送門with RTX(Portal with RTX)》。
供創作者使用的AI
AI可以減少人們處理繁瑣工作的時間,或是自動執行這些工作,讓創作者有更多時間來釋放創作潛能,純粹地進行創作。而這些功能僅在配備NVIDIA RTX或GeForce RTX GPU的PC上運行或可獲得最高的執行速度。
▲Adobe Premiere Pro的Enhance Speech工具可消除不必要的噪音,並提升對話品質。
Adobe Premiere Pro的Enhance Speech工具經過RTX加速運行下,使用AI消除不必要的噪音,提高對話片段的品質,使得它們聽起來更專業。它在RTX上的運行速度是在Mac上的4.5倍。Adobe Premiere Pro還有另一項自動裁剪(Auto Reframe)功能,使用GPU加速來辨識和追蹤影片中最具相關性的元素,智慧地按照不同長寬比來重新調整影片畫面。
DaVinci Resolve的Magic Mask是另一個可以讓影片剪輯人員節省工作時間的AI功能。在此之前,如果剪輯人員要調整鏡頭中主體的顏色或亮度,或是移除不需要的物體,必須搭配轉描(rotoscoping)技術或基本的Power Window和Mask功能,才能將主體從背景中分離出來。
Magic Mask功能徹底改變了這種工作流程。有了它,創作者只要在主體上畫一條線,AI處理片刻後就會於所選的區域中顯示。GeForce RTX筆記型電腦運行這項功能的速度,是未配備RTX的筆記型電腦的2.5倍。這僅僅是運用AI提高創作速度的其中一個例子,如今已有超過125項由RTX加速的AI應用程式。
供開發人員使用的AI
AI透過具擴充性的環境、硬體和軟體最佳化,以及新的API,將讓開發人員有更好的方式來開發軟體應用程式。NVIDIA AI Workbench可以協助開發人員利用PC級的效能和記憶體,快速建立、測試和客製化預先訓練好的生成式AI模型和大型語言模型(LLM)。它是一個具統一性、且易於使用的工具包,可以在RTX PC上本地端運行,也可以擴大到幾乎任何資料中心、公有雲或NVIDIA DGX Cloud等虛擬環境運行。
在為PC使用案例建立好AI模型後,開發人員可以使用NVIDIA TensorRT軟體將其調整至最佳狀態,該軟體能夠協助開發人員充分利用RTX GPU中的Tensor核心。現在可以透過TensorRT-LLM for Windows,在文字式應用程式裡使用TensorRT加速技術。這個開源函式庫提高了LLM的效能,並且加入適用於Google的Gemma、Meta Llama 2、Mistral及Microsoft Phi-2等熱門模型的預先最佳化檢查點。
開發人員還能取得用於OpenAI Chat API的TensorRT-LLM包裝函式。只要修改一行程式碼,continue.dev,這是一個針對VS Code和可以利用大型語言模型的JetBrains的開源autopilot,就能在RTX PC上本機端使用TensorRT-LLM,運用這項熱門工具在本機端快速進行LLM推論作業。
我們將在接下來的每一週揭開AI的神秘面紗,幫助更多人了解和接觸AI技術,並且為RTX AI PC使用者展示最新的硬體、軟體、工具和加速功能。AI的iPhone時代已經到來,而這只是開始。歡迎來到《解碼AI》。
延伸閱讀:
單眼相機掰!realme推出首款潛望長焦手機realme 12 Pro+
[USB-C宇宙] iPhone 15 Pro × SanDisk Extreme Portable SSD 行動固態硬碟 開箱動手玩
新一代派對神器 UE HYPERBOOM + WONDERBOOM 3 開箱動手玩
羅技攜插畫家33打造「女子扮桌空間」!同步推Wave Keys鍵盤玫瑰粉色、LIFT滑鼠左手版