Tech

輝達推出全新NVIDIA NeMo Retriever微服務提升大型語言模型的精確度與吞吐量

2024-07-27

要是少了準確性，生成式AI人工智慧應用程式便失去了它的價值，有時甚至價值是負的，而精確度的根源在於資料。為了協助開發人員有效率地取得最佳的專屬資料，為其AI應用產生有著豐富知識的回應內容，NVIDIA於今日發表NVIDIA NeMo Retriever NIM推論微服務。NeMo Retriever NIM微服務加上今日宣布適用於Llama 3.1模型集合的NVIDIA NIM推論微服務，可讓企業擴展至代理式AI工作流程。而在此流程中，AI應用程式只需最少的人為干預或監督即可精確運作，同時提供最高精確度的檢索增強生成（RAG）。

NeMo Retriever可讓組織將自訂模型無縫連接至各種業務資料，並且使用RAG為AI應用程式提供高準確度的回應。從本質上講，生產就緒型的微服務能夠檢索出高度精確的資訊，以建立極為精準的AI應用程式。舉例來說，NeMo Retriever可為開發人員提高模型精確度與吞吐量，以建立AI代理程式與客服聊天機器人、分析安全漏洞，或是從複雜的供應鏈資訊中提取重要見解。NIM推論微服務能夠做到高效能又易於使用的企業級推論作業開發人員有了NeMo Retriever NIM微服務，便能從所有這些功能中獲益，而這一切都在他們的資料大力支援下方能達成。

這些全新的NeMo Retriever嵌入與重新排序NIM微服務現已全面推出：

NV-EmbedQA-E5-v5，一種針對文字問答檢索進行最佳化的熱門社群基礎嵌入模型。
NV-EmbedQA-Mistral7B-v2，一種熱門的多語言社群基礎模型，針對高精準回答問題的文字嵌入進行微調。
Snowflake-Arctic-Embed-L，經過最佳化調整的社群模型。
NV-RerankQA-Mistral4B-v3，一種針對高精準回答問題的文字重新排序進行微調的熱門社群基礎模型。

它們加入了可透過NVIDIA API目錄輕鬆存取的NIM微服務集合。

嵌入與重新排序模型

NeMo Retriever NIM微服務包含嵌入與重新排序這兩種模型，並且提供開放與商業服務，以確保透明度與可靠性。

▲適用於Llama 3.1使用NVIDIA NIM微服務的RAG管線範例，以及針對客服AI聊天機器人應用程式使用NeMo Retriever嵌入與重新排序NIM微服務的範例。

嵌入模型可將文字、圖片、圖表和影片等多元資料轉換為數值向量，並且存在向量資料庫中，同時擷取其意義和細節。嵌入模型比傳統的大型語言模型（LLM）的速度更快、運算成本也更低。重新排序模型會擷取資料和查詢，然後按照資料與查詢的相關性對資料進行評分。這類模型在顯著提高精確度之際，計算上卻又比嵌入模型複雜和更慢。

NeMo Retriever兼採兩方之長。開發人員使用嵌入NIM來檢索的廣泛資料網，然後使用重新排序NIM來修剪結果的相關性，可以透過NeMo Retriever建立一個管道，確保為企業提供最有用也最精準的結果。開發人員透過NeMo Retriever，便能使用最先進的開放式商業模型來建立有著最高準確度的文字問答檢索管道。與其他模型相比，NeMo Retriever NIM微服務為企業在回答問題時提供不準確答案的比例減少了30%。

▲NeMo Retriever嵌入NIM，以及嵌入加上重新排列NIM微服務的效能與詞彙搜尋及替代嵌入器的比較。

搭配其他NIM微服務使用

NeMo Retriever NIM微服務可以搭配NVIDIA Riva NIM微服務使用，就像是為各產業的語音AI應用程式助一臂之力，以提供更好的客戶服務，還有讓數位人類更加活靈活現。即將推出的Riva NIM微服務新模型有適用於文字轉語音應用程式的FastPitch與HiFi-GAN；適用於多語言神經機器翻譯的Megatron，以及創紀錄的NVIDIA Parakeet自動語音辨識模型系列。

NVIDIA NIM微服務可以一起或單獨使用，為開發人員提供模組化的方式來建立AI應用程式。這些微服務還能跟社群模型、NVIDIA模型或使用者自訂的模型進行整合，無論是在雲端、內部部署或混合環境中，都能為開發人員提供更多彈性。NVIDIA NIM微服務可於ai.nvidia.com網站取得。企業可透過NVIDIA AI Enterprise軟體平台，利用NIM在生產環境中部署AI應用程式。

NIM微服務可在客戶常用的加速基礎架構上執行，包括來自Amazon Web Services、Google Cloud、Microsoft Azure和Oracle Cloud Infrastructure的雲端執行個體，以及包括思科、戴爾科技集團、慧與科技、聯想和美超微等全球伺服器製造合作夥伴所推出的NVIDIA認證系統NVIDIA認證系統。

NVIDIA開發人員計畫會員很快就可以免費使用NIM，在他們常用的基礎架構上進行研究、開發與測試。NVIDIA將於7/28至8/1參加在美國丹佛舉行的SIGGRAPH電腦繪圖研討會，與NVIDIA一同了解生成式AI與加速運算領域的最新發展。

延伸閱讀：
雲端、手遊、模擬器遊戲通吃《Logitech G Cloud雲端遊戲掌機》全攻略評測
萬代南夢宮娛樂《太鼓之達人咚咚雷音祭》與電視動畫《航海王》展開合作
潮味決攜《楓之谷M》跨界合作！期間限定推出聯名套餐、周邊
Ubisoft開放世界遊戲《星際大戰：亡命之徒》開放預購8/30推出

這些全新的NeMo Retriever嵌入與重新排序NIM微服務現已全面推出：

嵌入與重新排序模型

熱門使用案例

搭配其他NIM微服務使用