【資料圖】
來源:環(huán)球網(wǎng)
【環(huán)球網(wǎng)科技綜合報道】12月16日消息,據(jù)VentureBeat報道,英偉達(dá)近日正式推出Nemotron 3開源AI模型系列,包含Nano、Super和Ultra三種規(guī)格。該系列憑借突破性技術(shù)架構(gòu)與卓越性能表現(xiàn),被定位為構(gòu)建AI智能體應(yīng)用時“具有最佳準(zhǔn)確性的最高效開源模型家族”。
據(jù)介紹,Nemotron 3系列采用突破性的混合潛在專家(MoE)架構(gòu),可支持開發(fā)者大規(guī)模構(gòu)建和部署可靠的多智能體系統(tǒng)。其中,Nemotron 3 Nano作為300億參數(shù)的小型模型,每次激活最多調(diào)用30億參數(shù),專為軟件調(diào)試、內(nèi)容摘要、AI助手工作流程及低推理成本信息檢索等任務(wù)優(yōu)化,是目前計算成本效率領(lǐng)先的模型。相較于上一代產(chǎn)品Nemotron 2 Nano,其token處理吞吐量提升4倍,推理token生成效率提高60%,顯著降低了推理成本,同時依托100萬token的上下文窗口,具備更強(qiáng)的長文本處理能力與信息關(guān)聯(lián)準(zhǔn)確性,可高效應(yīng)對多步驟復(fù)雜任務(wù)。
中等規(guī)格的Nemotron 3 Super擁有約1000億參數(shù),每個token最多激活100億參數(shù),憑借高準(zhǔn)確性優(yōu)勢,適用于各類多智能體應(yīng)用場景;高端型號Nemotron 3 Ultra則配備約5000億參數(shù),每token最多激活500億參數(shù),作為大型推理引擎,專為復(fù)雜AI應(yīng)用打造。
目前,該系列模型已獲得行業(yè)廣泛認(rèn)可,安永、思科、甲骨文云基礎(chǔ)設(shè)施、Palantir、Perplexity、ServiceNow、西門子、新思科技、Zoom、埃森哲、楷登電子、Cursor等眾多知名企業(yè)已成為早期采用者,正將Nemotron家族模型集成到AI工作流中,推動制造業(yè)、網(wǎng)絡(luò)安全、軟件開發(fā)、媒體、通信等多個領(lǐng)域的技術(shù)創(chuàng)新與產(chǎn)業(yè)升級。
對于初創(chuàng)企業(yè)而言,開放的Nemotron 3模型將有效降低AI智能體開發(fā)門檻,助力企業(yè)更快完成產(chǎn)品構(gòu)建與迭代,加速從原型研發(fā)到企業(yè)級部署的全流程創(chuàng)新。據(jù)悉,Nemotron 3 Nano已于今日在Hugging Face平臺正式上線,Nemotron 3 Super和Ultra預(yù)計將于2026年上半年推出。(純鈞)
廣告
X 關(guān)閉
廣告
X 關(guān)閉