2026-01-06 07:09:28
英偉達(dá)宣布開源首個推理VLA模型Alpamayo 1,加速安全自動駕駛技術(shù)開發(fā)。該模型通過類人思維處理復(fù)雜駕駛場景,解決長尾問題。1月5日,CEO黃仁勛在CES發(fā)布Alpamayo平臺,首款搭載英偉達(dá)技術(shù)的汽車將于第一季度在美國上路。此外,英偉達(dá)還發(fā)布配套工具和數(shù)據(jù)集,構(gòu)建完整開發(fā)生態(tài)系統(tǒng),并宣布新款Rubin數(shù)據(jù)中心產(chǎn)品等消息。
每經(jīng)編輯|畢陸名
英偉達(dá)(NVDA,股價(jià):188.120美元;總市值:4.57萬億美元)在無人駕駛領(lǐng)域邁出關(guān)鍵一步,宣布開源其首個推理VLA(視覺-語言-動作)模型Alpamayo 1,這一舉措旨在加速安全的自動駕駛技術(shù)開發(fā)。該模型通過類人思維方式處理復(fù)雜駕駛場景,為解決自動駕駛長尾問題提供新路徑。
當(dāng)?shù)貢r(shí)間1月5日,美東時(shí)間1月5日周一,英偉達(dá)CEO黃仁勛在拉斯維加斯舉行的CES展會上發(fā)布了Alpamayo平臺,使汽車能夠在真實(shí)世界中進(jìn)行"推理"。黃仁勛表示,首款搭載英偉達(dá)技術(shù)的汽車將于第一季度在美國上路。
圖片來源:視頻截圖
英偉達(dá)免費(fèi)開放Alpamayo模型,允許潛在用戶自行對模型進(jìn)行重新訓(xùn)練。該模型旨在打造能在意外情況下"思考"解決方案的車輛,例如交通信號燈故障等場景。車載計(jì)算機(jī)將分析來自攝像頭和其他傳感器的輸入,將其分解為步驟并提出解決方案。
英偉達(dá)此次發(fā)布的Alpamayo家族整合了三大基礎(chǔ)支柱:開源模型、仿真框架和數(shù)據(jù)集,構(gòu)建了一個完整的開放生態(tài)系統(tǒng)供任何汽車開發(fā)者或研究團(tuán)隊(duì)使用。
Alpamayo 1是業(yè)界首個為自動駕駛研究社區(qū)設(shè)計(jì)的思維鏈推理VLA模型,現(xiàn)已在Hugging Face平臺發(fā)布。該模型采用100億參數(shù)架構(gòu),使用視頻輸入生成軌跡及推理軌跡,展示每個決策背后的邏輯。開發(fā)者可以將Alpamayo 1改編為更小的運(yùn)行時(shí)模型用于車輛開發(fā),或?qū)⑵渥鳛樽詣玉{駛開發(fā)工具的基礎(chǔ),例如基于推理的評估器和自動標(biāo)注系統(tǒng)。
黃仁勛表示:“物理AI的ChatGPT時(shí)刻已到來——機(jī)器開始理解、推理并在真實(shí)世界中行動。無人出租車是首批受益者。Alpamayo為自動駕駛汽車帶來推理能力,使其能夠思考罕見場景,在復(fù)雜環(huán)境中安全駕駛,并解釋其駕駛決策——這是安全、可擴(kuò)展自動駕駛的基礎(chǔ)?!?/strong>
英偉達(dá)強(qiáng)調(diào),Alpamayo模型并非直接在車內(nèi)運(yùn)行,而是作為大規(guī)模教師模型,供開發(fā)者微調(diào)并提取到其完整自動駕駛技術(shù)棧的骨干中。未來該家族的模型將具有更大的參數(shù)規(guī)模、更詳細(xì)的推理能力、更多的輸入輸出靈活性以及商業(yè)使用選項(xiàng)。
推理VLA是一種統(tǒng)一的AI模型,將視覺感知、語言理解和動作生成與逐步推理集成在一起。
這類模型整合了明確的AI推理功能,在傳統(tǒng)視覺-語言-動作模型的基礎(chǔ)上構(gòu)建。AI推理是AI逐步解決復(fù)雜問題并生成類似于人類思維過程推理痕跡的能力。這些系統(tǒng)對一系列互聯(lián)網(wǎng)規(guī)模的任務(wù)進(jìn)行預(yù)訓(xùn)練,包括語言生成和視覺連接,以發(fā)展通用知識和感知基礎(chǔ)。
與將視覺輸入直接映射到動作的標(biāo)準(zhǔn)VLA模型不同,推理VLA模型將復(fù)雜的任務(wù)分解成可管理的子問題,并以可解釋的形式闡明其推理過程。這使模型能夠更準(zhǔn)確地解決問題或執(zhí)行任務(wù),還能對模型正在進(jìn)行的操作提供一定程度的反思。
構(gòu)建推理VLA模型需要三種基本AI功能:視覺感知、語言理解以及動作和決策制定。視覺感知處理來自攝像頭、毫米波雷達(dá)或激光雷達(dá)等感知傳感器的實(shí)時(shí)數(shù)據(jù);語言理解通過自然語言處理解釋命令、上下文提示和對話輸入;動作和決策制定則使用融合的感官和語言信息來計(jì)劃、選擇和安全地執(zhí)行任務(wù),同時(shí)生成可解釋的推理痕跡。
在自動駕駛場景中,推理VLA可以對交通狀況進(jìn)行逐步推理。例如,接近一個十字路口時(shí),系統(tǒng)可能會進(jìn)行如此推理:“我看到一個停止標(biāo)志,左邊有車輛駛來,還有行人正在過馬路。我應(yīng)該減速,完全停下來,等待行人通過人行橫道,安全時(shí)再繼續(xù)前進(jìn)。”
除Alpamayo 1模型外,英偉達(dá)還發(fā)布了配套的仿真工具和數(shù)據(jù)集,構(gòu)建完整的開發(fā)生態(tài)系統(tǒng)。
此外,英偉達(dá)CEO黃仁勛表示,AI的復(fù)雜性推高需求。新款Vera Rubin設(shè)計(jì)已經(jīng)全面量產(chǎn)。宣布面向Vera Rubin電腦的六款新芯片。新款VeraCPU擁有88 Arm定制核。公司現(xiàn)在是最大的網(wǎng)絡(luò)公司。
英偉達(dá)計(jì)劃2027年測試一款無人駕駛出租車服務(wù)。
黃仁勛表示,英偉達(dá)公司備受期待的新款Rubin數(shù)據(jù)中心產(chǎn)品將于今年發(fā)布,客戶很快就能試用該技術(shù),這將有助于加速人工智能的發(fā)展。相比前代Blackwell架構(gòu),Rubin加速器在AI訓(xùn)練性能上提升3.5倍,運(yùn)行(推理)性能提升5倍,并配備擁有88個核心的新款中央處理器(CPU)。英偉達(dá)表示,基于Rubin的系統(tǒng)運(yùn)行成本將低于Blackwell版本,因?yàn)樗鼈兛梢杂酶俚慕M件實(shí)現(xiàn)相同的效果。微軟公司和其他大型云服務(wù)商將成為首批部署這一新硬件的客戶。
英偉達(dá)宣布,作為全棧NVIDIA BlueField平臺的一部分,NVIDIA BlueField?-4數(shù)據(jù)處理器將為推理上下文記憶存儲平臺提供動力。賦能推理上下文記憶存儲平臺(Inference Context Memory Storage Platform)。這是一種專為千億級參數(shù)規(guī)模(Gigascale)推理設(shè)計(jì)的新型AI原生存儲基礎(chǔ)設(shè)施,旨在加速并擴(kuò)展代理式AI(Agentic AI)。
每日經(jīng)濟(jì)新聞綜合公開信息
封面圖片來源:視頻截圖
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP