6月11日,自動駕駛公司元戎啟行在2025年火山引擎Force原動力大會上宣布,其VLA模型將于今年第三季度推向消費者市場,并預計在年內(nèi)上車五款車型。

圖片來源:元戎啟行
VLA模型即視覺—語言—動作模型,是元戎啟行在端到端模型基礎上引入大語言模型后升級而成的多模態(tài)模型,可理解交通場景中復雜交互事件,識別異形障礙物,理解文字信息并且可以根據(jù)語音指令做出對應駕駛決策。
目前,元戎啟行已完成該模型的真實道路測試。其中,VLA模型支持激光雷達方案與純視覺方案,將率先搭載在NVIDIA Drive Thor芯片上,后續(xù)元戎啟行還將通過技術優(yōu)化,讓VLA模型可以適配更多芯片平臺。
此次VLA模型的發(fā)布,展示了其四大核心功能,即空間語義理解、異形障礙物識別、文字類引導牌理解和語音控車。

圖片來源:元戎啟行
具體來看,空間語義理解功能相當于駕駛“透視眼”,能夠全維度解構駕駛環(huán)境,精準破解橋洞通行、公交車遮擋視野等動靜態(tài)駕駛盲區(qū)場景駕駛風險;異形障礙物識別功能如同駕駛 “百事通”,可識別各種異形障礙物;文字類引導牌理解功能能準確理解并執(zhí)行文字指示;語音交互控車功能則如同駕駛 “應答靈”,可與用戶高效交流,根據(jù)語音指令做出對應駕駛決策,交互更擬人。
元戎啟行CEO周光強調(diào),VLA模型是實現(xiàn)物理世界agent的關鍵技術,可連接多種模態(tài),打通物理世界與數(shù)字世界壁壘,具有完善任務規(guī)劃和執(zhí)行能力,此次與火山引擎合作將推動雙方技術在多領域落地,促進生產(chǎn)力進階。
VLA模型的量產(chǎn)上車,將為消費者帶來更智能、便捷和安全的駕駛體驗,推動汽車產(chǎn)業(yè)向智能化進一步轉(zhuǎn)型,也有望重塑智能駕駛市場格局,助力元戎啟行在自動駕駛領域取得更大市場份額和競爭優(yōu)勢,為行業(yè)發(fā)展樹立新標桿,開啟智能駕駛新時代。

CONTACT US
ICC APP