在AI大模型興起以前,車企談智能駕駛,一般都將重點(diǎn)放在算法或者芯片算力上。但是隨著AI大模型的迅速鋪開,自動(dòng)駕駛的技術(shù)路徑開始飛速,從CNN、RNN、GAN到Transformer大模型轉(zhuǎn)變,曾經(jīng)主流的輕高精地圖城區(qū)智駕,逐漸被“端對端”所取代。
從搶先吃螃蟹的特斯拉,到跟隨而至的問界、理想、小鵬,端對端智駕正在像雨后春筍一般,迅速在智能車江湖迅速展開。
端對端成智駕新風(fēng)口
據(jù)公開信息透露,小米端到端全場景智能駕駛,于不久前開啟定向內(nèi)測;零跑B系列和C系列將于2025年實(shí)現(xiàn)自研端到端大模型智駕系統(tǒng)上車;蔚來計(jì)劃明年1月推送用于智能駕駛的端到端大模型架構(gòu)。在此之前,理想、問界、小鵬、比亞迪等諸多車企,都紛紛公布了自家的端對端解決方案。不難看出,在當(dāng)下這個(gè)時(shí)點(diǎn),端對端智駕解決方案,早已經(jīng)成為了車企必選的智駕路徑。
首先,從技術(shù)上來看,端對端技術(shù)迭代較快、路徑短、信息損耗小,對加速L4級智能駕駛到來非常有幫助。“端到端”模型將感知、規(guī)劃與控制三大模塊整合在一起,消除了模塊間的界限,簡化了系統(tǒng)架構(gòu),提高了運(yùn)行效率。整合后的模型能夠更快地處理數(shù)據(jù),提高系統(tǒng)的響應(yīng)速度,加速智駕的去高精地圖化。
基于這一點(diǎn),特斯拉首先將端對端技術(shù)應(yīng)用在了FSD V12上,并取得了顯著的成績,讓行業(yè)內(nèi)外的從業(yè)者和用戶,前所未有地感受到了這種技術(shù)的魅力。比如,小鵬汽車董事長何小鵬認(rèn)為,端到端大模型將讓自動(dòng)輔助駕駛過渡,到完全自動(dòng)駕駛的時(shí)間大幅縮短,2025年小鵬汽車就能在中國實(shí)現(xiàn)類L4智駕體驗(yàn)。輕舟智航CEO于騫認(rèn)為,端到端技術(shù)逐漸把非機(jī)器學(xué)習(xí)的部分?jǐn)D得越來越小,整個(gè)系統(tǒng)完全通過數(shù)據(jù)驅(qū)動(dòng)來實(shí)現(xiàn)智能駕駛能力……
雖然從當(dāng)前來看,端對端或許并非最優(yōu)解,但它能夠處理傳統(tǒng)路徑難以解決的極端案例,并且代表了一種減少人工編碼依賴更高效的思路?;蛟S正是基于此,行業(yè)內(nèi)外前所未有地在端對端技術(shù)方案上,達(dá)成了空前一致。
其次,從成本上來考慮,端對端技術(shù)在成本上比感知模型更省錢。其實(shí),早前國內(nèi)只有30萬以上的車型才會(huì)匹配智駕模式,而在更低的價(jià)格段則幾乎沒有。說到底主要還是之前的技術(shù)不成熟,導(dǎo)致智駕的成本過高所致。但在行業(yè)去高精地圖和硬件之后,相關(guān)的智駕方案變得越來越親民。
比如,大疆表示7000元就能解決城市NOA,且電車油車都能用;行業(yè)第一批AI+雙目方案,4000元就能實(shí)現(xiàn)領(lǐng)航輔助功能。模塊化智駕上,元戎啟行已經(jīng)將整套智駕解決方案成本下探到2000美元,同樣是激光雷達(dá)+攝像頭,硬件成本已經(jīng)下探至7000美元。
相比以上方案,端對端方案的成本更省,依靠純視覺方案其去掉了所有激光雷達(dá),變成了純軟件驅(qū)動(dòng)的技術(shù),技術(shù)可以不斷迭代、成本可以無限下探,這正是特斯拉可以不斷降價(jià)的原因所在。在技術(shù)與成本疊加之下,端對端的技術(shù)方案,自然就成了國內(nèi)智駕路線的核心趨勢。
華為、小鵬們較量的新戰(zhàn)場
事實(shí)上,與前幾年消費(fèi)者普遍對國內(nèi)智駕方案存疑不同,隨著近兩年國內(nèi)智駕水平的上升,特別是端到端帶來的新的算法和模型的應(yīng)用,正在給消費(fèi)者帶來前所未有的全新體驗(yàn),這就使得市面上汽車是否標(biāo)配智駕,越來越成為消費(fèi)者選擇電動(dòng)車的重要標(biāo)志。在此背景下,端對端技術(shù)方案日益成為華為、小鵬等車企角逐的新焦點(diǎn)。
一方面,通過升級端對端智駕方案,可以從價(jià)格與用戶體驗(yàn)上吸引消費(fèi)者,從而幫助車企賣更多的車。根據(jù)乘聯(lián)會(huì)聯(lián)合科瑞咨詢發(fā)布的數(shù)據(jù),2024年1~8月,中國新能源乘用車L2級及以上的ADAS功能裝車率達(dá)到66.6%,同比大幅提升21.0個(gè)百分點(diǎn)。另據(jù)蓋世汽車研究院配置數(shù)據(jù),今年1~8月,國內(nèi)市場高速NOA累計(jì)配套量已超93萬套,對應(yīng)滲透率達(dá)7%,城市NOA也開始規(guī)?;宪嚕瑵B透率已達(dá)1.3%。
按照業(yè)內(nèi)人士估計(jì),明年將是自動(dòng)駕駛的決勝年,NOA等高級智能駕駛功能,將普及至10萬元左右的車型,預(yù)計(jì)明年NOA的市場滲透率將超過40%。不難預(yù)見,隨著更具成本優(yōu)勢的智駕方案落地,城市NOA下沉到10萬元級的車型越來越近,并逐漸呈現(xiàn)出一個(gè)普及化的趨勢。對于車企來說,誰的智駕方案好、體驗(yàn)佳、車型性價(jià)比高,誰就可以大量賣車,誰就能夠贏得市場。
從這個(gè)角度上來看,無論是小鵬MONA M03等新智駕車型的爆發(fā),還是蔚來、理想等車企新規(guī)劃的大眾車型,都在朝著這一方向去努力。于車企而言,在電動(dòng)化、性能、續(xù)航差不多的情況下,智駕已經(jīng)成為車企影響消費(fèi)者心智的關(guān)鍵變量。低成本的智駕方案,則能夠兼顧大眾需求與車企賣車的需求,極大增強(qiáng)車企的市占率,并且通過走量的“智能車”,幫助車企快速積累高質(zhì)量、有價(jià)值的專業(yè)數(shù)據(jù),為更高級的智駕方案打下堅(jiān)實(shí)的基礎(chǔ)。
另一方面,通過升級端對端技術(shù),加快整個(gè)車企智駕能力的升級,倒逼車企升級汽車的底層算力能力。從行業(yè)經(jīng)驗(yàn)來看,端對端技術(shù)的落地,不僅面臨技術(shù)路線和數(shù)據(jù)的考驗(yàn),還面臨龐大的算力需求考驗(yàn)。以端對端做的最成功的特斯拉為例,在2024Q1財(cái)報(bào)電話會(huì)上,特斯拉表示,公司已經(jīng)有35000張H100 GPU,并計(jì)劃在2024年內(nèi)增加到85000張H100以上,達(dá)到和谷歌、亞馬遜同一梯隊(duì)。
在這一規(guī)模預(yù)期之下,馬斯克近期表示特斯拉已經(jīng)不再算力緊張。國內(nèi),小鵬“ 扶搖 ”自動(dòng)駕駛智算中心,算力可達(dá)600PFLOPS(以英偉達(dá)A100 GPU的FP32算力推算,約等于3萬張A100 GPU),并宣布今年投入1億美元用于算力建設(shè),未來每年將進(jìn)一步加大投資。商湯大裝置已經(jīng)布局全國一體化的智算網(wǎng)絡(luò),擁有4.5萬塊GPU,總體算力規(guī)模達(dá)12000PFLOPS,2024年底將達(dá)到18000PFLOPS。而從目前國內(nèi)的情況來看,大多數(shù)研發(fā)端對端的自動(dòng)駕駛公司的訓(xùn)練算力,仍停留在千卡級別。
不難預(yù)見,隨著端對端智駕技術(shù)的逐步深入,數(shù)據(jù)、算力的競賽,將成為接下來所有車企競爭的重點(diǎn)。
新階段的現(xiàn)實(shí)考驗(yàn)
隨著端對端技術(shù)路線逐漸發(fā)展成主流趨勢,車企的競爭焦點(diǎn)也發(fā)生了轉(zhuǎn)變,已經(jīng)不再單純地比拼城區(qū)NOA功能的開城數(shù)量,而是更加注重為用戶提供優(yōu)質(zhì)的駕駛體驗(yàn)。在次背景下,從“車位到車位”日益成為車企競爭的新焦點(diǎn),與此同時(shí)數(shù)據(jù)激增、商業(yè)化挑戰(zhàn)、新技術(shù)風(fēng)險(xiǎn)等也正在成為新的挑戰(zhàn),考驗(yàn)著每一個(gè)車企。
首先,隨著圍繞用戶體驗(yàn)展開的VLA模型升級,汽車所用的算力在快速飆升,其對硬件算力和數(shù)據(jù)資源閉環(huán)的要求也越來越高。前文提到隨著技術(shù)的不斷發(fā)展,端對端2.0逐步進(jìn)入圍繞用戶體驗(yàn)而展開的新階段,在該階段此前備受矚目的“端到端+VLM(視覺語言模型)”,開始向“VLA模型”迭代。
作為一個(gè)融合視覺、語言和動(dòng)作的多模態(tài)模型,旨在提高模型的泛化能力和判斷推理能力,可以簡單看作是端到端+VLM系統(tǒng)的一個(gè)全面融合體。相比以前的VLM系統(tǒng),它背后對資源的消耗更大、對數(shù)據(jù)閉環(huán)的要求也更高。有觀點(diǎn)認(rèn)為,部署VLA模型對芯片算力的要求,提升到英偉達(dá)DRIVE Thor級別,算力達(dá)750 TOPS。相比之下,當(dāng)前高階智駕的算力硬件通常配備的是2顆英偉達(dá)OrinX芯片,總算力為508 TOPS,差的可不是一星半點(diǎn)。
除了算力挑戰(zhàn)之外,數(shù)據(jù)問題帶來的挑戰(zhàn)遠(yuǎn)超外界想象。小馬智行的CTO樓天城曾表示,想要訓(xùn)練出高性能的端到端模型,數(shù)據(jù)質(zhì)量的要求比一般性能模型高出幾個(gè)數(shù)量級。單論數(shù)據(jù)而言,目前國內(nèi)車企的數(shù)據(jù)儲(chǔ)備基本均落后于特斯拉,還處于初期階段。加之對數(shù)據(jù)質(zhì)量的要求,國內(nèi)車企離數(shù)據(jù)積累的“長跑終點(diǎn)”仍“遙遙無期”。
其次,隨著端對端技術(shù)的持續(xù)升級,在堆數(shù)據(jù)、堆算力等諸多高門檻操作之下,車企的試錯(cuò)成本在逐步升高,商業(yè)化也面臨市場檢驗(yàn)。前文提到,隨著端對端技術(shù)的升級,車企端對端對算力、數(shù)據(jù)的閉環(huán)考驗(yàn)越來越高,車企為此付出的代價(jià)也越來越大,車企入場需要考慮效率與成本的平衡問題。
另外,即便是完成了開發(fā)交付,端對端的驗(yàn)證落地也面臨諸多考驗(yàn)。車企直接實(shí)車驗(yàn)證顯然成本過于高昂,基于云端測試可能與實(shí)際情況并不匹配。在市場層面,消費(fèi)者也存在著一種矛盾心理:一方面,消費(fèi)者對于汽車“智能化”和自動(dòng)駕駛的興趣與期望在上升;另一方面,它們的支付意愿卻在普遍下降。所以,即便完成了端對端智駕的量產(chǎn),倘若市場不買單,一切愿望也將化為烏有。
從這個(gè)角度上來說,端對端智駕的進(jìn)階,不單單是技術(shù)、數(shù)據(jù)的比拼,更需要市場對其商業(yè)化的實(shí)際認(rèn)可。