雲棲大會感受AI汽車的樂與路
大模型時代的轉折點:汽車成為數位與實體AI的交匯樞紐
若將大模型的發展分為上下半場,上半場是以互聯網大數據預訓練為代表的數位AI;下半場則是以機器人、世界模型為核心的物理AI。而汽車產業,正處於這兩者之間的關鍵分水嶺,承上啟下,扮演著虛實融合的最佳載體。
在杭州雲棲小鎮舉行的雲棲大會上,不論是會場外的氣溫,還是會場內的人潮熱度,都達到前所未有的高峰。與會者普遍感受到,今年對AI的關注已從概念討論轉向實際應用,問題更加具體、務實。
本次大會中,汽車成為觀察AI未來脈絡的重要切入點。正如汽車峰會開場詞所言:1886年卡爾·賓士發明第一輛汽車,人類突破了肌肉的極限;139年後的今天,我們正在突破認知(智能)的邊界。汽車已成為移動的運算平台,駕駛演變為人機協作的藝術,速度由數據流轉效率重新定義。數位智能擁抱實體產業,汽車恰好站在這個交會點上。
一、當汽車學會「看」與「想」:VLA驅動智能駕駛變革
智能駕駛無疑是汽車智能化下半場最激昂的主旋律。無論通往L4或L5之路多艱難,這已非選修課,而是決定車企生死的必修課——此為雲棲大會期間眾多業界人士的共識。
談到智能駕駛,便無法避開VLA(Vision-Language-Action)架構。元戎啟行創始人兼CEO周光指出:「自動駕駛分級標準制定於30年前,當時基於高精地圖與SLAM技術定義L4,但如今AI已進入新階段。」
VLA是一種新一代AI架構,不僅能「看懂」影像、「讀懂」語言,更能直接驅動決策與動作,被視為大模型從「會說」走向「會做」的關鍵轉折。
理想汽車自駕研發高級副總郎咸朋分享了一個真實案例:用戶拍攝車輛在施工路段連續繞過十個井蓋的影片,並驚訝於系統未針對此場景進行預設訓練卻仍能成功應對。「這就是能力湧現,我們打造的是能力,而非功能。」他強調。
這種「能力 vs 功能」的差異,如同音樂家與音樂盒之別:前者理解本質、可即興創作;後者僅能播放固定曲目。當自駕從「功能定義」進化至「能力湧現」,汽車也從機器邁向某種新形態的存在。
廣汽集團自駕首席科學家周寅進一步解釋,VLA利用視覺語言模型(VLM)的預訓練,吸收海量網路知識,具備常識判斷能力,再透過自駕數據喚醒激活,實現零樣本遷移(zero-shot transfer),有效處理長尾案例,如道路施工避讓、複雜標誌識別、潮汐車道調整,甚至辨識未經訓練的紙箱或小動物。
郎咸朋補充說明,VLA中的「L」(Language)並非僅指對話能力,而是人類長時序思考與邏輯推理的體現。「不會說話的人也有思維能力,他們透過閱讀文字獲得知識,這正是長時間思維的濃縮過程。」
正如維特根斯坦所言:「語言的界限就是世界的界限。」賦予機器語言能力,等於拓展其理解世界的疆域。
二、巨量算力需求下的基礎設施革命
然而,這種認知能力的取得代價高昂。周光直言:「過去人力成本占97%,算力僅3%;但在大模型時代,兩者比例可能趨近各半。」
這不僅反映在財報數字上,更意味著產業底層邏輯的翻轉:過去車企的核心資產是工程師與設計師,未來則可能是GPU集群、訓練數據與模型參數。
郎咸朋透露,理想在雲端需同時進行兩項任務:一是生成仿真環境(世界模型),需大量推理算力;二是模型訓練本身。目前理想使用世界模型生成的數據已佔VLA訓練總量的10%以上,且比例持續快速上升。
阿里雲研究中心主任安筱鵬指出:「參與智能駕駛競爭的基本條件,就是規模化的AI投入。美國已達5萬至10萬張GPU卡級別。」據了解,約10億人民幣的AI算力投入,才堪稱入場門檻。
儘管算力需求增長對雲服務商有利,阿里雲的目標是確保每一秒算力都被高效運用。因大規模智算集群中,利用率幾乎等同於投資回報率。過去車企常因排程不均、任務錯配或故障延遲導致資源閒置。
以小鵬汽車為例,其依托阿里雲靈駿智算打造國內首個萬卡級AI算力集群,AI算力儲備達10EFLOPS,集群利用率最高可達98%,並具備秒級故障發現與處置能力,建立高可用容災體系。在此基礎上,小鵬「雲端模型工廠」迭代週期平均縮短至5天,大模型訓練效率大幅提升。
將利用率提升至98%,意味相同硬體可產生接近無優化情況下兩倍的訓練成果。
阿里雲計算平台負責人汪軍華介紹多項創新技術:
- 統一元數據管理(DLF):面對數百PB級數據,透過DLF整合元數據與存儲,原始數據、訓練樣本與特徵數據只需保存一份,大幅降低儲存成本。
- MaxFrame分散式計算框架:可直接調用第三方模型,支援萬級併發處理多模態數據,性能較開源框架提升逾40%。實際案例顯示,每日處理資料包從7,000提升至20萬,資源消耗下降40%,綜合效能提高50倍以上。
- PAI Turbo X加速包:專為智能輔助駕駛設計,於BEVFusion訓練中縮短58%時間,MapTR縮短53%,UniAD縮短50%。
這些技術看似枯燥,卻如同百年前鋪設鐵軌——唯有基礎穩固,才能支撐上層繁榮。
阿里雲AI汽車行業總經理李強透露關鍵數據:「從2024到2025年,超過60%中國智能輔助駕駛的AI算力來自阿里雲。」換言之,中國自駕「登月計畫」逾半階梯由阿里雲搭建。
郎咸朋強調:「若能打通VLA加強化學習閉環,進展將極快,猶如『天上一天,地下一年』。所有強化都在虛擬世界與仿真環境中完成。」
三、從「座艙」到「陪伴」:人機關係的新定義
若智能駕駛解決「如何抵達目的地」,智能座艙則聚焦「如何度過旅程」。
長城汽車技術中心副總姜海鵬提出「座艙四段論」:相識、相知、相愛、相伴。他解釋:「相識是AI認識你是誰;相知是學習你的習慣;相愛是有溫度的情感連結;相伴是長期互動。當然,也可能『相殺』。」
他坦言:「人是善變的,當你的變化速度超過智能體的學習速度,結果便是分離。」這揭示了人機關係的本質——非主僕,而是兩個生命體的共處,需要相互理解與共同成長。
理想汽車空間AI團隊負責人江會星博士分享實踐心得:
- 沒有捷徑:理想於2023年3月啟動自研大模型項目,歷經預訓練、後訓練、強化學習全流程,同年12月全面上線用戶,九個月內走完所有坑洞,展現戰略決心。
- 細節打磨:理想每週召開AI周會,分享前沿洞察與實踐經驗。座艙體驗背後是「慢工出細活」的累積。例如乘客說「有點冷」,系統不會機械降溫,而是結合語音、溫度、座椅占用、紅外檢測等多模態感知,透過自研大模型解析意圖,可能觸發風量調整、局部升溫或座椅加熱,做出精準組合回應。
江博士表示:「每週都有數據閉環會議,分析用戶反饋,迅速迭代下一版本。」這種模式非單純技術優化,更像互聯網產品思維,仰賴大量工程投入。
阿里雲霍健指出,智能座艙趨勢之一是「端雲協同架構」。以溫控為例:車端MindGPT負責環境感知與初步推理;雲端則召回用戶歷史偏好,結合外部氣候資訊,提供深度建議,實現「快速響應 + 深度智能」的平衡。
為支援此體驗,阿里雲推出專為汽車定制的通義Omni模型,採「三進兩出」架構:語音、視覺、文本輸入,語音與文本輸出,延遲低至0.5秒,預計11月支援逾20種語言交互。
姜海鵬也坦承現實挑戰:「企業內部,智能駕駛的重要性仍高於座艙。」但隨著兩者皆從規則驅動轉向數據驅動,從CNN到端到端再到VLA,未來AI算力將整合,從算力共享走向模型共享。
蔚來汽車副總吳傑補充:「過去駕駛(司機)與座艙(助手)各自為政,甚至爭搶算力;如今VLA使底層技術趨同,開啟真正融合可能。」
四、出海的「異鄉人」:中國車企全球佈局的雲支撐
技術之外,市場拓展同樣關鍵。出海已成中國車企共識。
李強透露驚人數據:「95%的中國車企出海時選擇阿里雲。」
阿里雲黃華傑分享一個「反常識」觀點:「許多客戶認為海外雲更合規,事實並非如此。」阿里雲擁有130項國際安全合規資質,早在2018年即通過GDPR認證。
更重要的是服務經驗積累。阿里巴巴電商、菜鳥物流、螞蟻支付及眾多消費電子企業早於汽車產業出海,在此過程中沉澱的合規、IT、法務與採購經驗,可完整複製至車企。
黃華傑舉例:曾耗時三個月為某車企梳理16個子系統與4個大數據平台的技術架構與關聯性。「這種貼身服務,不只是技術問題,更是文化理解與服務意願的體現。」
面對高成本疑問,他回應:「我們雖為客戶定制優化,但會提煉通用方案反哺產品演進。」阿里雲的多模態資料庫Lindorm、雲原生中介軟體、日誌服務SLS等產品,皆在與客戶場景共創中不斷迭代。
五、One more thing:AI Rocks,APSARA Rocks
電影《北京樂與路》中有句台詞:「我想到光的深處,那裡有風麼?」這是對未知的追問,也是對夢想的嚮往。
今日汽車產業亦在尋找自己的「光的深處」:
- 理想追問:車能否成為「家」的延伸?
- 廣汽追問:機器能否真正理解世界?
- 一汽追問:企業能否成為有機生命體?
- 比亞迪追問:中國智造能否定義全球標準?
這些問題沒有標準答案,但追問本身就是意義。
李強在峰會中提出三大觀察:
- AI基礎設施非一夜建成:它源自過去通用算力時代的技術沉澱,在AI時代以十倍甚至百倍能量爆發。IT部門從被重視,轉為被高層高度關注。
- 車企走向自研與合作並行:既要做技術兜底,也要探索差異化價值,展現中國車企的成熟與務實。
- 全球車企與大模型公司深度共創是必然路徑:唯有開放協作,才能推動生態進化。
他感性地說:「我的夥伴們很辛苦,但也很幸福,因為『被需要』。」
阿里雲不造車,卻支撐60%中國智能輔助駕駛的AI算力;不開發座艙,卻讓通義大模型賦予座艙靈魂;不是貿易公司,卻協助95%中國車企順利出海。
IDC数据显示,2025年上半年阿里云汽车行业公共云基础设施增长达132%。数字背后的意义更值得重視:中国汽车产业智能化进程正在加速,越来越多企业选择信任与合作。
李強說:「如果我們的車賣到全球,我們的模型也會陪伴它走向世界各地。」這份「陪伴」,是一種承諾。
汽車——第二次工業革命的象徵,在第四次工業革命中重生。從福特流水線上的標準化產品,蛻變為會思考、會感知、會陪伴的智能體。
在這歷史進程中,阿里雲找到了自己的角色:成為變革的基礎設施——不張揚,卻不可或缺。
正如李強所言:雲像電網,計算像電力。阿里雲要做的,就是這個時代的電網——讓每一份算力都能被需要它的人使用,讓每一個創新都有堅實的基礎。
阿里雲全棧AI雲,正支撐著中國車企智能化落地與全球化佈局。
這或許就是「光的深處」的答案——不是單一技術突破或商業成功,而是整個產業生態的共同進化。
APSARA Rocks。
AI Rocks too。(作者:高飛)