每日經(jīng)濟(jì)新聞 2025-05-16 11:58:15
2025年,智能座艙正朝“家庭成員”方向進(jìn)化,具備記憶與共情能力。商湯絕影CEO王曉剛認(rèn)為,激光雷達(dá)只是階段性選擇,未來(lái)將被替代。商湯絕影通過(guò)“世界模型+強(qiáng)化學(xué)習(xí)”技術(shù)組合,降低硬件依賴(lài),確保系統(tǒng)安全。在與車(chē)企合作上,王曉剛提出“太極式共生”模式,強(qiáng)調(diào)數(shù)據(jù)與研發(fā)體系的深度耦合。展望未來(lái),商湯絕影希望在汽車(chē)行業(yè)深耕,推動(dòng)商湯AI平臺(tái)化發(fā)展。
每經(jīng)記者|劉曦 每經(jīng)實(shí)習(xí)編輯|余婷婷
隨著3A游戲大作開(kāi)始“上車(chē)”,寶馬等一眾外資品牌在2025上海車(chē)展憑借“巨幕影院”和3D投影技術(shù)重新定義座艙體驗(yàn),智能汽車(chē)競(jìng)爭(zhēng)的焦點(diǎn)已從硬件參數(shù)轉(zhuǎn)向認(rèn)知能力,行業(yè)正處于“軟件定義汽車(chē)”向“認(rèn)知重塑出行”躍遷的臨界點(diǎn)。
“未來(lái)的智能座艙不是冰冷的機(jī)器,而是能‘察言觀色’的家庭成員。”商湯絕影CEO、商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛在接受《每日經(jīng)濟(jì)新聞》記者(以下簡(jiǎn)稱(chēng)NBD)獨(dú)家采訪時(shí),借此形容當(dāng)前智能座艙的發(fā)展方向。在他看來(lái),智能座艙的進(jìn)化分為三個(gè)階段:早期的“問(wèn)答工具”、大模型賦能的“全能助手”,以及具備記憶與共情能力的“家庭成員”。
工信部數(shù)據(jù)顯示,2025年第一季度中國(guó)L2級(jí)輔助駕駛新車(chē)滲透率已達(dá)65%,但智能駕駛供應(yīng)商正面臨嚴(yán)峻挑戰(zhàn):價(jià)格戰(zhàn)愈演愈烈,車(chē)企自研趨勢(shì)日益明顯,同時(shí)智能駕駛事故頻發(fā)引發(fā)公眾對(duì)激光雷達(dá)等傳感器的廣泛討論。在這一背景下,商湯絕影如何在沒(méi)有激光雷達(dá)的情況下保障安全性?規(guī)?;宪?chē)如何實(shí)現(xiàn)盈利?
對(duì)此,王曉剛認(rèn)為,車(chē)輛搭載激光雷達(dá)只是階段性的技術(shù)選擇,隨著模型算法的演進(jìn)、數(shù)據(jù)迭代和整體安全性的提高,激光雷達(dá)是可以被替代的。商湯絕影選擇通過(guò)“世界模型+強(qiáng)化學(xué)習(xí)”的技術(shù)組合,突破現(xiàn)實(shí)數(shù)據(jù)不足的瓶頸,在降低硬件依賴(lài)的同時(shí)確保系統(tǒng)安全。
談及與主機(jī)廠的關(guān)系時(shí),王曉剛用“太極”比喻新時(shí)代的合作模式。在車(chē)企紛紛加強(qiáng)自研的背景下,商湯絕影定位為AI(人工智能)基礎(chǔ)設(shè)施與云端服務(wù)提供商,與車(chē)企在數(shù)據(jù)和研發(fā)體系上深度耦合。王曉剛認(rèn)為,這種模式既保留車(chē)企的核心自研能力,也能發(fā)揮科技公司的技術(shù)優(yōu)勢(shì)。
NBD:商湯絕影現(xiàn)在打出口號(hào)叫“專(zhuān)注于汽車(chē)行業(yè)的AI公司”。為什么這么說(shuō)?目前在做的主要重點(diǎn)是什么?
王曉剛:商湯是1+X的戰(zhàn)略,1就是大模型,X就是各個(gè)行業(yè)的板塊,絕影是其中的X之一,聚焦汽車(chē)行業(yè)。今天我們說(shuō)商湯絕影是“最專(zhuān)注在汽車(chē)行業(yè)的AI公司”,其實(shí)離不開(kāi)商湯這個(gè)平臺(tái)型的公司。它在不同的階段其實(shí)是有不同的行業(yè)作為驅(qū)動(dòng)力,今天這個(gè)時(shí)間點(diǎn)的話,智能汽車(chē)是人工智能發(fā)展最強(qiáng)勁的驅(qū)動(dòng)力。
輔助駕駛從過(guò)去十幾年發(fā)展到今天,已經(jīng)到了大規(guī)模進(jìn)行落地推廣的階段。另外,尤其是多模態(tài)大模型和世界模型,在汽車(chē)領(lǐng)域的作用和能力實(shí)際上是體現(xiàn)得最充分的。因?yàn)樵谄?chē)這個(gè)空間,有聲音、有圖像,還有激光雷達(dá)、車(chē)機(jī)的各種信號(hào),各種傳感器是非常豐富的。相比其他行業(yè),比如手機(jī)、互聯(lián)網(wǎng)輸入比較單一,而汽車(chē)是一個(gè)非常好的應(yīng)用場(chǎng)景,去體現(xiàn)多模態(tài)大模型人機(jī)交互的能力。
而且,今天很多智能汽車(chē)?yán)锩嬗玫降倪@些技術(shù)和未來(lái)智能機(jī)器人,也是大家一致看好的方向。這些技術(shù)是高度重合的,但是你看機(jī)器人數(shù)量(目前)是非常少的,(而)汽車(chē)進(jìn)行大規(guī)模量產(chǎn),(有)大量的數(shù)據(jù)回流。所以,我們今天聚焦智能汽車(chē),實(shí)際上能夠產(chǎn)生巨大的用戶(hù)價(jià)值。另外,這些技術(shù)也是為將來(lái)人工智能向通用人工智能演進(jìn)打下了非常好的基礎(chǔ)。
NBD:之前理想汽車(chē)CEO李想說(shuō)過(guò)一句話,他認(rèn)為汽車(chē)是人工智能最好的載體。
王曉剛:對(duì),至少是目前這個(gè)階段。時(shí)代還在發(fā)展,當(dāng)今這個(gè)階段它就是一個(gè)最好的載體。
NBD:商湯絕影提出智能座艙需要“叛逆”進(jìn)化,這是否意味著它必須具備更強(qiáng)的主動(dòng)交互能力?
王曉剛:我們其實(shí)對(duì)智能座艙有一個(gè)思考,它的發(fā)展有幾個(gè)階段:第一個(gè)階段是工具,就是早期你提問(wèn)題它回答,完成一個(gè)特定的任務(wù)。進(jìn)入大模型的第二階段后,智能座艙躍升至“助手階段”,不僅能理解復(fù)雜指令,還能跨場(chǎng)景協(xié)同完成任務(wù)。第三個(gè)階段就是家庭成員,它不僅能幫你做事,還有情感上的連接,就像家里的寵物。假如有一天寵物離開(kāi)了,情感上大家是非常難以割舍的。
過(guò)去幾個(gè)月,我們的智能座艙開(kāi)發(fā)了一系列新功能。我們的產(chǎn)品經(jīng)理經(jīng)常與它互動(dòng),慢慢就產(chǎn)生共情。這一階段的智能座艙,不僅加強(qiáng)了人跟車(chē)之間的粘性和依賴(lài),實(shí)際上也是對(duì)于人機(jī)交互的一個(gè)革命性改變。
NBD:感覺(jué)這是一個(gè)大概念,可以擴(kuò)展到不只是汽車(chē),甚至汽車(chē)以外都是可以的。
王曉剛:確實(shí),情感化交互的邏輯具備普適性,但不同載體的實(shí)現(xiàn)條件差異顯著。以手機(jī)為例,它本質(zhì)上是被動(dòng)響應(yīng)的設(shè)備,用戶(hù)需要主動(dòng)喚醒、輸入指令后設(shè)備才會(huì)提供服務(wù),既無(wú)法持續(xù)感知用戶(hù)狀態(tài),也難以建立深度陪伴感。相比之下,汽車(chē)是更理想的情感載體。
當(dāng)用戶(hù)進(jìn)入車(chē)內(nèi),座艙系統(tǒng)天然處于全時(shí)待命狀態(tài),攝像頭、麥克風(fēng)、座椅傳感器等設(shè)備持續(xù)運(yùn)行,能夠?qū)崟r(shí)捕捉乘客的表情、動(dòng)作、聲音甚至生理信號(hào)(如疲勞度),從而構(gòu)建動(dòng)態(tài)的情感反饋循環(huán)。這種“無(wú)感卻無(wú)處不在”的交互模式是手機(jī)等難以實(shí)現(xiàn)的。
NBD:您曾提到“端到端是必贏之戰(zhàn),沒(méi)有B計(jì)劃”。與華為、特斯拉等的端到端方案相比,商湯絕影在模型或訓(xùn)練方式上有哪些獨(dú)特壁壘?
王曉剛:端到端的技術(shù)路徑差異取決于數(shù)據(jù)規(guī)模與實(shí)現(xiàn)方式,一種是兩段式端到端,就是把感知與規(guī)控拆分為兩個(gè)獨(dú)立模塊,規(guī)控部分采用小模型替代傳統(tǒng)規(guī)則。這種模式適用于數(shù)據(jù)量有限的場(chǎng)景,但能力上限受數(shù)據(jù)規(guī)模制約。另一種就是以特斯拉為代表的一段式端到端,全系統(tǒng)整合為單一模型,依賴(lài)超大規(guī)模真實(shí)數(shù)據(jù)訓(xùn)練。特斯拉憑借700萬(wàn)輛車(chē)的海量數(shù)據(jù)回流,目前是唯一能規(guī)?;瘧?yīng)用此模式的企業(yè)。國(guó)內(nèi)其他車(chē)廠都干不了,我們也干不了。
在這種情況下,商湯絕影的選擇是“世界模型+仿真強(qiáng)化學(xué)習(xí)”。我們通過(guò)構(gòu)建高精度虛擬環(huán)境,在仿真中生成海量駕駛場(chǎng)景(如極端路況、復(fù)雜交互),使自動(dòng)駕駛系統(tǒng)在模擬世界中反復(fù)試錯(cuò)、自我進(jìn)化。這與AlphaGo(一款圍棋人工智能程序)的演進(jìn)邏輯相似,早期AlphaGo依賴(lài)人類(lèi)棋譜訓(xùn)練,而AlphaZero(一種通用強(qiáng)化學(xué)習(xí)算法)通過(guò)自我博弈生成新策略,最終超越人類(lèi)水平。
不過(guò),圍棋的棋盤(pán)規(guī)則固定,狀態(tài)變化可精準(zhǔn)預(yù)測(cè);現(xiàn)實(shí)駕駛中,車(chē)輛下一時(shí)刻的狀態(tài)受無(wú)數(shù)變量影響,自動(dòng)駕駛的難點(diǎn)在于物理世界狀態(tài)演進(jìn)的復(fù)雜性。
NBD:依靠地圖不行嗎?地圖方案在未來(lái)是否仍然可行,還是已經(jīng)逐漸失去作用?
王曉剛:以往,業(yè)界普遍采用高精度地圖,后來(lái)逐漸向輕量化地圖轉(zhuǎn)變,如今正逐步降低對(duì)地圖的依賴(lài)性?;氐街邱{層面,地圖方案存在局限性,因?yàn)橹悄茏摳兄h(huán)境主要依賴(lài)攝像頭。我們擁有11個(gè)攝像頭,能夠?qū)崟r(shí)捕捉車(chē)輛周?chē)囊曨l信息。但真正的挑戰(zhàn)在于預(yù)測(cè),基于當(dāng)前攝像頭捕獲的畫(huà)面狀態(tài),如何準(zhǔn)確預(yù)測(cè)下一時(shí)刻攝像頭中出現(xiàn)的場(chǎng)景?這就需要世界模型的能力。
目前,我們的世界模型可以模擬未來(lái)的場(chǎng)景變化。例如,當(dāng)車(chē)輛行駛至施工路段需要避讓時(shí),世界模型能夠模擬避讓過(guò)程中的各種可能性,包括模擬碰撞后的情形。
NBD:我們看到商湯絕影有方案是沒(méi)有激光雷達(dá)的,現(xiàn)在大家都在說(shuō)安全冗余,會(huì)不會(huì)擔(dān)心(沒(méi)有激光雷達(dá))這個(gè)事兒?模型如何在保證安全的前提下實(shí)現(xiàn)好用?
王曉剛:我覺(jué)得不加激光雷達(dá)屬于一個(gè)階段性的問(wèn)題,可能現(xiàn)階段大家對(duì)(智駕)安全有顧慮,所以搭載激光雷達(dá)?,F(xiàn)在,在高速路段場(chǎng)景下,即使不搭載激光雷達(dá)車(chē)輛也能夠正常行駛;但在城區(qū)復(fù)雜場(chǎng)景中,行駛難度會(huì)有所增加。不過(guò),加激光雷達(dá)也不能解決所有問(wèn)題,因?yàn)樗旧硪矔?huì)受各種條件和天氣干擾,激光雷達(dá)也會(huì)老化,信號(hào)也會(huì)出現(xiàn)各種各樣的問(wèn)題。
從我們的角度來(lái)看,將來(lái)隨著模型算法的演進(jìn)、數(shù)據(jù)迭代,整體安全性的提高,這個(gè)(激光雷達(dá))是可以被替代掉的。提高智駕安全性其實(shí)有很多方式,模擬仿真就是一種。
過(guò)去,在復(fù)雜場(chǎng)景下,若自動(dòng)駕駛出現(xiàn)失敗,由于場(chǎng)景不可重復(fù),只能采集類(lèi)似場(chǎng)景進(jìn)行訓(xùn)練,但這種方法不能保證解決問(wèn)題。而模擬仿真技術(shù)的出現(xiàn),使得記錄失敗場(chǎng)景并對(duì)其進(jìn)行重構(gòu)成為可能。在仿真環(huán)境中,(我們)可以反復(fù)測(cè)試直至成功,并生成類(lèi)似場(chǎng)景以確保模型的泛化性。這使得自動(dòng)駕駛的技術(shù)邊界更加明確,能夠清晰地知曉在何種場(chǎng)景下系統(tǒng)有效、何種場(chǎng)景下可能失效,從而提高安全性。
NBD:現(xiàn)在有的車(chē)企會(huì)配置兩套系統(tǒng),一套搭載激光雷達(dá),另一套采用端到端系統(tǒng),兩套系統(tǒng)互相兜底。您覺(jué)得這是一個(gè)好的方式嗎?或者說(shuō)這是一個(gè)過(guò)渡階段的解決方案嗎?
王曉剛:目前來(lái)說(shuō),這是一個(gè)合理的方式。主要是端到端系統(tǒng)存在不確定性,而規(guī)則具有確定性,當(dāng)遇到無(wú)法處理的情況時(shí),系統(tǒng)會(huì)讓車(chē)輛停下來(lái)。端到端系統(tǒng)基于類(lèi)人學(xué)習(xí),其應(yīng)對(duì)未見(jiàn)過(guò)場(chǎng)景的能力有限,因此需要其他方式兜底。不過(guò),隨著未來(lái)世界模型的出現(xiàn)和仿真技術(shù)的發(fā)展,當(dāng)能夠仿真出各種場(chǎng)景并明確技術(shù)邊界時(shí),行業(yè)將更具確定性。知道系統(tǒng)在何種場(chǎng)景下有效或失效,大家有確定性就知道邊界在哪兒,可能就會(huì)減少對(duì)這種雙系統(tǒng)配置的依賴(lài)。
NBD:產(chǎn)品現(xiàn)在的上車(chē)情況是怎樣的?大概有多少個(gè)品牌在用?
王曉剛:目前,我們的產(chǎn)品已經(jīng)上車(chē)7款車(chē)型。在智能駕駛方面,今年3月份剛剛實(shí)現(xiàn)了首批地平線J6M方案的量產(chǎn)。接下來(lái),今年我們還將推出價(jià)格更為親民的地平線J6E方案,并將在奇瑞品牌實(shí)現(xiàn)量產(chǎn)。此外,基于英偉達(dá)Thor平臺(tái)開(kāi)發(fā)的系統(tǒng),以及包括世界模型和強(qiáng)化學(xué)習(xí)等端到端技術(shù),會(huì)應(yīng)用到東風(fēng)的量產(chǎn)車(chē)型中。
NBD:如今主機(jī)廠和供應(yīng)商的關(guān)系似乎與過(guò)去有所不同,尤其是許多科技公司也成為了主機(jī)廠的供應(yīng)商。如何看待新時(shí)代下我們與汽車(chē)主機(jī)廠的合作模式?商湯絕影是供應(yīng)商還是與主機(jī)廠的合作關(guān)系已經(jīng)發(fā)生了變化?
王曉剛:這里可以用“鴛鴦鍋”和“太極”來(lái)形象地描述兩種不同的合作模式。“鴛鴦鍋”中紅湯和白湯的界限非常清晰,合作的焦點(diǎn)往往集中在邊界上。在這種模式下,主機(jī)廠如果發(fā)展自研能力,目的可能是為了替代供應(yīng)商。而“太極”則體現(xiàn)了中國(guó)人獨(dú)特的智慧,雙方相互呼應(yīng)、相互依存。
在人工智能領(lǐng)域,主機(jī)廠需要具備一定的自研能力,以便更好地理解和把握技術(shù),這不僅涉及自動(dòng)駕駛,還包括智能座艙以及利用人工智能改造生產(chǎn)線和供應(yīng)鏈等眾多方面。然而,人工智能技術(shù)發(fā)展迅速且投入巨大,如果主機(jī)廠在這一領(lǐng)域獨(dú)自投入巨資建設(shè)超算中心等基礎(chǔ)設(shè)施,不僅成本高昂,而且在汽車(chē)價(jià)格不斷下降的市場(chǎng)環(huán)境下很難實(shí)現(xiàn)高性?xún)r(jià)比。
我們與主機(jī)廠的合作是一種內(nèi)外結(jié)合、緊密共生的關(guān)系。主機(jī)廠的自研團(tuán)隊(duì)與我們的AI技術(shù)相互補(bǔ)充,缺一不可。主機(jī)廠需要保留一定的自研能力,而我們的AI技術(shù)則為其提供支持。沒(méi)有主機(jī)廠的數(shù)據(jù)支持,我們的AI技術(shù)難以發(fā)揮作用;而沒(méi)有我們的AI技術(shù),主機(jī)廠也難以在這一領(lǐng)域?qū)崿F(xiàn)高效發(fā)展。簡(jiǎn)單說(shuō),雙方就是一個(gè)非常緊密的共生關(guān)系。
NBD:過(guò)去主機(jī)廠多強(qiáng)調(diào)全棧自研,如今則更傾向于全??煽?,且這種可控存在多種模式,比如通過(guò)股權(quán)合作將供應(yīng)商與自身綁定。商湯絕影是否會(huì)與主機(jī)廠開(kāi)展此類(lèi)股權(quán)合作呢?
王曉剛:股權(quán)合作只是其中一種形式,雖然能在特定時(shí)間節(jié)點(diǎn)保障資源投入,但主機(jī)廠當(dāng)下亟待解決的核心問(wèn)題并非資源,而是雙方研發(fā)體系的對(duì)齊。這包括工具鏈、數(shù)據(jù)格式以及各種管線等方面的適配。若主機(jī)廠與供應(yīng)商的兩套體系無(wú)法對(duì)接,雙方的基礎(chǔ)設(shè)施與能力便難以實(shí)現(xiàn)協(xié)同。
在現(xiàn)實(shí)情況下,主機(jī)廠也不可能構(gòu)建多套研發(fā)體系,通常只會(huì)采用一套。因此,關(guān)鍵在于推動(dòng)研發(fā)體系與基礎(chǔ)設(shè)施的企業(yè)應(yīng)用,這并非單純的股權(quán)投入所能解決。即便主機(jī)廠對(duì)多家車(chē)企進(jìn)行投資,也不可能為其分別建立獨(dú)立的研發(fā)體系。
NBD:與車(chē)企合作肯定會(huì)涉及數(shù)據(jù),您以前也強(qiáng)調(diào)過(guò)誰(shuí)更接近數(shù)據(jù),誰(shuí)就占據(jù)主動(dòng)權(quán)。那么,如何平衡數(shù)據(jù)隱私和訓(xùn)練的效率?
王曉剛:我們今天跟車(chē)企合作,車(chē)廠依然是數(shù)據(jù)的擁有者。關(guān)于隱私保護(hù),所有車(chē)輛采集的數(shù)據(jù)都需要進(jìn)行脫敏處理,例如去除人臉和車(chē)牌信息。此外,國(guó)家對(duì)此也有明確的規(guī)范和要求,商湯絕影自身也具備數(shù)據(jù)脫敏技術(shù),能夠?yàn)檐?chē)企提供數(shù)據(jù)脫敏服務(wù)。
NBD:您之前提到智能駕駛距離盈利還有三年左右,隨著未來(lái)智能駕駛的大規(guī)模產(chǎn)業(yè)化,如何通過(guò)上車(chē)來(lái)降低成本并增強(qiáng)盈利能力呢?
王曉剛:首先它的量得起來(lái),目前市場(chǎng)上的量產(chǎn)爆發(fā)是一個(gè)積極的趨勢(shì)。另外,為了推動(dòng)行業(yè)發(fā)展,標(biāo)準(zhǔn)化和平臺(tái)化至關(guān)重要。我們今天看到這樣一個(gè)趨勢(shì),當(dāng)前攝像頭配置逐漸趨于一致,車(chē)企在采集攝像頭數(shù)據(jù)時(shí)也盡量采用相同類(lèi)型的攝像頭,并且盡可能復(fù)用調(diào)試工作,這樣可以避免額外的數(shù)據(jù)采集,提高效率實(shí)現(xiàn)平臺(tái)化。
NBD:如果在汽車(chē)行業(yè),您覺(jué)得商湯絕影以后會(huì)成為自動(dòng)駕駛的安卓還是蘋(píng)果的iOS?
王曉剛:首先我們要擁有自動(dòng)駕駛的這些全量方案,可能后面會(huì)更多地提供云服務(wù)、大模型和基礎(chǔ)設(shè)施。自動(dòng)駕駛未來(lái)的研發(fā),在車(chē)端的研發(fā)會(huì)變得越來(lái)越輕,而在云端的基礎(chǔ)設(shè)施投入會(huì)越來(lái)越重,因?yàn)槎急荒P吞娲恕?qiáng)化學(xué)習(xí)、世界模型都是在訓(xùn)練階段、在云端發(fā)生的,最后出來(lái)的端側(cè)的東西相對(duì)來(lái)說(shuō)比較簡(jiǎn)單。所以我們自己要提供云服務(wù),給客戶(hù)這些基礎(chǔ)設(shè)施的支撐。
NBD:展望未來(lái)3年到5年,商湯絕影有什么規(guī)劃?您希望達(dá)到什么樣的目標(biāo)?
王曉剛:我覺(jué)得從三個(gè)層面來(lái)看,在通用人工智能高速發(fā)展的浪潮里,希望絕影始終能夠站在前列,給消費(fèi)終端客戶(hù)帶來(lái)優(yōu)秀且新的體驗(yàn)。從公司自身來(lái)說(shuō),未來(lái)3年到5年,(希望)能夠有更好地發(fā)展,進(jìn)入下一個(gè)階段。商湯絕影希望通過(guò)3年至5年在汽車(chē)行業(yè)深耕,能夠極大地去推動(dòng)商湯AI平臺(tái)化的發(fā)展。畢竟,商湯再先進(jìn)的技術(shù)也需要找到合適的應(yīng)用和落地場(chǎng)景,以便獲取反饋,形成正向循環(huán)。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP