精品自拍视频,特级aaa毛片,福利网在线,992tv成人国产福利在线观看,91久久久久国产一区二区,秋霞鲁丝午夜久久日韩,黄色片不卡

每日經(jīng)濟(jì)新聞
推薦

每經(jīng)網(wǎng)首頁 > 推薦 > 正文

視頻生成賽道競爭白熱化 百度押注“實(shí)時交互”求破局

每日經(jīng)濟(jì)新聞 2025-10-16 20:52:44

百度副總裁、移動生態(tài)商業(yè)體系負(fù)責(zé)人陳一凡將AI視頻發(fā)展階段比作從“3G到4G”的轉(zhuǎn)折期,認(rèn)為競爭正從技術(shù)比拼轉(zhuǎn)向門檻之爭,實(shí)時交互是關(guān)鍵。百度視頻生成大模型迭代押注實(shí)時交互,采用自回歸流式擴(kuò)展架構(gòu),以解決累積誤差和一致性問題。降低門檻、豐富玩法將吸引更多用戶,平臺視頻生成量級已達(dá)千萬級。

每經(jīng)記者|可楊    每經(jīng)編輯|魏官紅    

從Runway、Pika到Sora,AI(人工智能)視頻工具不斷刷新想象空間,而在國內(nèi),實(shí)踐者們開始探索更深層次的問題——AI如何真正融入內(nèi)容產(chǎn)業(yè),形成可持續(xù)的生產(chǎn)模式。

百度副總裁、移動生態(tài)商業(yè)體系負(fù)責(zé)人陳一凡在接受包括《每日經(jīng)濟(jì)新聞》記者在內(nèi)的媒體記者采訪時將這一節(jié)點(diǎn)比作通信史上“3G到4G”的轉(zhuǎn)折期——從“能生成”邁向“可實(shí)時互動”。

陳一凡認(rèn)為,實(shí)時交互被低估了,“如果只是生成,可能只是做了一個類似AI版的抖音”。他表示,AI視頻競爭的下半場,正在從技術(shù)比拼轉(zhuǎn)向門檻之爭,誰能讓更多人更低成本地參與創(chuàng)作,誰就能在生態(tài)中積累更大的勢能。

百度視頻生成大模型迭代:押注實(shí)時交互

在AI視頻生成的快速演進(jìn)中,技術(shù)的焦點(diǎn)似乎正在悄然轉(zhuǎn)移,從“能生成”邁向“能交互”。

陳一凡將這一節(jié)點(diǎn)比作通信史上3G到4G變革的前夜,“沒有3G,就沒有移動互聯(lián)網(wǎng)的繁榮;沒有4G,就不會有短視頻的爆發(fā)”。在他看來,生成模型的能力已趨近成熟,下一階段的突破不在于更大的參數(shù)或更高的分辨率,而在于讓生成變得實(shí)時、可控、可互動。

百度商業(yè)研發(fā)首席架構(gòu)師李雙龍也認(rèn)為,人類創(chuàng)作的過程并不是一次性做成的,而是一個邊寫邊改、不斷思考與修正的過程。他指出,當(dāng)前許多視頻生成產(chǎn)品仍停留在“盲盒式”體驗(yàn)——用戶等待模型一次性生成10秒或20秒片段,再判斷結(jié)果是否可用,這種反射性生成方式并不符合真實(shí)的創(chuàng)作邏輯。

為了實(shí)現(xiàn)可打斷和可修改的實(shí)時交互,百度“蒸汽機(jī)”選擇將整個架構(gòu)從窗口式擴(kuò)展升級為自回歸流式擴(kuò)展架構(gòu)。“這未必是顛覆性的創(chuàng)新,但它是更符合人性的創(chuàng)作過程。”李雙龍說。

在談及如何實(shí)現(xiàn)交互式生成時,李雙龍?zhí)寡?,這一方向背后存在大量技術(shù)挑戰(zhàn),傳統(tǒng)的窗口式擴(kuò)散生成方式無法支撐長視頻創(chuàng)作,因?yàn)樗?0秒為單位生成,出現(xiàn)問題時無法局部修改,只能重來。為此,團(tuán)隊(duì)對底層架構(gòu)進(jìn)行了升級,從“窗口擴(kuò)散”轉(zhuǎn)向“自回歸流式擴(kuò)展生成”。

但該機(jī)制也帶來了新的問題,例如累積誤差和一致性挑戰(zhàn)。對此,李雙龍介紹,團(tuán)隊(duì)通過采用歷史幀和穩(wěn)定錨點(diǎn)幀技術(shù)等優(yōu)化手段,來全局管理一致性,解決自回歸帶來的問題。

陳一凡認(rèn)為,實(shí)時交互的需求是被低估了,“如果只是生成,可能只是做了一個類似AI版的抖音”,這當(dāng)然也有很大的空間,但可互動性之所以重要,在于它提升了信息密度,將傳統(tǒng)的單向、寫好劇本的內(nèi)容消費(fèi)轉(zhuǎn)變?yōu)殡p向互動。

這能讓用戶擁有不同的情景體驗(yàn),極大地提升娛樂性。從淺層應(yīng)用來看,實(shí)時交互能提升廣告線索質(zhì)量;從深層應(yīng)用來看,它能完成整個咨詢或服務(wù)過程的深度交互,例如在心理咨詢等場景中,數(shù)字人可以實(shí)時感知用戶表情并作出反饋,實(shí)現(xiàn)與傳統(tǒng)廣告截然不同的深度。

在百度內(nèi)部,“蒸汽機(jī)”承擔(dān)著模型、工具、產(chǎn)品三層結(jié)構(gòu)的中樞角色:底層是模型層,中層是工具層,上層是產(chǎn)品層。在這種布局之下,百度在視頻生成模型方面的打法,更偏向于構(gòu)建一個AI內(nèi)容生態(tài)的基礎(chǔ)設(shè)施。

視頻生成競爭轉(zhuǎn)向:從技術(shù)比拼到門檻之爭

放眼全球,AI視頻生成模型領(lǐng)域競爭的激烈程度和變化速度遠(yuǎn)超想象。

OpenAI的Sora 2模型一經(jīng)發(fā)布,憑借“電影級”的短視頻生成能力和對物理、人物塑造的巨大突破,其驅(qū)動的創(chuàng)作應(yīng)用“Sora”迅速登上美區(qū)應(yīng)用商店下載榜首,證明了其在To C(面向用戶)端強(qiáng)大的市場號召力。緊隨其后,谷歌的Veo 3.1迅速更新,不僅新增了音頻生成功能,支持為視頻添加背景音樂和音效,更在對象控制、視頻分辨率與時序連貫性上實(shí)現(xiàn)技術(shù)升級,提升了高質(zhì)量內(nèi)容創(chuàng)作的適用性。

這場全球范圍內(nèi)的技術(shù)競賽正以前所未有的速度向前推進(jìn),但與此同時,底層架構(gòu)和技術(shù)路徑日益趨同。對于行業(yè)終局和應(yīng)對策略,陳一凡認(rèn)為,創(chuàng)新和用戶體驗(yàn)將成為核心突破口。

陳一凡指出,從技術(shù)發(fā)展歷程來看,視頻生成行業(yè)經(jīng)歷了“從想法到實(shí)現(xiàn),再到反思優(yōu)化”的階段。初期技術(shù)迭代主要集中在算法性能上,但隨著DIT架構(gòu)等方案成熟,算力需求和生成時間呈幾何級增長,限制了大規(guī)模應(yīng)用。

“創(chuàng)新在這個階段尤為重要。以前大家會關(guān)注技術(shù)性能,現(xiàn)在更多關(guān)注如何降低使用門檻,讓玩法更豐富。”陳一凡表示,降低門檻意味著用戶能夠即時獲得互動體驗(yàn),而非等待延遲結(jié)果,這也是目前很多大模型在應(yīng)用上仍然存在短板的環(huán)節(jié)。

在具體實(shí)踐中,百度通過升級流式架構(gòu)提升生成效率,實(shí)現(xiàn)了大規(guī)模的視頻生產(chǎn)與分發(fā)。陳一凡透露,平臺視頻生成量級已經(jīng)從百萬級提升到千萬級,“當(dāng)門檻降低、玩法豐富,自然會吸引更多用戶涌入,最終的目標(biāo)是讓用戶知道怎么玩、愿意玩”。

對于近期熱門產(chǎn)品如Sora 2的技術(shù)表現(xiàn),陳一凡認(rèn)為,其底層模型在一致性和運(yùn)鏡豐富度上有所提升,但尚未達(dá)到基礎(chǔ)模型級別的突破。

在商業(yè)化的思考上,百度“蒸汽機(jī)”當(dāng)前階段的重點(diǎn)仍是內(nèi)部賦能,即通過技術(shù)能力支撐內(nèi)部產(chǎn)品,提升To C端的價值。陳一凡坦言,當(dāng)前最明顯的收益是C端整個的用戶留存和使用時長的提升,這直接帶來了百度原有商業(yè)化模式收入的增長。

據(jù)透露,目前,營銷相關(guān)和內(nèi)容創(chuàng)作是“蒸汽機(jī)”調(diào)用量最大的兩大落地場景。營銷相關(guān)調(diào)用量占到約一半。

對于未來是主攻To C還是To B,陳一凡表示,目前兩側(cè)都在投入。To B端,主要滿足內(nèi)部技術(shù)業(yè)務(wù)庫的需求,以及應(yīng)對外部客戶的定制化需求,如專有云應(yīng)用等,需要針對穩(wěn)定性等進(jìn)行微調(diào);To C端,側(cè)重于結(jié)合百家號等生態(tài),將創(chuàng)作者生態(tài)做大。

封面圖片來源:每日經(jīng)濟(jì)新聞 資料圖

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

視頻 模型 百度

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0