2026-02-12 07:41:42
中國(guó)AI大模型領(lǐng)域動(dòng)態(tài)不斷。2月11日智譜確認(rèn)“Pony Alpha”為其新模型GLM-5,已在平臺(tái)上線;此前該模型因能力強(qiáng)引開(kāi)發(fā)者關(guān)注。1月8日智譜掛牌上市,宣布回歸基礎(chǔ)模型研究。此外,DeepSeek更新模型,支持百萬(wàn)Token上下文長(zhǎng)度,還將推新一代旗艦?zāi)P?;其團(tuán)隊(duì)發(fā)表兩篇論文公開(kāi)創(chuàng)新架構(gòu)。同日,MiniMax的M2.5模型也即將正式上線。
每經(jīng)編輯|畢陸名
中國(guó)AI大模型的重磅消息陸續(xù)傳來(lái)。
2月11日晚,智譜官方確認(rèn),此前在全球模型服務(wù)平臺(tái)OpenRouter登頂熱度榜首的神秘模型“Pony Alpha”,為智譜新模型GLM-5。目前新模型已在chat.z.ai平臺(tái)上線。
2月6日,全球模型服務(wù)平臺(tái)OpenRouter悄然上線一款代號(hào)為"Pony Alpha"的匿名模型,因其較強(qiáng)的編碼能力、超長(zhǎng)上下文窗口及針對(duì)智能體工作流的深度優(yōu)化,迅速引發(fā)開(kāi)發(fā)者社區(qū)關(guān)注,在海外社區(qū)熱度迅速攀升。
OpenRouter官方將Pony Alpha描述為“前沿基礎(chǔ)模型”,在編程、智能體工作流、推理及角色扮演方面表現(xiàn)強(qiáng)勁,特別強(qiáng)調(diào)其“極高的工具調(diào)用準(zhǔn)確率”。這一特性使其在AI Agent(智能體)應(yīng)用場(chǎng)景中展現(xiàn)出顯著優(yōu)勢(shì),開(kāi)發(fā)者可通過(guò)Claude Code等工具調(diào)用該模型,實(shí)現(xiàn)長(zhǎng)達(dá)數(shù)小時(shí)的復(fù)雜項(xiàng)目開(kāi)發(fā)。
1月8日,智譜正式在港交所掛牌上市,在掛牌當(dāng)日,公司首席科學(xué)家、清華大學(xué)計(jì)算機(jī)系教授唐杰向全員發(fā)出內(nèi)部信,確認(rèn)新一代基座模型GLM-5“即將發(fā)布”,并宣布2026年起“全面回歸基礎(chǔ)模型研究”,同時(shí)設(shè)立前沿創(chuàng)新部門X-Lab,聚焦架構(gòu)、學(xué)習(xí)范式與持續(xù)進(jìn)化三大方向。
此外,DeepSeek也更新了模型。據(jù)報(bào)道,多名用戶反饋,DeepSeek在網(wǎng)頁(yè)端和APP端進(jìn)行了版本更新,支持最高1M(百萬(wàn))Token的上下文長(zhǎng)度。而去年8月發(fā)布的DeepSeekV3.1上下文長(zhǎng)度拓展至128K。

目前,能將上下文推至百萬(wàn)級(jí)別的模型較少,谷歌的Gemini系列和Anthropic的Claude Opus 4.6等已率先實(shí)現(xiàn)。
DeepSeek的V系列模型定位為追求極致綜合性能的基礎(chǔ)模型。2024年12月推出的基礎(chǔ)模型V3是DeepSeek的重要里程碑,其高效的MoE架構(gòu)確立了強(qiáng)大的綜合性能基礎(chǔ)。此后,DeepSeek在V3基礎(chǔ)上快速迭代,發(fā)布了強(qiáng)化推理與Agent(智能體)能力的V3.1,并于2025年12月推出了最新正式版V3.2。同時(shí),還推出了一個(gè)專注于攻克高難度數(shù)學(xué)和學(xué)術(shù)問(wèn)題的特殊版本V3.2-Speciale。
科技媒體The Information此前爆料稱,DeepSeek將在今年2月中旬農(nóng)歷新年期間推出新一代旗艦AI模型DeepSeek V4,將具備更強(qiáng)的寫代碼能力。
今年初,DeepSeek團(tuán)隊(duì)發(fā)表兩篇論文,公開(kāi)了兩項(xiàng)創(chuàng)新架構(gòu):mHC(流形約束超連接)用來(lái)優(yōu)化深層Transformer信息流動(dòng),使模型訓(xùn)練更穩(wěn)定、易擴(kuò)展,在不增加算力負(fù)擔(dān)前提下提升性能;Engram(條件記憶模塊)將靜態(tài)知識(shí)與動(dòng)態(tài)計(jì)算解耦,用廉價(jià)DRAM存儲(chǔ)實(shí)體知識(shí),釋放昂貴HBM專注推理,顯著降低長(zhǎng)上下文推理成本。
同日,MiniMax也有消息傳來(lái),M2.5模型即將正式上線,目前MiniMax M2.5模型已在海外的MiniMax Agent產(chǎn)品進(jìn)行內(nèi)測(cè)。
每日經(jīng)濟(jì)新聞綜合公開(kāi)信息
封面圖片來(lái)源:AIGC
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP