在發(fā)布文心一言兩周年之際,百度又發(fā)布新款模型。
3月16日,百度正式發(fā)布文心大模型4.5及文心大模型X1。與此前不同的是,此次百度并未召開發(fā)布會,而是直接宣布新模型在文心一言官網(wǎng)上線,并免費(fèi)向用戶開放。
近期,國內(nèi)AI大模型廠商紛紛宣布“迭代”。3月10日,字節(jié)跳動豆包大模型團(tuán)隊(duì)官宣開源一項(xiàng)針對MoE架構(gòu)的關(guān)鍵優(yōu)化技術(shù),可將大模型訓(xùn)練效率提升1.7倍,成本節(jié)省40%。3月6日,阿里巴巴發(fā)布并開源全新的推理模型通義千問QwQ-32B,通過強(qiáng)化學(xué)習(xí),可在數(shù)學(xué)推理、代碼生成等任務(wù)上實(shí)現(xiàn)精度提升。
百度發(fā)布兩款新模型
3月16日,百度發(fā)布文心大模型4.5及文心大模型X1。據(jù)介紹,文心大模型4.5是百度首個原生多模態(tài)大模型。百度稱,文心大模型4.5在多項(xiàng)測試中表現(xiàn)優(yōu)于GPT4.5,API調(diào)用價格僅為GPT4.5的1%;文心大模型X1為深度思考模型,性能對標(biāo)DeepSeek-R1,調(diào)用價格約為R1的一半。
具體來看,百度方面稱,文心大模型4.5多項(xiàng)基準(zhǔn)測試成績優(yōu)于GPT4.5、DeepSeek-V3等,并在平均分上以79.6分高于GPT4.5的79.14。而文心大模型4.5在多模態(tài)理解能力上提升,不僅有較強(qiáng)的圖形推理、圖表分析能力,還具備理解梗圖、漫畫、歌曲、電影等多模態(tài)內(nèi)容的能力。
文心大模型X1定位為深度思考模型,在性能上對標(biāo)DeepSeek-R1,具備“長思維鏈”,擅長中文知識問答、文學(xué)創(chuàng)作、邏輯推理等,而且增加了多模態(tài)能力和多工具調(diào)用,能理解和生成圖片,還能調(diào)用工具生成代碼、圖表等內(nèi)容。
作為能自主運(yùn)用工具的大模型,文心大模型X1支持高級搜索、文檔問答、圖片理解、AI繪圖、代碼解釋器、網(wǎng)頁鏈接讀取、TreeMind樹圖、百度學(xué)術(shù)檢索、商業(yè)信息查詢、加盟信息查詢等多款工具。
據(jù)百度介紹,文心大模型4.5已上線百度智能云千帆大模型平臺,企業(yè)用戶和開發(fā)者登錄即可調(diào)用API;文心大模型X1也即將在千帆上線。百度搜索、文小言APP等產(chǎn)品,將陸續(xù)接入文心大模型4.5和文心大模型X1。
隨著大模型技術(shù)的快速迭代,訓(xùn)練和推理成本的降低,大模型開源已成大勢所趨。
今年2月,百度曾宣布文心一言將于4月1日免費(fèi),并宣布推出的文心大模型4.5,將于6月30日正式開源。彼時百度還表示,將在今年下半年發(fā)布文心大模型5.0。
“從DeepSeek身上,我們學(xué)到了一件事,那就是開源最佳模型能大大促進(jìn)人們使用或采納這個模型?!?月18日晚,在百度2024年第四季度及全年財(cái)報電話會上,百度創(chuàng)始人李彥宏表示,開源的決策源自對技術(shù)領(lǐng)先地位的堅(jiān)定信心,開源將進(jìn)一步促進(jìn)文心大模型的廣泛應(yīng)用,并在更多場景中擴(kuò)大其影響力。他還強(qiáng)調(diào),無論開源還是閉源,基礎(chǔ)模型只有在大規(guī)模解決現(xiàn)實(shí)問題時,才具備真實(shí)價值。
AI廠商加速迭代
近期,AI大模型領(lǐng)域呈現(xiàn)技術(shù)迭代加速、多模態(tài)與深度思考能力突破、開源生態(tài)完善等趨勢。國內(nèi)外廠商在模型能力、應(yīng)用場景等方面展開全方位競爭。
3月12日,谷歌DeepMind推出用于機(jī)器人技術(shù)的人工智能模型,這個機(jī)器人基座大模型名為 Gemini Robotics 和 Gemini Robotics-ER,旨在利用大語言模型的推理能力,幫助機(jī)器人適應(yīng)復(fù)雜環(huán)境,從而完成現(xiàn)實(shí)世界中的復(fù)雜任務(wù)。
3月10日,字節(jié)跳動豆包大模型團(tuán)隊(duì)官宣開源一項(xiàng)針對MoE架構(gòu)的關(guān)鍵優(yōu)化技術(shù),可將大模型訓(xùn)練效率提升1.7倍,成本節(jié)省40%。據(jù)介紹,MoE是當(dāng)前大模型的主流架構(gòu),但其在分布式訓(xùn)練中存在大量跨設(shè)備通信開銷,制約了大模型訓(xùn)練效率和成本。針對這一難題,字節(jié)在內(nèi)部研發(fā)COMET計(jì)算-通信重疊技術(shù),可大幅壓縮MoE專家通信空轉(zhuǎn)時間。
3月6日,阿里巴巴宣布推出最新的推理模型通義千問QwQ-32B。這是一款擁有320億參數(shù)的模型,通過大規(guī)模強(qiáng)化學(xué)習(xí),千問QwQ-32B在數(shù)學(xué)、代碼及通用能力上實(shí)現(xiàn)提升,整體性能比肩DeepSeek-R1,在消費(fèi)級顯卡比如家用電腦上也能實(shí)現(xiàn)本地部署。隨后,國家超算互聯(lián)網(wǎng)平臺正式上線通義千問QwQ-32B API服務(wù),向用戶提供免費(fèi)100萬tokens的試用額度。
日前,全球知名創(chuàng)投機(jī)構(gòu)Andreessen Horowitz(a16z)發(fā)布了2025年全球100大生成式AI 應(yīng)用排行榜,中國的AI技術(shù)實(shí)力在此次榜單中展現(xiàn)出強(qiáng)勁的競爭力。其中,DeepSeek在網(wǎng)頁版應(yīng)用中排名第二,僅次于OpenAI 的ChatGPT,其驚人的成長速度引起全球關(guān)注。
此外,在中國生成式AI中,字節(jié)跳動旗下的豆包也位列第十。中國其他知名的大型模型也成功進(jìn)入榜單,包括月之暗面(第11名)、海螺視頻(第12名)和快手可靈(第20名),它們的排名均超越了Sora、Midjourney、Runway 等全球知名應(yīng)用。
平安證券研報認(rèn)為,全球大模型的競爭仍然激烈,這種激烈競爭將持續(xù)拔升全球大模型的能力上限。同時,全球領(lǐng)先大模型廠商對大模型研發(fā)的持續(xù)投入,也將為AI算力需求的持續(xù)增長提供有力支撐。
中國銀河證券研報分析認(rèn)為,AI Agent(智能體)落地使得大模型集成度更高、算力資源需求更加旺盛,重心逐步從預(yù)訓(xùn)練轉(zhuǎn)移到了特定應(yīng)用場景的后訓(xùn)練,推理端算力規(guī)模有望提升??傮w來說,推理算力有望推動應(yīng)用的進(jìn)一步增長,低成本算力時代帶動應(yīng)用端繁榮度提升,AI能力邊際擴(kuò)張依然需要依賴更強(qiáng)的模型和強(qiáng)大的算力支撐,有望開拓AI行業(yè)大模型共振發(fā)展新局面。
校對:李凌鋒?????????????