每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

邊想邊搜、“看懂”世界,豆包深度思考模型能否打開AI Agent進化新維度?

每日經濟新聞 2025-04-18 07:41:55

4月17日,火山引擎AI創新巡展杭州站發布豆包1.5·深度思考模型。該模型在數學、編程等領域表現突出。火山引擎總裁譚待表示,模型具備邊想邊搜和視覺版多模態能力,多模態是推理模型趨勢。豆包大模型日均tokens使用量超12.7萬億,增長超106倍。火山引擎還推出OS Agent解決方案,支持MCP協議,未來將在優化模型、降低成本、產品落地三方面持續發力。

每經記者 楊昕怡    每經實習編輯 余婷婷    

解讀上市公司財報、填報高考志愿、為大家庭推薦露營裝備、拿著英文菜單給多人點餐——在4月17日的火山引擎AI創新巡展杭州站現場,這些復雜的工作、生活問題被搭載了最新深度思考模型的豆包一一解決。

發布會現場,火山引擎總裁譚待介紹稱,豆包1.5·深度思考模型在數學、編程、科學推理等專業領域及創意寫作等通用任務中表現突出,其中在數學推理AIME 2024測試得分追平了OpenAI o3-mini-high(模型名)。

如同OpenAI o系列最新模型o3和o4-mini(模型名)在多模態理解上的大力探索,豆包最新模型的多模態能力也在發布會現場被頻頻提及。“模型要有能力做好思考、計劃和反思,并且一定要支持多模態,就像人類具備視覺和聽覺一樣,Agent(智能體)才能更好地處理復雜任務。”譚待表示。

從OpenAI首款全功能Agent Operator到“一碼難求”的Manus(智能體名),AI(人工智能) Agent正在成為2025年業內的最大焦點。英諾天使基金合伙人王晟在今年年初接受《每日經濟新聞》記者專訪時表示,“AI這一波新技術的最終應用就是Agent,我們今年比較期待AI Agent能取得突破。”

火山引擎總裁 譚待 圖片來源:火山引擎公眾號

為了加速Agent的落地,火山引擎此次還推出了OS Agent解決方案及AI云原生推理套件。“持續優化模型,保持競爭力;不斷降低成本、延遲,提高吞吐率;讓產品更易落地,(發布)像扣子、HiAgent平臺還有云原生組件OS Agent等——未來我們會在這三方面持續發力。”在會后的群訪中,譚待向《每日經濟新聞》記者表示。

“多模態+深度推理”,豆包上線全新模型

對于一個新模型而言,其性能自然是外界關注的首要方面。發布會上,譚待介紹稱,豆包1.5·深度思考模型在數學推理AIME 2024測試的得分追平OpenAI o3-mini-high,編程競賽和科學推理測試成績接近o1。同時,在創意寫作、人文知識問答等非推理任務上,該模型也展現出了優秀的泛化能力。

技術報告顯示,這一新模型采用MoE(專家混合模型)架構,總參數為200B,激活參數僅20B,低于業界同類模型參數規模的50%,具備顯著的推理成本優勢。并且,基于高效算法,該模型API服務能在保障高并發的同時,實現20毫秒的極低延遲。

在具體的場景應用上,豆包1.5·深度思考模型主要突出了自身具備的邊想邊搜能力和視覺版的多模態能力。

“計劃從北京出發,去日本關西地區進行為期5天的旅游,希望能看到花火大會、泡到特色溫泉,請幫我規劃一下行程。”《每日經濟新聞》記者以上述提示詞實測發現,豆包在思考過程中能自主拆解問題,就花火大會日期、溫泉旅館的預訂情況和交通券的適用范圍等信息確認進行了多輪搜索。

“除了邊搜邊想,豆包深度思考模型還具備視覺推理能力,讓模型像人類一樣,不光基于文字思考,更能基于所見畫面來思考,更加全面。”譚待在發布會上舉例表示,“豆包深度思考模型可以看懂非常復雜的企業項目管理流程圖表,能快速定位到關鍵信息,并以強大的指令遵循能力,嚴格按照流程圖,回答客戶的問題。”

北京市社會科學院副研究員王鵬接受《每日經濟新聞》記者微信采訪時表示,具備多模態能力是未來推理模型的趨勢,“多模態能力使模型更全面理解和處理復雜信息,能廣泛應用于金融、智能客服和醫療等領域。”

截至目前,豆包大模型家族已有15位“成員”,豆包App也成為了國內AI原生App的頭部玩家。據QuestMobile在4月15日發布的數據顯示,截至2025年2月底,我國AI原生App用戶規模達2.4億,較1月份增長了1.15億。2025年3月,豆包的月活用戶規模達1.16億,僅次于DeepSeek的1.94億。

“Agent是必經之路”,火山引擎如何助力?

發布會上,譚待還照例公布了豆包大模型的最新使用量:截至2025年3月,豆包大模型日均tokens(詞元)使用量超12.7萬億,較發布之初增長超106倍。

與此同時,國際數據公司IDC在今年4月發布的《中國公有云大模型服務市場格局分析,1Q25》(注:1Q25指2025年第一季度)顯示,2024年我國公有云上大模型調用量達114.2萬億tokens,其中火山引擎以46.4%的市場份額位居第一。

對于超百倍的增長,譚待向《每日經濟新聞》記者表示,從長期來看,火山引擎的大模型token調用量在未來仍有百倍甚至更高增長的可能,“具體需要多久時間,關鍵取決于模型是否有重大突破。”

“去年到今年增長很快是因為模型有幾大突破:一是基礎聊天和信息處理能力的提升及成本下降,二是今年深度思考功能的推出。”譚待認為,之后大模型的迭代還將迎來多個關鍵節點,“例如視覺推理能否做得更好、Agent相關技術能否取得更大進展等。”

在譚待看來,要讓AI真正為各行各業帶來變革,Agent是必經之路,“關于Agent的定義,能完成打油詩、簡單報告等任務的不能稱為Agent。從定性角度來看,Agent應該要能完成專業度較高、耗時較長的完整任務;從技術實現角度來看,如果沒有運用思考模型,缺乏反思和規劃能力,也很難被認定為Agent。”

為了加速Agent的落地,此次發布會上,火山引擎宣布了OS Agent解決方案的推出,包含了豆包UI-TARS模型,以及veFaaS函數服務、云服務器、云手機等產品。

記者注意到,4月17日,豆包大模型團隊發布并開源了基于UI-TARS進行增強的UI-TARS-1.5,目前已在7個典型的GUI(圖形用戶界面)評測基準中取得SOTA(最先進的)表現,還首次展現了其在游戲中的長時推理能力和在開放空間中的交互能力。

近期,Claude母公司Anthropic推出的MCP(模型上下文協議)成為了國內外頭部廠商的一大關注點,阿里云、騰訊云等云廠商紛紛上線MCP服務。群訪中,譚待表示,火山引擎已經支持MCP,“我覺得協議統一很重要”,“如果能做到統一協議,大家的應用開發就會更快,模型調用也會更智能。”

“我們一直致力于成為AI時代最優秀的云廠商。”譚待表示,“只要保持產品和技術領先,市場份額自然會領先。”

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

模型 Ai

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0

国产午夜精品理伦片,亚洲手机在线人成网站播放,欧美一级一级a做性视频,亚洲国产色精品三区二区一区
亚洲天堂在线观看视频 | 亚洲精品色吧88 | 一区二区三区欧美国产 | 玖玖资源免费国产在线 | 亚洲综合中文字幕在线 | 五月天婷婷在线观看 |