人工智能領域迎來重要突破,通義DeepResearch正式開源發布,標志著AI研究能力從“對話交互”向“深度探索”的跨越式發展。該模型在Humanity's Last Exam、BrowseComp、GAIA等國際權威深度研究基準測試中均取得最優成績,綜合性能與海外旗艦模型持平甚至超越,同時以完全開源的方式提供模型、框架及解決方案。
針對海外閉源模型使用成本高、調用受限等問題,研發團隊通過創新技術路徑實現突破。30B參數規模的tongyi DeepResearch在保持輕量化的同時,通過多階段數據策略和強化學習優化,在復雜推理任務中展現出顯著優勢。其核心技術覆蓋數據合成、增量預訓練、有監督微調及強化學習全流程,形成端到端的智能體訓練范式。
數據構建方面,團隊開發出全自動化合成方案。通過知識圖譜隨機游走、表格數據融合等技術,從真實網站提取結構化信息,并設計“原子操作”系統提升問題復雜度。特別在決策動作合成中,將多步驟軌跡重構為決策過程,有效增強模型規劃能力。該方案生成的“博士級”研究問題,可模擬多學科交叉推理場景,推動模型能力逼近人類專家水平。
模型架構創新包含雙重推理模式:標準ReAct模式支持128K長上下文交互,通過“思考-行動-觀察”循環處理常規任務;深度模式(Heavy Mode)則采用IterResearch范式,將復雜任務分解為多個研究輪次。每輪僅保留關鍵信息構建精簡工作空間,通過“綜合與重構”迭代保持認知焦點,避免傳統方法中的信息過載問題。團隊還提出Research-Synthesis框架,允許多智能體并行探索后整合結論,顯著提升答案準確性。
訓練體系實現全鏈路革新,從Agentic持續預訓練(CPT)到拒絕微調(RFT)再到強化學習(RL),形成閉環優化系統。在RL階段,團隊基于GRPO算法進行定制優化,采用on-policy訓練范式確保學習信號與模型能力精準匹配。通過token級策略梯度損失、留一法優勢估計等技術,有效降低訓練方差。針對負樣本干擾問題,開發選擇性過濾機制,結合大批量訓練維持監督信號穩定性。
基礎設施層面構建三大支撐系統:仿真訓練環境利用離線維基百科和自定義工具套件,降低對實時Web API的依賴;穩定工具沙盒通過緩存、重試和飽和響應機制,確保工具調用的可靠性;自動數據管理系統實現訓練動態指導下的實時優化,形成數據生成與模型訓練的正向循環。異步強化學習框架支持多智能體并行交互,顯著提升訓練效率。
技術落地已產生實際價值。與高德合作的出行智能體“高德小德”,在地圖導航和本地生活場景中實現復雜查詢的垂類應用,成為高德V16版本的核心功能。法律領域推出的“通義法睿”智能體,集成案例檢索、合同審查、文書起草等功能,通過迭代規劃技術實現多步推理,在答案質量、案例引用、法條匹配等維度達到行業領先水平。
研發團隊同步發布六篇技術報告,詳細闡述數據合成策略、強化學習優化、多智能體協作等關鍵技術。開源社區已上線30B參數規模的tongyi DeepResearch模型,配套提供框架代碼和訓練方案。此前半年間,團隊保持每月發布技術報告的節奏,持續推動深度研究智能體領域的技術演進。
更多>同類資訊
宇樹科技杜鑫峰:機器人從文娛到工業,在電網儲能等場景展身手09-18
DeepSeek發布嚴正聲明:警惕不法分子冒用名義開展“算力租賃”“融資”詐騙09-18
DeepSeek登《Nature》封面:梁文鋒團隊以低成本創新,開啟AI推理革命新篇09-18
華為徐直軍:Atlas 950超節點算力卓越,多項指標遠超英偉達同期產品09-18
藍思科技攜手Rokid打造智能眼鏡,亮相東博會展現科技文化融合魅力由藍思科技與Rokid共同開發的Rokid Glasses智能眼鏡作為大會指定貴賓禮品正式亮相,展現了中國智能制造的技術水平與創新實力。產品采用衍射光波導顯示技術,在保持高透光率的同時實現高清晰度顯示,并搭載…09-18
類腦研究新突破:解鎖大腦奧秘,推動人工智能邁向“自我思考”時代復旦大學類腦智能科學與技術研究院院長馮建峰曾介紹:“現在的人工智能,仍停滯于機器的概念。在這里,馮建峰和諸多科研團隊正在破解一個個“腦奧秘”:比如,研究發現,人腦前額葉和枕葉區的灰質體積越小,多動癥的癥狀越嚴…09-18
技術革新與政策助力雙輪驅動:倉儲機器人重塑物流產業新生態同期發布的《“十四五”機器人產業發展規劃》,更是明確將提高產業創新能力、夯實產業發展基礎、增加高端產品供給等作為主要任務;在“機器人+”應用行動中,提出要深耕倉儲物流等重點行業的應用;在機器人創新產品發展行…09-18
宇樹科技杜鑫峰:機器人“進廠打工”成趨勢,數據采集難題待解9 月 18 日消息,據每日經濟新聞今天報道,2025 世界儲能大會今天在寧德開幕,其中宇樹科技副總經理杜鑫峰在大會上發表演講。 杜鑫峰表示,宇樹科技的機器人現在廣泛應用于文娛表演方面,同時在工業巡…09-18
北自科技攜手星動紀元:人形機器人開啟智能物流新時代探索之旅星動紀元有清華技術基因,陳建宇教授團隊在研發上實力強勁;北自科技則具備場景落地能力,雙方結合能將技術與應用深度融合,實現人形機器人技術在物流工業場景中的落地。 陳建宇:星動紀元與北自科技的技術協同,將探索和挖…09-18
華為發布靈衢互聯協議與系列超節點,引領AI算力基礎設施新變革09-18ICPC總決賽AI大放異彩!GPT-5組合滿分奪冠,人類賽場角逐第三席位09-18微盟集團獲2億美金長線投資,聚焦AI研發與出海,CEO展望全球科技新篇章09-18DeepSeek登《Nature》封面引關注 梁文鋒帶隊回應爭議 開啟AI推理新征程09-18華為徐直軍:Atlas 950超節點算力強勁,多項指標遠超英偉達同類產品09-18
?我國科研團隊攻克難關 研發“神經蠕蟲”電極開啟生物電子接口新范式?
濰坊青州云門山景區:重載無人機助力施工 突破地形難題提速增效
技術革新與政策助力雙輪驅動:倉儲機器人重塑物流產業新生態
宇樹科技杜鑫峰:機器人“進廠打工”成趨勢,數據采集難題待解
北自科技攜手星動紀元:人形機器人開啟智能物流新時代探索之旅
南京浦口中專學校新設無人機專業,產教融合助學子逐夢低空藍天熱門內容
北自科技攜手星動紀元:人形機器人開啟智能物流新時代探索之旅
華為發布靈衢互聯協議與系列超節點,引領AI算力基礎設施新變革
DeepSeek-R1論文登Nature封面:AI大模型研究邁向科學嚴謹新階段
華為發布《AIDC機房參考設計白皮書》,為AI算力設施建設指明新方向
華為坤靈“4+10+N”方案出爐,一站式助力中小企業邁向智能世界
本文鏈接:http://m.www897cc.com/showinfo-45-27815-0.html通義DeepResearch重磅登場:性能比肩海外旗艦,模型框架方案全面開源共享
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com