近日,字節(jié)跳動旗下的Seed團隊在開源領(lǐng)域邁出了重要一步,正式推出了Seed-OSS系列模型。這一系列模型專為長上下文處理、推理任務(wù)、智能體交互及通用場景設(shè)計,其上下文窗口長度達(dá)到了前所未有的512k,這一數(shù)字是業(yè)界常規(guī)標(biāo)準(zhǔn)的四倍,甚至超越了GPT-5的兩倍,相當(dāng)于能夠一次性處理約1600頁文本的信息量。

Seed-OSS系列模型不僅針對推理任務(wù)進(jìn)行了深度優(yōu)化,還創(chuàng)新性地引入了思維預(yù)算功能,允許用戶根據(jù)實際需求靈活調(diào)整模型的推理成本。這一特性使得開發(fā)者能夠在保證模型性能的同時,有效控制資源消耗,提升用戶體驗。
此次開源的Seed-OSS系列包括三個版本:基礎(chǔ)模型Seed-OSS-36B-Base、無合成數(shù)據(jù)基礎(chǔ)模型Seed-OSS-36B-Base-woSyn,以及經(jīng)過指令微調(diào)的Seed-OSS-36B-Instruct。其中,指令微調(diào)后的Seed-OSS-36B-Instruct在多個領(lǐng)域的基準(zhǔn)測試中表現(xiàn)出色,取得了同量級開源模型中的七項最佳性能(SOTA),整體實力超越了Qwen3-32B、Gemma3-27B、gpt-oss-20B等模型,與Qwen3-30B-A3B-Thinking-2507在多數(shù)領(lǐng)域不相上下。

值得注意的是,Seed團隊在發(fā)布這一系列模型時,采取了極為“研究友好”的策略。考慮到合成指令數(shù)據(jù)在預(yù)訓(xùn)練中的潛在影響,團隊特別發(fā)布了無合成數(shù)據(jù)基礎(chǔ)模型,為科研工作者提供了更多樣化的研究選項。Seed-OSS系列模型還支持4位和8位格式的量化處理,進(jìn)一步降低了內(nèi)存需求,提升了模型的應(yīng)用靈活性。
在技術(shù)上,Seed-OSS系列模型采用了12萬億個token的預(yù)訓(xùn)練數(shù)據(jù),并沿用了當(dāng)前主流的因果語言模型架構(gòu)。這一系列模型均為稠密模型,未采用MoE等復(fù)雜架構(gòu),而是結(jié)合了RoPE旋轉(zhuǎn)位置編碼、GQA注意力機制、RMSNorm歸一化及SwiGLU激活函數(shù)等高效組件,以提升訓(xùn)練穩(wěn)定性和推理性能。其512k的上下文窗口并非后續(xù)擴展而來,而是通過原生訓(xùn)練實現(xiàn),能夠一次性處理數(shù)十萬字的內(nèi)容。
思維預(yù)算功能的引入,使得開發(fā)者可以根據(jù)任務(wù)復(fù)雜度靈活調(diào)整模型推理成本。對于簡單任務(wù),模型思維鏈較短,分?jǐn)?shù)波動不明顯;而對于復(fù)雜任務(wù),隨著思維預(yù)算的增加,模型分?jǐn)?shù)也會相應(yīng)提升。若未設(shè)置思維預(yù)算,Seed-OSS將默認(rèn)無思考長度限制;若指定預(yù)算,則建議優(yōu)先考慮512的整數(shù)倍值,因為這些區(qū)間上的模型訓(xùn)練更為充分。
Seed-OSS系列模型的發(fā)布,在開源社區(qū)內(nèi)引起了廣泛關(guān)注。Hugging Face的華人工程師Tiezhen Wang評價稱,這一系列模型非常適合進(jìn)行消融研究,能夠以較低成本探索不同組件對大模型性能的影響。網(wǎng)友們也紛紛表示,如此規(guī)模的基礎(chǔ)模型在開源界實屬罕見,長上下文能力對于實際應(yīng)用具有重大意義。
近年來,開源已成為技術(shù)創(chuàng)新的重要推動力,連OpenAI等原本堅持閉源策略的廠商也開始逐步開源模型。字節(jié)跳動此次將核心語言模型貢獻(xiàn)給社區(qū),無疑為開源社區(qū)的后續(xù)研究提供了更多基礎(chǔ)模型的選擇,進(jìn)一步推動了人工智能技術(shù)的開放與發(fā)展。
舉報 0收藏 0打賞 0評論 0分享 0 更多>同類資訊
vivo三十周年:發(fā)布輕量MR頭顯,影像生態(tài)戰(zhàn)略全面革新正值企業(yè)三十周年之際,vivo不僅重磅發(fā)布了混合現(xiàn)實頭顯探索版,還宣布了影像技術(shù)戰(zhàn)略及影像文化生態(tài)的全新布局,并揭曉了2025 vivo影像加手機攝影大賽結(jié)果。作為國內(nèi)首家同時布局手機與MR的科技企業(yè),viv…08-22
vivo胡柏山:MR技術(shù)引領(lǐng)家庭機器人時代,共筑智能生活新愿景胡柏山在闡述vivo科技戰(zhàn)略藍(lán)圖時提到:“我們致力于通過手機AI、影像和MR能力,短期滿足用戶對大屏沉浸感的需求,長遠(yuǎn)作為機器人的眼睛和大腦,攻克家庭這一非結(jié)構(gòu)化場景下的‘感知-決策’難題,搭建未來家庭機器人…08-22
百度Q2財報:廣告業(yè)務(wù)下滑,AI新業(yè)務(wù)成業(yè)績增長新動力百度新任CFO何海建在此次電話會上稱,在過去的幾個季度里,百度加大了AI投資力度,但由于AI搜索的商業(yè)化仍處于非常早期的階段,尚未擴大規(guī)模,預(yù)計百度的收入和利潤率在短期內(nèi)面臨相當(dāng)大的壓力,第三季度將特別具有…08-22
文遠(yuǎn)知行WePilot AiDrive:年內(nèi)量產(chǎn),引領(lǐng)L2級輔助駕駛新革命08-22
文遠(yuǎn)知行WePilot AiDrive:年內(nèi)量產(chǎn),引領(lǐng)L2級輔助駕駛新紀(jì)元08-22
AI陪伴市場升溫,雷軍馬斯克等資本大佬入局,長期記憶痛點待解郭戈稱,資本追逐這一賽道并非偶然,因為陪伴本身就是玩具的核心價值,而AI的加入則賦予其“情緒價值”,擴大了市場蛋糕。 萬物時創(chuàng)始人萬一(Roy)也向時代周報記者強調(diào),“情感陪伴一定是長期的本質(zhì)需求,和文化消費…08-22
智匯教育未來:名校長共探基礎(chǔ)教育數(shù)字化變革新航向來自全國多地的名校長與專家學(xué)者齊聚一堂,圍繞基礎(chǔ)教育數(shù)字化變革、學(xué)校數(shù)字轉(zhuǎn)型與智能升級、校長數(shù)字化領(lǐng)導(dǎo)力等核心議題,深入交流聯(lián)盟內(nèi)外部實踐經(jīng)驗,共話智慧教育發(fā)展新路徑。 論壇由教育數(shù)字化行動百校聯(lián)盟聯(lián)合北京師…08-22生成式AI投資熱,但95%企業(yè)未見回報,AI價值何在?08-22DeepSeek-V3.1重磅升級:提升思考效率,強化Agent功能新體驗08-22AI數(shù)學(xué)新突破:GPT-5 Pro獨立推導(dǎo)數(shù)學(xué)結(jié)論,OpenAI總裁贊其為智能新里程碑08-22
DeepSeek-V3.1發(fā)布,專為下一代國產(chǎn)芯片設(shè)計,性能大幅提升08-22AI賦能旅行社:馬蜂窩繩志成詳解智能化轉(zhuǎn)型新策略08-22OpenAI員工完成60億美元股票出售,公司估值躍升至5000億美元08-22
Lumen強化400Gbps數(shù)據(jù)中心連接,賦能AI經(jīng)濟,加速企業(yè)數(shù)字化轉(zhuǎn)型Lumen Technologies對其美國網(wǎng)絡(luò)的數(shù)據(jù)中心和云連接進(jìn)行了重大升級,通過戰(zhàn)略性擴張為大都市區(qū)提供高速數(shù)據(jù)中心連接能力。 Lumen表示,這將使客戶能夠輕松連接到數(shù)據(jù)中心和云接入點,擴展企業(yè)應(yīng)用…08-21
霄云科技銀河存儲:AI時代的高性能存儲中樞,引領(lǐng)存儲效率新革命這款專為人工智能模型訓(xùn)練、高性能計算(HPC)、生命科學(xué)等場景設(shè)計的存儲系統(tǒng),以“極速、高可用、全鏈路可視”為核心,重新定義企業(yè)級存儲的性能邊界。 ?支持百萬級IOPS與微秒級延遲,通過并行文件系統(tǒng)與IB高速…08-21點擊查看更多 +全站最新
科創(chuàng)板成長ETF開盤微漲,重倉科技股多數(shù)上揚
機器人ETF嘉實微漲開盤,重倉股表現(xiàn)各異,匯川技術(shù)、科大訊飛領(lǐng)漲
中國載人登月倒計時:2030年前穩(wěn)扎穩(wěn)打,美國阿爾忒彌斯計劃再陷困境
吉利AI座艙:讓汽車變身“智慧管家”,重構(gòu)人車交互新體驗
廣瀨電機全球首推:高電流抗振“FX31”板對板連接器,引領(lǐng)車載電子革新
百度蒸汽機2.0音視頻一體化模型升級,終結(jié)AIGC視頻“無聲時代”熱門內(nèi)容
百度Q2財報:廣告業(yè)務(wù)下滑,AI新業(yè)務(wù)成業(yè)績增長新動力
文遠(yuǎn)知行WePilot AiDrive:年內(nèi)量產(chǎn),引領(lǐng)L2級輔助駕駛新革命
文遠(yuǎn)知行WePilot AiDrive:年內(nèi)量產(chǎn),引領(lǐng)L2級輔助駕駛新紀(jì)元
AI陪伴市場升溫,雷軍馬斯克等資本大佬入局,長期記憶痛點待解
智匯教育未來:名校長共探基礎(chǔ)教育數(shù)字化變革新航向
DeepSeek-V3.1發(fā)布,專為下一代國產(chǎn)芯片設(shè)計,性能大幅提升
本文鏈接:http://m.www897cc.com/showinfo-45-26819-0.html字節(jié)跳動Seed團隊開源推理大模型,Seed-OSS系列斬獲7項SOTA成績
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com