當(dāng)前位置：首頁 > 元宇宙 > AI

阿里云發(fā)布通義?Qwen3-Next 基礎(chǔ)模型架構(gòu)并開源 80B-A3B 系列：改進(jìn)混合注意力機(jī)制、高稀疏度 MoE 結(jié)構(gòu)

來源：責(zé)編：時(shí)間：2025-09-15 11:46:14 59觀看

導(dǎo)讀 9 月 12 日消息，阿里云通義團(tuán)隊(duì)今日宣布推出其下一代基礎(chǔ)模型架構(gòu) Qwen3-Next，并開源了基于該架構(gòu)的 Qwen3-Next-80B-A3B 系列模型（Instruct 與 Thinking）。通義團(tuán)隊(duì)表示，Context Length Scaling 和 Total Paramet

9 月 12 日消息，阿里云通義團(tuán)隊(duì)今日宣布推出其下一代基礎(chǔ)模型架構(gòu) Qwen3-Next，并開源了基于該架構(gòu)的 Qwen3-Next-80B-A3B 系列模型（Instruct 與 Thinking）。

通義團(tuán)隊(duì)表示，Context Length Scaling 和 Total Parameter Scaling 是未來大模型發(fā)展的兩大趨勢(shì)，為了進(jìn)一步提升模型在長上下文和大規(guī)?？倕?shù)下的訓(xùn)練和推理效率，他們?cè)O(shè)計(jì)了全新的 Qwen3-Next 的模型結(jié)構(gòu)。

該結(jié)構(gòu)相比 Qwen3 的 MoE 模型結(jié)構(gòu)，進(jìn)行了以下核心改進(jìn)：混合注意力機(jī)制、高稀疏度 MoE 結(jié)構(gòu)、一系列訓(xùn)練穩(wěn)定友好的優(yōu)化，以及提升推理效率的多 token 預(yù)測(cè)機(jī)制。

基于 Qwen3-Next 的模型結(jié)構(gòu)，通義團(tuán)隊(duì)訓(xùn)練了 Qwen3-Next-80B-A3B-Base 模型，該模型擁有 800 億參數(shù)（僅激活 30 億參數(shù)）、3B 激活的超稀疏 MoE 架構(gòu)（512 專家，路由 10 個(gè) + 1 共享），結(jié)合 Hybrid Attention（Gated DeltaNet + Gated Attention）與多 Token 預(yù)測(cè)（MTP）。

從官方獲悉，該 Base 模型實(shí)現(xiàn)了與 Qwen3-32B dense 模型相近甚至略好的性能，而它的訓(xùn)練成本僅為 Qwen3-32B 的十分之一不到，在 32k 以上的上下文下的推理吞吐則是 Qwen3-32B 的十倍以上，實(shí)現(xiàn)了極致的訓(xùn)練和推理性價(jià)比。

該模型原生支持 262K 上下文，官方稱可外推至約 101 萬 tokens。據(jù)介紹，Instruct 版在若干評(píng)測(cè)中接近 Qwen3-235B，Thinking 版在部分推理任務(wù)上超過 Gemini-2.5-Flash-Thinking。

據(jù)介紹，其突破點(diǎn)在于同時(shí)實(shí)現(xiàn)了大規(guī)模參數(shù)容量、低激活開銷、長上下文處理與并行推理加速，在同類架構(gòu)中具有一定代表性。

模型權(quán)重已在 Hugging Face 以 Apache-2.0 許可發(fā)布，并可通過 Transformers、SGLang、vLLM 等框架部署；第三方平臺(tái) OpenRouter 亦已上線。

本文鏈接：http://m.www897cc.com/showinfo-45-27512-0.html阿里云發(fā)布通義?Qwen3-Next 基礎(chǔ)模型架構(gòu)并開源 80B-A3B 系列：改進(jìn)混合注意力機(jī)制、高稀疏度 MoE 結(jié)構(gòu)

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：騰訊辟謠“前 OpenAI 姚順雨上億薪資入職騰訊”

下一篇：微軟調(diào)整 Copilot 定價(jià)策略：銷售、服務(wù)、財(cái)務(wù)專屬功能不再額外收費(fèi)

標(biāo)簽：

熱門焦點(diǎn)

AI網(wǎng)紅能年賺百萬，普通人的新機(jī)會(huì)來了？

來源｜運(yùn)營研究社作者 | 張知白編輯 | 楊佩汶設(shè)計(jì) | 晏談夢(mèng)潔2023 年，數(shù)字人成為了當(dāng)紅的“流量話題”和“商業(yè)機(jī)會(huì)"。不管是 AI 孫燕姿走紅網(wǎng)絡(luò)，還是 AI 數(shù)字
人間誠實(shí)周鴻祎：360 All in 大模型的六個(gè)解讀

主筆 / 村口有牛文章架構(gòu)師 / 毛自聰出品 / 巨頭財(cái)經(jīng)5月至今，人間躁動(dòng)，各路大模型你方唱罷我登場，VC圈互聯(lián)網(wǎng)圈媒體圈已近癲狂。誰也沒想到，今日，360再度刷屏，老牌互聯(lián)網(wǎng)巨頭展現(xiàn)
FMIFAwards獎(jiǎng)項(xiàng)即將揭曉！

來源：X增強(qiáng)現(xiàn)實(shí)FMIF Awards未來元宇宙創(chuàng)新獎(jiǎng)是由未來元宇宙創(chuàng)新論壇、ARinChina以及多家投資機(jī)構(gòu)、媒體、研究院聯(lián)合發(fā)起的一項(xiàng)評(píng)選活動(dòng)。旨在推動(dòng)新技術(shù)的融合與集成低成本
Meta、谷歌、微軟競相涌入元宇宙，小型企業(yè)該如何伺機(jī)而動(dòng)？

目前來看元宇宙不會(huì)影響到小型企業(yè)的發(fā)展，但在接下來的十年內(nèi)可能會(huì)發(fā)生很多變化。很多有商業(yè)頭腦的企業(yè)家都在密切關(guān)注著元宇宙的發(fā)展。元宇宙這個(gè)詞，你一定或
影響元宇宙土地價(jià)格的五個(gè)因素

參考來源 | cryptonews編譯 | Ciel@iNFTnews.com元宇宙中的房地產(chǎn)價(jià)格主要取決于使用它的人數(shù)，以及為所有者創(chuàng)造收益的能力。專注于數(shù)字資產(chǎn)的投資公司LedgerPr
Kitten Coup社區(qū)反轉(zhuǎn)Cool Kittens NFT騙局

當(dāng)狂熱的加密愛好者將金錢投入到NFT圖片時(shí)，渾水摸魚的騙局隨之而來，Cool Kittens NFT便是其中一個(gè)作惡者，該項(xiàng)目于去年11月在Sonala鏈上啟動(dòng)小貓形象的NFT鑄造及
NFT領(lǐng)域，我們是否應(yīng)該遵守版權(quán)法

NFTs中最有爭議的因素之一是你是否真的 "擁有 "你所購買的藝術(shù)品。除此之外，圍繞著NFT行業(yè)內(nèi)的版權(quán)和知識(shí)產(chǎn)權(quán)盜竊的問題也同樣重要，因?yàn)槿藗兒苋菀渍`解這些事情
利用元宇宙平臺(tái)10天收入160萬，風(fēng)口還是虎口？

美國Meta平臺(tái)有限公司，也就是原來的臉書公司，9日宣布，公司旗下的虛擬現(xiàn)實(shí)應(yīng)用《地平線世界》正式向美國和加拿大的18歲以上人群開放。這也是目前Meta推出的最具象
Steam 禁止NFT和加密貨幣原因曝光

近日，Valve（V社）總裁Gabe Newell接受PC Gamer采訪時(shí)解釋了該平臺(tái)禁止NFT和加密貨幣的原因。早在2021年10月18日，PC Gamer就報(bào)道Steam推出的新規(guī)：使用區(qū)塊鏈或允許交

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

阿里云發(fā)布通義?Qwen3-Next 基礎(chǔ)模型架構(gòu)并開源 80B-A3B 系列：改進(jìn)混合注意力機(jī)制、高稀疏度 MoE 結(jié)構(gòu)

AI網(wǎng)紅能年賺百萬，普通人的新機(jī)會(huì)來了？

人間誠實(shí)周鴻祎：360 All in 大模型的六個(gè)解讀

FMIFAwards獎(jiǎng)項(xiàng)即將揭曉！

Meta、谷歌、微軟競相涌入元宇宙，小型企業(yè)該如何伺機(jī)而動(dòng)？

影響元宇宙土地價(jià)格的五個(gè)因素

Kitten Coup社區(qū)反轉(zhuǎn)Cool Kittens NFT騙局

NFT領(lǐng)域，我們是否應(yīng)該遵守版權(quán)法

利用元宇宙平臺(tái)10天收入160萬，風(fēng)口還是虎口？

Steam 禁止NFT和加密貨幣原因曝光

最新推薦

ChatGPT訪問量增速下滑，AI真的是一場泡沫嗎？

有人狂賺千倍，資金盤游戲日進(jìn)上億，元宇宙泡沫還能吹多久？

江西將探索成立元宇宙聯(lián)盟，韓國將加強(qiáng)對(duì)NFT和元宇宙的監(jiān)管

2022年中國元宇宙產(chǎn)業(yè)系列研究報(bào)告-基礎(chǔ)設(shè)施篇（5）

Interface正大光明的“跑路”，社區(qū)成員贊格局大

元宇宙需要的5個(gè)重要安全功能

猜你喜歡

熱門推薦

相關(guān)資訊