9 月 21 日消息,在 9 月 18 日的華為全聯(lián)接大會 2025 上,華為技術(shù)有限公司與浙江大學(xué)聯(lián)合發(fā)布了國內(nèi)首個基于昇騰千卡算力平臺的 DeepSeek-R1-Safe 基礎(chǔ)大模型。

浙江大學(xué)計算機科學(xué)與技術(shù)學(xué)院院長、區(qū)塊鏈與數(shù)據(jù)安全全國重點實驗室常務(wù)副主任任奎詳細(xì)介紹了 DeepSeek-R1-Safe-671B 基礎(chǔ)大模型的核心創(chuàng)新。
據(jù)介紹,研發(fā)團(tuán)隊從底層入手,構(gòu)建了一套覆蓋“高質(zhì)量安全語料 — 平衡優(yōu)化的安全訓(xùn)練 — 全鏈路自主創(chuàng)新軟硬件平臺”的全流程安全后訓(xùn)練框架。

在算力平臺搭建方面,團(tuán)隊首次實現(xiàn)基于昇騰千卡算力平臺的千億級參數(shù)滿血版大模型安全訓(xùn)練,系統(tǒng)性地解決了訓(xùn)練環(huán)境中的關(guān)鍵問題,構(gòu)建了服務(wù)器間環(huán)境依賴同步、數(shù)據(jù)與權(quán)重共享、協(xié)同訓(xùn)練推理等一系列開發(fā)工具。
測試結(jié)果表明,DeepSeek-R1-Safe 針對有毒有害言論、政治敏感內(nèi)容、違法行為教唆等 14 個維度的普通有害問題整體防御成功率近 100%,針對情境假設(shè)、角色扮演、加密編碼等多個越獄模式整體防御成功率超過 40%。其綜合安全防御能力達(dá) 83%,在同樣測試設(shè)置下超過 Qwen-235B 和 DeepSeek-R1-671B 等多個同期模型 8% 至 15%。

此外,在 MMLU、GSM8K、CEVAL 等通用能力基準(zhǔn)測試中,DeepSeek-R1-Safe 相比于 DeepSeek-R1 的性能損耗在 1% 以內(nèi)。這些結(jié)果表明 DeepSeek-R1-Safe 不僅顯著提升了安全防護(hù)能力,也保障了模型的可用性,達(dá)成了安全能力與通用性能之間的有效平衡。

中國工程院院士陳純指出,浙江大學(xué)計算機科學(xué)與技術(shù)學(xué)院已組建起一支涵蓋多位海內(nèi)外優(yōu)秀青年人才的科研團(tuán)隊,并已成功依托昇騰生態(tài),實現(xiàn)了自主全流程后訓(xùn)練框架,完成了國內(nèi)首次千卡集群大模型安全訓(xùn)練。這次 DeepSeek-R1-Safe 的發(fā)布旨在打造安全可信的示范應(yīng)用,推動大模型安全能力與產(chǎn)業(yè)生態(tài)協(xié)同發(fā)展。他表示希望團(tuán)隊未來與華為展開更深入合作,共同推動我國 AI 技術(shù)進(jìn)步。

華為昇騰計算業(yè)務(wù)總裁張迪煊表示,華為在此次大會上也正式推出了昇騰新一代 AI 硬件與全系列軟件開源開放戰(zhàn)略,覆蓋編譯器、運行時驅(qū)動等核心組件,致力于通過深度開放協(xié)作,聯(lián)合高校與產(chǎn)業(yè)伙伴共同推動基礎(chǔ)軟件創(chuàng)新與 AI 安全能力建設(shè)。

注意到,該模型已在 ModelZoo、GitCode、GitHub、Gitee 及 ModelScope 等多個社區(qū)全面開源。
Gitee 地址:https://gitee.com/ZJUsafe/deep-seek-r1-safe。
GitHub 地址:https://github.com/ZJUAISafety/DeepSeek-R1-Safe
相關(guān)閱讀:
《DeepSeek 創(chuàng)始人梁文鋒在〈自然〉雜志回應(yīng)質(zhì)疑,R1 訓(xùn)練真 29.4 萬美金》
《DeepSeek 聲明:防范冒用“深度求索”名義實施詐騙》
《DeepSeek-R1 論文登上〈自然〉封面,通訊作者為梁文鋒》
本文鏈接:http://m.www897cc.com/showinfo-45-27942-0.html華為、浙大發(fā)布 DeepSeek-R1-Safe 基礎(chǔ)大模型:基于昇騰千卡算力平臺,破解 AI“安全與性能”難題
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 英偉達(dá)攜手OpenAI:千億美元投資助力,共筑大規(guī)模數(shù)據(jù)中心新未來
下一篇: 德國癌癥研究中心等機構(gòu)開發(fā)新型 AI 工具,可預(yù)測超 1000 種疾病風(fēng)險