中國AI領域迎來歷史性時刻——DeepSeek公司憑借其R1大模型研究成果,成為首家登上《自然》雜志封面的中國AI企業。這一突破性成就標志著中國在基礎大模型研究領域正式躋身全球頂尖行列,此前僅有DeepMind憑借AlphaGo和AlphaFold獲得過同等殊榮。
最新披露的Nature版本論文首次公開了R1模型的訓練成本細節:該660億參數規模的模型僅耗資29.4萬美元(約合人民幣208萬元)完成訓練。研究團隊使用512張H800 GPU,R1-Zero訓練耗時198小時,R1訓練耗時80小時,按每GPU小時2美元的租賃價格計算得出總成本。這一數據與行業動輒千萬美元級的訓練投入形成鮮明對比,年初發布時即在美股市場引發強烈震動。
在數據構建方面,研究團隊徹底駁斥了"模型輸出循環輸入"的質疑。公開的補充材料顯示,R1訓練數據集包含五大類別:數學數據集收錄2.6萬道定量推理題(含競賽題和考試題),代碼數據集包含1.7萬道算法競賽題和8千道代碼修復問題,STEM數據集涵蓋2.2萬道物理、化學、生物選擇題,邏輯數據集包含1.5萬道真實與合成問題,通用數據集則包含6.6萬道覆蓋創意寫作、文本編輯等場景的評估題。
安全性評估體系成為另一大亮點。研究團隊構建了多維評估框架:包括官方服務風險控制系統、六個公開安全基準的橫向對比、內部安全測試集的分類學研究、多語言安全評估以及越獄攻擊魯棒性測試。評估結果顯示,R1模型基礎安全水平與GPT-4o相當,通過配套風險控制系統可進一步提升防護能力。
技術實現路徑方面,研究團隊采用純強化學習框架突破傳統依賴。以DeepSeek-V3-Base為基礎模型,通過GRPO(群體相對策略優化)算法進行數千步強化訓練,使R1-Zero在AIME 2024數學基準測試中pass@1分數從15.6%躍升至71.0%,經多數表決后更達86.7%,性能媲美OpenAI o1模型。后續推出的R1模型通過冷啟動數據、拒絕采樣、監督微調等多階段優化,解決了初始版本的可讀性和語言混合問題。
學術影響力持續發酵。截至當前統計,該研究在谷歌學術已被引用3596次,HuggingFace平臺開源模型下載量突破1090萬次(居開源模型首位),GitHub獲得9.11萬顆星標。評審專家、Hugging Face工程師Lewis Tunstall特別指出,這是首個通過同行評審的大型語言模型研究,為學術界樹立了重要標桿。俄亥俄州立大學Huan Sun教授評價稱,該研究自發布以來已實質性影響全球大模型強化學習研究方向。
開源生態建設展現中國AI新范式。研究團隊在HuggingFace平臺全面公開了R1和R1-Zero的模型權重,同步開源基于Qwen2.5和Llama3架構的蒸餾模型。這種透明化研究模式獲得國際學術界高度認可,論文特別強調的"推理模式遷移"技術,已證明可使Qwen2.5-32B等基礎模型通過知識蒸餾獲得顯著性能提升。
更多>同類資訊
華為全聯接大會2025啟幕,發布全球最強算力超節點與集群中國經濟網9月19日訊(記者 王惠綿)9月18日,華為全聯接大會2025在上海啟幕,華為副董事長、輪值董事長徐直軍發表題為“以開創的超節點互聯技術,引領AI基礎設施新范式”的主題演講,正式發布全球最強算力超節…09-19
有鹿機器人+連合直租:以智能租賃模式,開啟高端場景清潔新未來更關鍵的是,其“按有效清潔時長付費”的機制,直接將支付與效果綁定,避免了“設備閑置卻仍在折舊”的浪費,尤其適合項目制或季節性波動明顯的場景。 有鹿機器人與連合直租的組合,不僅提供了清潔問題的解決方案,更提供了…09-19
第22屆東博會AI專館“科技盛宴”:透明屏、智能裝備等展現區域合作新機遇AI透明屏產品運營經理 王晨:可以支持37種語種,它主要是為一些公共服務的窗口,比如說像機場,酒店,因為會有很多的外國游客,就可以完美地去解決溝通的問題。記者在現場注意到,除了帶著產品來的展商,不少企業還把…09-19
第22屆東博會AI閃耀:數字智能體引路 機器人文創共繪合作新篇總臺央視記者 張歆:這是一屆由人工智能賦能的全新的中國—東盟博覽會。今年中國—東盟博覽會的人工智能專館,這里也是今年首設的人工智能專館,在這里展示了最先進的智能機器人以及AI解決方案。 總臺央視記者 張歆…09-19俄羅斯2028年將發射軌道站首個艙段,為登月筑基并開發星際關鍵技術09-19寒武紀回應訂單不實傳聞:產品多行業部署,存貨增長因云端備貨09-19寒武紀2025上半年扭虧賺超10億,備26億存貨布局云端,高管詳解發展邏輯09-19
華為全聯接大會2025啟幕,發布最強算力超節點集群,為AI發展注入強勁動力09-19小紅書“重拳出擊”打擊虛假營銷,筑牢真實社區生態防線09-19
NVIDIA與Intel強強聯手:50億美元入股,共筑AI與PC新未來09-19
華為全球聯接大會2025發布重磅成果:最強算力超節點集群及昇騰芯片未來三年規劃華為發布了最新超節點產品Atlas 950 SuperPoD和Atlas 960 SuperPoD超節點,分別支持8192及15488張昇騰卡,在卡規模、總算力、內存容量、互聯帶寬等關鍵指標上全面領先,在未來…09-19
DeepSeek-R1登《自然》封面:純強化學習突破,引領大模型推理新方向訓練過程中,DeepSeek-R1-Zero展現出令人驚嘆的自我進化能力,學會了生成數百到數千個推理token,深入探索和完善思維過程,還發展出反思能力和探索不同解題方法的能力。先進行冷啟動SFT,人工篩選高…09-19
從“聯接”到“智變”:新華三以智能工廠與數智平臺賦能中國制造09-19三年半虧6億,80后博士帶隊,國星宇航赴港IPO能否“沖上云霄”?09-19
耶魯大學打造MMVU測試:AI專業視頻理解能力迎來“大考”09-19點擊查看更多 +全站最新
安科高新院智能化改造供排水系統:自動調控,動態可視,高效互聯
iPhone 17 Pro Max與16 Pro Max怎么選?性能影像價格全對比,助你挑出心頭好
Meta智能眼鏡革新:配神經腕帶無聲輸入,欲挑戰手機核心場景
小米雷軍年度演講9月或啟幕,17系列手機等新品將震撼登場
全應用實時2D轉3D技術發布,INAIR開啟隨時隨地沉浸式3D影音新體驗
黔西農產品智能發貨平臺:打破壁壘降本增效 助推縣域電商駛入快車道熱門內容
第22屆東博會AI閃耀:數字智能體引路 機器人文創共繪合作新篇
華為全聯接大會2025啟幕,發布最強算力超節點集群,為AI發展注入強勁動力
NVIDIA與Intel強強聯手:50億美元入股,共筑AI與PC新未來
華為全球聯接大會2025發布重磅成果:最強算力超節點集群及昇騰芯片未來三年規劃
DeepSeek-R1登《自然》封面:純強化學習突破,引領大模型推理新方向
從“聯接”到“智變”:新華三以智能工廠與數智平臺賦能中國制造
本文鏈接:http://m.www897cc.com/showinfo-45-27770-0.html中國大模型DeepSeek首登Nature封面,R1訓練成本僅約208萬引關注
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com