當前位置：首頁 > 元宇宙 > AI

中國大模型DeepSeek首登Nature封面，R1訓練成本僅約208萬引關注

來源：責編：時間：2025-09-19 17:57:33 52觀看

導讀中國AI領域迎來歷史性時刻——DeepSeek公司憑借其R1大模型研究成果，成為首家登上《自然》雜志封面的中國AI企業。這一突破性成就標志著中國在基礎大模型研究領域正式躋身全球頂尖行列，此前僅有DeepMind憑借AlphaGo和Alp

中國AI領域迎來歷史性時刻——DeepSeek公司憑借其R1大模型研究成果，成為首家登上《自然》雜志封面的中國AI企業。這一突破性成就標志著中國在基礎大模型研究領域正式躋身全球頂尖行列，此前僅有DeepMind憑借AlphaGo和AlphaFold獲得過同等殊榮。

最新披露的Nature版本論文首次公開了R1模型的訓練成本細節：該660億參數規模的模型僅耗資29.4萬美元（約合人民幣208萬元）完成訓練。研究團隊使用512張H800 GPU，R1-Zero訓練耗時198小時，R1訓練耗時80小時，按每GPU小時2美元的租賃價格計算得出總成本。這一數據與行業動輒千萬美元級的訓練投入形成鮮明對比，年初發布時即在美股市場引發強烈震動。

在數據構建方面，研究團隊徹底駁斥了"模型輸出循環輸入"的質疑。公開的補充材料顯示，R1訓練數據集包含五大類別：數學數據集收錄2.6萬道定量推理題（含競賽題和考試題），代碼數據集包含1.7萬道算法競賽題和8千道代碼修復問題，STEM數據集涵蓋2.2萬道物理、化學、生物選擇題，邏輯數據集包含1.5萬道真實與合成問題，通用數據集則包含6.6萬道覆蓋創意寫作、文本編輯等場景的評估題。

安全性評估體系成為另一大亮點。研究團隊構建了多維評估框架：包括官方服務風險控制系統、六個公開安全基準的橫向對比、內部安全測試集的分類學研究、多語言安全評估以及越獄攻擊魯棒性測試。評估結果顯示，R1模型基礎安全水平與GPT-4o相當，通過配套風險控制系統可進一步提升防護能力。

技術實現路徑方面，研究團隊采用純強化學習框架突破傳統依賴。以DeepSeek-V3-Base為基礎模型，通過GRPO（群體相對策略優化）算法進行數千步強化訓練，使R1-Zero在AIME 2024數學基準測試中pass@1分數從15.6%躍升至71.0%，經多數表決后更達86.7%，性能媲美OpenAI o1模型。后續推出的R1模型通過冷啟動數據、拒絕采樣、監督微調等多階段優化，解決了初始版本的可讀性和語言混合問題。

學術影響力持續發酵。截至當前統計，該研究在谷歌學術已被引用3596次，HuggingFace平臺開源模型下載量突破1090萬次（居開源模型首位），GitHub獲得9.11萬顆星標。評審專家、Hugging Face工程師Lewis Tunstall特別指出，這是首個通過同行評審的大型語言模型研究，為學術界樹立了重要標桿。俄亥俄州立大學Huan Sun教授評價稱，該研究自發布以來已實質性影響全球大模型強化學習研究方向。

開源生態建設展現中國AI新范式。研究團隊在HuggingFace平臺全面公開了R1和R1-Zero的模型權重，同步開源基于Qwen2.5和Llama3架構的蒸餾模型。這種透明化研究模式獲得國際學術界高度認可，論文特別強調的"推理模式遷移"技術，已證明可使Qwen2.5-32B等基礎模型通過知識蒸餾獲得顯著性能提升。

更多>同類資訊

華為全聯接大會2025啟幕，發布全球最強算力超節點與集群中國經濟網9月19日訊（記者王惠綿）9月18日，華為全聯接大會2025在上海啟幕，華為副董事長、輪值董事長徐直軍發表題為“以開創的超節點互聯技術，引領AI基礎設施新范式”的主題演講，正式發布全球最強算力超節…09-19

有鹿機器人+連合直租：以智能租賃模式，開啟高端場景清潔新未來更關鍵的是，其“按有效清潔時長付費”的機制，直接將支付與效果綁定，避免了“設備閑置卻仍在折舊”的浪費，尤其適合項目制或季節性波動明顯的場景。有鹿機器人與連合直租的組合，不僅提供了清潔問題的解決方案，更提供了…09-19

第22屆東博會AI專館“科技盛宴”：透明屏、智能裝備等展現區域合作新機遇AI透明屏產品運營經理王晨：可以支持37種語種，它主要是為一些公共服務的窗口，比如說像機場，酒店，因為會有很多的外國游客，就可以完美地去解決溝通的問題。記者在現場注意到，除了帶著產品來的展商，不少企業還把…09-19

第22屆東博會AI閃耀：數字智能體引路機器人文創共繪合作新篇總臺央視記者張歆：這是一屆由人工智能賦能的全新的中國—東盟博覽會。今年中國—東盟博覽會的人工智能專館，這里也是今年首設的人工智能專館，在這里展示了最先進的智能機器人以及AI解決方案。總臺央視記者張歆…09-19俄羅斯2028年將發射軌道站首個艙段，為登月筑基并開發星際關鍵技術09-19寒武紀回應訂單不實傳聞：產品多行業部署，存貨增長因云端備貨09-19寒武紀2025上半年扭虧賺超10億，備26億存貨布局云端，高管詳解發展邏輯09-19

華為全聯接大會2025啟幕，發布最強算力超節點集群，為AI發展注入強勁動力09-19小紅書“重拳出擊”打擊虛假營銷，筑牢真實社區生態防線09-19

NVIDIA與Intel強強聯手：50億美元入股，共筑AI與PC新未來09-19

華為全球聯接大會2025發布重磅成果：最強算力超節點集群及昇騰芯片未來三年規劃華為發布了最新超節點產品Atlas 950 SuperPoD和Atlas 960 SuperPoD超節點，分別支持8192及15488張昇騰卡，在卡規模、總算力、內存容量、互聯帶寬等關鍵指標上全面領先，在未來…09-19

DeepSeek-R1登《自然》封面：純強化學習突破，引領大模型推理新方向訓練過程中，DeepSeek-R1-Zero展現出令人驚嘆的自我進化能力，學會了生成數百到數千個推理token，深入探索和完善思維過程，還發展出反思能力和探索不同解題方法的能力。先進行冷啟動SFT，人工篩選高…09-19

從“聯接”到“智變”：新華三以智能工廠與數智平臺賦能中國制造09-19三年半虧6億，80后博士帶隊，國星宇航赴港IPO能否“沖上云霄”？09-19

耶魯大學打造MMVU測試：AI專業視頻理解能力迎來“大考”09-19點擊查看更多 +全站最新

安科高新院智能化改造供排水系統：自動調控，動態可視，高效互聯

iPhone 17 Pro Max與16 Pro Max怎么選？性能影像價格全對比，助你挑出心頭好

Meta智能眼鏡革新：配神經腕帶無聲輸入，欲挑戰手機核心場景

小米雷軍年度演講9月或啟幕，17系列手機等新品將震撼登場

全應用實時2D轉3D技術發布，INAIR開啟隨時隨地沉浸式3D影音新體驗黔西農產品智能發貨平臺：打破壁壘降本增效助推縣域電商駛入快車道

黔西農產品智能發貨平臺：打破壁壘降本增效助推縣域電商駛入快車道熱門內容

熱度攀升！千億科技龍頭頻獲機構調研，業務增長透露哪些行業新動向？
蘋果加速AI布局，或收購兩家法國AI初創企業
DeepSeek V3.1大模型升級，適配國產新芯片，性能顯著提升
蘋果秋季發布會亮相iPhone 17系列："史上最薄"Air登場，Pro Max 2TB版定價17999元
?小米16系列或提前登場，首發驍龍8 Elite Gen5，9月機圈大戰一觸即發?
國金證券：A股第三輪重估腳步臨近，三類資產投資方向值得關注
蘋果加速布局中國市場！Apple Intelligence和新版Siri或年底至明年上線
蘋果AI布局加速，或將斥巨資收購歐洲兩大AI初創企業
紅米Note15系列前瞻：7s芯片、7000mAh大電池，防水新標桿即將登場
WAVE SUMMIT大會新動態：文心大模型X1.1上線，多項能力顯著躍升
華為智能手表登頂全球，蘋果需直面挑戰求變革
?字節跳動千人芯片團隊架構調整，轉至新加坡子公司Picoheart引關注?
科創板AI基金8月22日凈值飆升7.79%，重倉股表現搶眼
vivo X300系列新機入網：首發LYT-828+2億像素，衛通版支持北斗衛星短信
華為云重組風暴：多部門整合，聚焦AI領域引發關注

本欄最新

第22屆東博會AI閃耀：數字智能體引路機器人文創共繪合作新篇

華為全聯接大會2025啟幕，發布最強算力超節點集群，為AI發展注入強勁動力

NVIDIA與Intel強強聯手：50億美元入股，共筑AI與PC新未來

華為全球聯接大會2025發布重磅成果：最強算力超節點集群及昇騰芯片未來三年規劃

DeepSeek-R1登《自然》封面：純強化學習突破，引領大模型推理新方向

從“聯接”到“智變”：新華三以智能工廠與數智平臺賦能中國制造

本文鏈接：http://m.www897cc.com/showinfo-45-27770-0.html中國大模型DeepSeek首登Nature封面，R1訓練成本僅約208萬引關注

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： ?DeepSeek-R1模型研究登《自然》封面：AI推理能力獲突破性進展?

下一篇：華為全聯接大會2025啟幕，發布全球最強算力超節點與集群

標簽：

熱門焦點

歐盟人工智能法案：四種AI系統風險類型的劃分及監管措施

作者：趙志東蔡佳雯來源：區塊鏈日報該法案采用風險分級的規制路徑，將人工智能系統的風險劃分成不可接受的風險、高風險、有限風險和輕微風險四種類型，并針對不同類型施加了不同
【東方證券】虛擬世界照進現實，元宇宙中有什么？ | 元宇宙Meta洞見

元宇宙的表現形式大多以游戲為起點，并逐漸整合互聯網、數字化娛樂、社交網絡等功能，長期來看甚至可以整合社會經濟與商業活動。元宇宙的發展最關鍵的部分在于元
“任何國產元宇宙都是假元宇宙”

上個月，華語樂壇的優質偶像之一，DOTA2資深玩家林俊杰，在國外元宇宙產品分布式大陸(Decentraland)上買了三塊虛擬地產，花了12.3萬美元（也就是人民幣接近80萬）。截至目
江西將探索成立元宇宙聯盟，韓國將加強對NFT和元宇宙的監管

《元宇宙新鮮事》有：江西將探索成立元宇宙聯盟，支持南昌規劃建設元宇宙試驗區；韓國金融監督局將加強對NFT和元宇宙的監管；任天堂社長表示暫時不打算加入元宇宙。【
中國銀保監管委提示：謹慎投資，勿做接盤俠

中國銀保監管委，發布一則風險提示，內容圍繞防范以“元宇宙”名義進行的非法集資風險。原文如下：近期，一些不法分子蹭熱點，以“元宇宙投資項目”“元宇宙鏈游”等名
紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

2 月 22 日，紐約證券交易所 (NYSE) 的母公司洲際交易所 (ICE) 宣布，它將持有私人數字證券市場 tZERO 的所有權。根據公告，ICE 將成為 tZero 的“重要”少數股東，但
a16z：元宇宙辦公會取代實體辦公室嗎？

6位不同的專家對未來的工作發表看法----元宇宙--沉浸式的、基于區塊鏈的虛擬世界，大多數日常活動最終會在這里發生--但仍然只是一個概念。但它是一個擁有寶貴不
NFTs正迎來數十億美元的繁榮--NFT零工經濟從業者開始暴賺

當Stefan Prodanovic在13歲時開始嘗試平面設計，與一位從事編程工作的學校朋友共同創作數字游戲時，他從未料到這個愛好會在他成年后變成一個相當有利可圖的生意。
元宇宙收割了誰

作者：曉宇資本將元宇宙看作下一代互聯網的門票，畫大餅、割韭菜就成了一大選項。2021年被稱為元宇宙元年。在這一年里，先是號稱元宇宙第一股的沙盒游戲Roblox盛裝

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

中國大模型DeepSeek首登Nature封面，R1訓練成本僅約208萬引關注

歐盟人工智能法案：四種AI系統風險類型的劃分及監管措施

【東方證券】虛擬世界照進現實，元宇宙中有什么？ | 元宇宙Meta洞見

“任何國產元宇宙都是假元宇宙”

江西將探索成立元宇宙聯盟，韓國將加強對NFT和元宇宙的監管

中國銀保監管委提示：謹慎投資，勿做接盤俠

紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

a16z：元宇宙辦公會取代實體辦公室嗎？

NFTs正迎來數十億美元的繁榮--NFT零工經濟從業者開始暴賺

元宇宙收割了誰

最新推薦

10億基金，李彥宏呼喚下一個AI獨角獸

避坑指南：遠離具有這些特性的NFT

元宇宙是推動NFT發展的初始家園

量子計算在未來能否提高區塊鏈技術的效率

對諷刺無動于衷，Nori將碳市場放在區塊鏈上

盤點9個主流元宇宙平臺，你都知道哪些？

猜你喜歡

熱門推薦

相關資訊