當前位置：首頁 > 元宇宙 > AI

LeCun 團隊開源首款代碼世界模型，能像程序員一樣思考的 LLM 來了

來源：責編：時間：2025-09-26 17:37:53 149觀看

導讀瘋狂挖人的 Meta，終于在今天發(fā)布了最新 AI 研發(fā)成果！代碼世界模型 CWM 是本次發(fā)布的模型，創(chuàng)新性地將世界模型引入了代碼生成任務中。這是否會成為編程模型新范式？瘋狂挖人的 Meta，終于把他們的 AI 研發(fā)新成果端上

瘋狂挖人的 Meta，終于在今天發(fā)布了最新 AI 研發(fā)成果！代碼世界模型 CWM 是本次發(fā)布的模型，創(chuàng)新性地將世界模型引入了代碼生成任務中。這是否會成為編程模型新范式？

瘋狂挖人的 Meta，終于把他們的 AI 研發(fā)新成果端上來了！

就在今天，Meta 官宣發(fā)布了一款名為代碼世界模型（Code World Model，CWM）的 LLM，探索如何使用世界模型改進 AI 代碼生成性能。

Yann LeCun 也親自下場轉發(fā)撐場子了。

CWM 究竟有哪些創(chuàng)新點？這個 32B 的參數相對較小的大模型，究竟有多強？

CWM 創(chuàng)新點

本次發(fā)布的 CWM，最大的創(chuàng)新點是，將世界模型引入了代碼生成任務中。

簡言之，該模型的核心正如 Yann LeCun 所言：生成代碼時，通過提前預測即將生成的代碼指令可能產生的效果，來更好地規(guī)劃出能夠滿足人類期望達成的效果的代碼，從而改進生成代碼的質量。

當人類進行規(guī)劃時，我們會設想不同行動可能產生的結果。

當人類思考代碼時，會在腦海中模擬其部分執(zhí)行過程。

而目前市面上的主流語言模型，還很難做到這一點。

專門訓練一個代碼世界模型，補足這一點，生成代碼的效果會不會好很多，是 Meta 要通過本次發(fā)布的 CWM 驗證的猜想。

CWM 基于大量編程數據，加上專門定制的 Python 和 Bash（Linux 和 macOS 的命令行解釋器腳本語言）的世界建模數據，進行該模型的訓練。

通過這種訓練，CWM 能夠模擬 Python 程序在 Bash 環(huán)境中的執(zhí)行及與 Agent 之間的交互。

對于「數數 strawberry 中有多少個 r」這個難倒無數大模型的問題，CWM 也用類似 pdb（Python Debug 用的調試器）的形式演示了其工作流程：

CWM 直接發(fā)布了 3 個不同的 Checkpoint，用于不同目的。

CWM 性能測試

「光說不練假把式」，我們直接看看這個 32B 的小參數大模型在各類編程基準測試中的表現如何。

SWE-bench Verified 是一個真實開源項目修復的最常用的編程評測標準，讓模型在真實的大型開源倉庫里，根據 GitHub issue+failing tests，定位并修復缺陷，最終以自動化測試是否全部通過來判定是否解決。

在該項測試中，32B 小參數的 CWM 成績?yōu)?65.8%，遜于 Qwen3-Coder 和 Kimi-K2-Instruct，與閉源的 Gemini-2.5-Thinking 接近，屬于開源陣營第一梯隊了。

其他測試成績 Alexandr Wang 也直接發(fā)出來了：

LiveCodeBench：68.6%

Math-500：96.6%

AIME 2024：76.0%

CWM 模型算是 Meta 的一次概念驗證，投入了不算多的算力訓練這個小參數大模型，主要是為了檢驗將世界模型引入代碼生成任務是否會顯著提高生成代碼質量。

換言之，我們今日看到的這個模型只能算 Demo。大的還在后面？

參考資料：

https://ai.meta.com/research/publications/cwm-an-open-weights-llm-for-research-on-code-generation-with-world-models/

https://x.com/syhw/status/1970960837721653409

https://x.com/AIatMeta/status/1970963571753222319

https://x.com/ylecun/status/1970967341052854748

https://x.com/alexandr_wang/status/1970973317227225433

本文來自微信公眾號：新智元（ID：AI_era）

本文鏈接：http://m.www897cc.com/showinfo-45-28131-0.htmlLeCun 團隊開源首款代碼世界模型，能像程序員一樣思考的 LLM 來了

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：京東探索研究院升級，劉強東將親自擔任院長

下一篇： OpenAI 最強 AI 智能體曝光：基于 GPT-5，輕松駕馭寫作、編程、生圖等任務

標簽：

熱門焦點

風口已至，多領域平臺融入社交元素！

在眾多領域平臺中，社交元素都扮演著重要角色，如直播營銷帶貨、線上配對聽歌、游戲局內互動等。隨著元宇宙時代的來臨，社交產品不斷升級，社交元素推動流量變現，多平臺領域融入社交
大廠元宇宙，又菜又愛玩

撰文 | 吳先之編輯 | 王潘當下所有大廠推出的元宇宙產品，所能帶來的沉浸式體驗并不多，好在國內外科技巨頭在bug方面都處在同一水平線。以Meta為例，由于VR頭顯設
元宇宙將會如何塑造未來的工作方式？

科幻小說家尼爾·斯蒂芬森 (Neal Stephenson) 在1992年就創(chuàng)造了“元宇宙”一詞，但事實上，在Facebook將其更名為Meta以反映其將這一科幻愿景變?yōu)楝F實的戰(zhàn)略重點之
8個最適合藝術家發(fā)行NFT的交易市場

近年來，加密風靡全球。加密圈最令人興奮的方面之一是它能夠用于創(chuàng)建稱為NFT 的數字資產。從 CyberKitties 到 Cyber Galleries，NFT 已成為藝術家和藝術鑒賞家的
2021年中國元宇宙行業(yè)用戶行為分析熱點報告

元宇宙網絡熱度高漲，中國網民對虛擬生態(tài)興趣濃厚。艾媒咨詢數據顯示，超六成的網民對“元宇宙”了解程度較高，在元宇宙較基礎的游戲領域，超九成的人對VR游戲更感興
吸金31億美元，誰在催火2021年的鏈游？

2021年究竟發(fā)生了什么，才使得鏈游領域在這年一飛沖天？作者：廖羽2022年2月16日，Invest Game發(fā)布《2021年全球游戲投資報告》，報告顯示，游戲行業(yè)的投資重點正在向區(qū)塊
紐約街頭出現NFT自動販賣機

一家初創(chuàng)公司宣布在紐約市開放一臺NFT自動售貨機，允許任何人——即使是沒有加密資產的人也能購買NFT。該交易平臺名為Neon，上個月完成了一輪300萬美元的種子募捐
利用元宇宙平臺10天收入160萬，風口還是虎口？

美國Meta平臺有限公司，也就是原來的臉書公司，9日宣布，公司旗下的虛擬現實應用《地平線世界》正式向美國和加拿大的18歲以上人群開放。這也是目前Meta推出的最具象
淺聊DAO圖景和未來

DAO是什么？DAO (Decentralized Autonomous Organizations),去中心化自治組織，是基于區(qū)塊鏈技術，由社區(qū)通過透明的決策過程運行和管理的組織形態(tài)。DAO使得社區(qū)成為

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

LeCun 團隊開源首款代碼世界模型，能像程序員一樣思考的 LLM 來了

風口已至，多領域平臺融入社交元素！

大廠元宇宙，又菜又愛玩

元宇宙將會如何塑造未來的工作方式？

8個最適合藝術家發(fā)行NFT的交易市場

2021年中國元宇宙行業(yè)用戶行為分析熱點報告

吸金31億美元，誰在催火2021年的鏈游？

紐約街頭出現NFT自動販賣機

利用元宇宙平臺10天收入160萬，風口還是虎口？

淺聊DAO圖景和未來

最新推薦

風口已至，多領域平臺融入社交元素！

“任何國產元宇宙都是假元宇宙”

從英式拍到荷蘭拍，看傳統金融拍賣玩法如何玩轉NFT市場交易

Meta 呼吁行業(yè)合作建立元宇宙網絡基礎設施

虛擬人的3大紀律和6種品牌孵化模式

Ceramic：為Web3.0社交應用打造的中間件

猜你喜歡

熱門推薦

相關資訊