日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 元宇宙 > AI

LeCun 團(tuán)隊開源首款代碼世界模型,能像程序員一樣思考的 LLM 來了

來源: 責(zé)編: 時間:2025-09-26 17:37:53 175觀看
導(dǎo)讀 瘋狂挖人的 Meta,終于在今天發(fā)布了最新 AI 研發(fā)成果!代碼世界模型 CWM 是本次發(fā)布的模型,創(chuàng)新性地將世界模型引入了代碼生成任務(wù)中。這是否會成為編程模型新范式?瘋狂挖人的 Meta,終于把他們的 AI 研發(fā)新成果端上

瘋狂挖人的 Meta,終于在今天發(fā)布了最新 AI 研發(fā)成果!代碼世界模型 CWM 是本次發(fā)布的模型,創(chuàng)新性地將世界模型引入了代碼生成任務(wù)中。這是否會成為編程模型新范式?Y1e28資訊網(wǎng)——每日最新資訊28at.com

瘋狂挖人的 Meta,終于把他們的 AI 研發(fā)新成果端上來了!Y1e28資訊網(wǎng)——每日最新資訊28at.com

就在今天,Meta 官宣發(fā)布了一款名為代碼世界模型(Code World Model,CWM)的 LLM,探索如何使用世界模型改進(jìn) AI 代碼生成性能。Y1e28資訊網(wǎng)——每日最新資訊28at.com

Y1e28資訊網(wǎng)——每日最新資訊28at.com

Yann LeCun 也親自下場轉(zhuǎn)發(fā)撐場子了。Y1e28資訊網(wǎng)——每日最新資訊28at.com

Y1e28資訊網(wǎng)——每日最新資訊28at.com

CWM 究竟有哪些創(chuàng)新點?這個 32B 的參數(shù)相對較小的大模型,究竟有多強?Y1e28資訊網(wǎng)——每日最新資訊28at.com

CWM 創(chuàng)新點

本次發(fā)布的 CWM,最大的創(chuàng)新點是,將世界模型引入了代碼生成任務(wù)中。Y1e28資訊網(wǎng)——每日最新資訊28at.com

簡言之,該模型的核心正如 Yann LeCun 所言:生成代碼時,通過提前預(yù)測即將生成的代碼指令可能產(chǎn)生的效果,來更好地規(guī)劃出能夠滿足人類期望達(dá)成的效果的代碼,從而改進(jìn)生成代碼的質(zhì)量。Y1e28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)人類進(jìn)行規(guī)劃時,我們會設(shè)想不同行動可能產(chǎn)生的結(jié)果。Y1e28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)人類思考代碼時,會在腦海中模擬其部分執(zhí)行過程。Y1e28資訊網(wǎng)——每日最新資訊28at.com

而目前市面上的主流語言模型,還很難做到這一點。Y1e28資訊網(wǎng)——每日最新資訊28at.com

專門訓(xùn)練一個代碼世界模型,補足這一點,生成代碼的效果會不會好很多,是 Meta 要通過本次發(fā)布的 CWM 驗證的猜想。Y1e28資訊網(wǎng)——每日最新資訊28at.com

Y1e28資訊網(wǎng)——每日最新資訊28at.com

CWM 基于大量編程數(shù)據(jù),加上專門定制的 Python 和 Bash(Linux 和 macOS 的命令行解釋器腳本語言)的世界建模數(shù)據(jù),進(jìn)行該模型的訓(xùn)練。Y1e28資訊網(wǎng)——每日最新資訊28at.com

通過這種訓(xùn)練,CWM 能夠模擬 Python 程序在 Bash 環(huán)境中的執(zhí)行及與 Agent 之間的交互。Y1e28資訊網(wǎng)——每日最新資訊28at.com

對于「數(shù)數(shù) strawberry 中有多少個 r」這個難倒無數(shù)大模型的問題,CWM 也用類似 pdb(Python Debug 用的調(diào)試器)的形式演示了其工作流程:Y1e28資訊網(wǎng)——每日最新資訊28at.com

Y1e28資訊網(wǎng)——每日最新資訊28at.com

Y1e28資訊網(wǎng)——每日最新資訊28at.com

CWM 直接發(fā)布了 3 個不同的 Checkpoint,用于不同目的。Y1e28資訊網(wǎng)——每日最新資訊28at.com

Y1e28資訊網(wǎng)——每日最新資訊28at.com

Y1e28資訊網(wǎng)——每日最新資訊28at.com

CWM 性能測試

「光說不練假把式」,我們直接看看這個 32B 的小參數(shù)大模型在各類編程基準(zhǔn)測試中的表現(xiàn)如何。Y1e28資訊網(wǎng)——每日最新資訊28at.com

SWE-bench Verified 是一個真實開源項目修復(fù)的最常用的編程評測標(biāo)準(zhǔn),讓模型在真實的大型開源倉庫里,根據(jù) GitHub issue+failing tests,定位并修復(fù)缺陷,最終以自動化測試是否全部通過來判定是否解決。Y1e28資訊網(wǎng)——每日最新資訊28at.com

在該項測試中,32B 小參數(shù)的 CWM 成績?yōu)?65.8%,遜于 Qwen3-Coder 和 Kimi-K2-Instruct,與閉源的 Gemini-2.5-Thinking 接近,屬于開源陣營第一梯隊了。Y1e28資訊網(wǎng)——每日最新資訊28at.com

Y1e28資訊網(wǎng)——每日最新資訊28at.com

其他測試成績 Alexandr Wang 也直接發(fā)出來了:Y1e28資訊網(wǎng)——每日最新資訊28at.com

LiveCodeBench:68.6%Y1e28資訊網(wǎng)——每日最新資訊28at.com

Math-500:96.6%Y1e28資訊網(wǎng)——每日最新資訊28at.com

AIME 2024:76.0%Y1e28資訊網(wǎng)——每日最新資訊28at.com

Y1e28資訊網(wǎng)——每日最新資訊28at.com

CWM 模型算是 Meta 的一次概念驗證,投入了不算多的算力訓(xùn)練這個小參數(shù)大模型,主要是為了檢驗將世界模型引入代碼生成任務(wù)是否會顯著提高生成代碼質(zhì)量。Y1e28資訊網(wǎng)——每日最新資訊28at.com

換言之,我們今日看到的這個模型只能算 Demo。大的還在后面?Y1e28資訊網(wǎng)——每日最新資訊28at.com

參考資料:Y1e28資訊網(wǎng)——每日最新資訊28at.com

https://ai.meta.com/research/publications/cwm-an-open-weights-llm-for-research-on-code-generation-with-world-models/Y1e28資訊網(wǎng)——每日最新資訊28at.com

https://x.com/syhw/status/1970960837721653409Y1e28資訊網(wǎng)——每日最新資訊28at.com

https://x.com/AIatMeta/status/1970963571753222319Y1e28資訊網(wǎng)——每日最新資訊28at.com

https://x.com/ylecun/status/1970967341052854748Y1e28資訊網(wǎng)——每日最新資訊28at.com

https://x.com/alexandr_wang/status/1970973317227225433Y1e28資訊網(wǎng)——每日最新資訊28at.com

本文來自微信公眾號:新智元(ID:AI_era)Y1e28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://m.www897cc.com/showinfo-45-28128-0.htmlLeCun 團(tuán)隊開源首款代碼世界模型,能像程序員一樣思考的 LLM 來了

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI 最強 AI 智能體曝光:基于 GPT-5,輕松駕馭寫作、編程、生圖等任務(wù)

下一篇: OpenAI 最強 AI 智能體曝光:基于 GPT-5,輕松駕馭寫作、編程、生圖等任務(wù)

標(biāo)簽:
  • 熱門焦點
  • 這一超級富豪“逆襲”,身價大增4330億

    來源:侃見財經(jīng)互聯(lián)網(wǎng)的突圍沒有“終點”。在快節(jié)奏的商業(yè)環(huán)境下,不斷的試錯成了互聯(lián)網(wǎng)企業(yè)的標(biāo)配,一年一個風(fēng)口,一個風(fēng)口造就一個熱點,但是回頭來看,最終受益的還是身處
  • 游戲玩家才是最“元宇宙”的

    01元宇宙的概念,最早由科幻作家尼爾·斯蒂芬森于1992年在其著作《雪崩》中提出。它指的是一個脫胎于現(xiàn)實世界,又與現(xiàn)實世界平行、相互影響,并且始終在線的虛擬世
  • Web3 去中心化身份管理系統(tǒng)的歷史、現(xiàn)狀與展望

    身份、數(shù)字資產(chǎn)和在線資料的映射最近在區(qū)塊鏈行業(yè)獲得了極大的關(guān)注。新技術(shù)正在形成架構(gòu),這將進(jìn)一步為去中心化和以用戶為中心的機制鋪平道路。本文將討論以下
  • 2022年元宇宙系列報告:UGC當(dāng)?shù)溃琗R帶來新交互體驗

    UGC作為元宇宙的主要內(nèi)容創(chuàng)作模式,已經(jīng)越來越多的呈現(xiàn)于游戲、娛樂、社交、傳媒等方面,UGC模式勾勒了元宇宙的邊界,現(xiàn)今元宇宙UGC模式的主要呈現(xiàn)方式以元宇宙概念
  • 重溫 1602 年:DAO 是新的企業(yè)范式嗎?

    作者:Andrew Singer“ 將你的選票委托給行業(yè)有能力的專家,將使所有者在這些公司的管理中擁有更強大、更清晰的話語權(quán) 。”1602 年,荷蘭東印度公司成立,許多人認(rèn)為
  • 小眾有趣NFT藝術(shù)作品欣賞(1)

    隨著NFT發(fā)展火熱,越來越多領(lǐng)域與NFT融合,NFT藝術(shù)在加密領(lǐng)域中占據(jù)了很大一部分。NFT藝術(shù)與傳統(tǒng)藝術(shù)有相似之處,也有完全不同的地方。NFT藝術(shù)與傳統(tǒng)藝術(shù)一樣,表現(xiàn)了
  • 傳統(tǒng)互聯(lián)網(wǎng)與區(qū)塊鏈場景下數(shù)據(jù)權(quán)利法律分析

    數(shù)據(jù)權(quán)益的復(fù)雜性在于數(shù)據(jù)涉及多環(huán)節(jié)多主體、內(nèi)容不同質(zhì)且與不同場景緊密聯(lián)系、對軟硬件技術(shù)環(huán)節(jié)緊密相關(guān)等方面的復(fù)雜性。在傳統(tǒng)互聯(lián)網(wǎng)與區(qū)塊鏈模式下,數(shù)據(jù)處
  • 為什么元宇宙將永遠(yuǎn)改變體育和你的生活?

    自從Facebook更名為Meta以來,Metaverse這個詞已經(jīng)被大家所熟知。但是當(dāng)Metaverse仍然被許多人視為一個虛擬的平行世界時,一些項目已經(jīng)顯示出Metaverse將如何永遠(yuǎn)
  • FTX 加密貨幣交易所開始向游戲公司提供加密服務(wù)

    據(jù)媒體報道,業(yè)內(nèi)領(lǐng)先的加密貨幣交易所FTX宣布將涉足游戲領(lǐng)域。該公司表示,計劃推出自己的游戲部門作為中介,專注于為傳統(tǒng)游戲公司提供加密相關(guān)服務(wù)。此舉將有助于
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
久久xxxx精品视频| 国产精品人人做人人爽| 午夜精品久久久久影视| 亚洲国产天堂久久国产91| 国产一区二区精品| 国语精品中文字幕| 伊人久久大香线| 樱桃成人精品视频在线播放| 激情成人综合| 亚洲欧洲一区二区天堂久久 | 欧美一区二区高清| 性久久久久久久久| 久久精品二区三区| 久热成人在线视频| 麻豆精品视频| 欧美日韩久久不卡| 久久一区中文字幕| 欧美激情91| 欧美日韩精品不卡| 国产精品香蕉在线观看| 激情婷婷欧美| 亚洲日韩中文字幕在线播放| 一区二区三区av| 亚洲欧美成人一区二区在线电影| 在线看片成人| 亚洲国产精品久久久久婷婷老年| 夜夜爽夜夜爽精品视频| 亚洲欧美综合网| 久久久久免费视频| 久久婷婷麻豆| 欧美日韩国产精品专区| 国产精品入口夜色视频大尺度| 国产一区美女| 亚洲青涩在线| 亚洲欧美日韩中文在线制服| 久久久最新网址| 久久裸体艺术| 欧美日韩国产免费观看| 国产日本精品| 亚洲人成77777在线观看网| 亚洲一区观看| 老妇喷水一区二区三区| 欧美性大战久久久久久久| 国产亚洲亚洲| 亚洲另类黄色| 午夜亚洲精品| 欧美精品日韩综合在线| 国产伦理一区| 亚洲高清久久久| 亚洲欧美中文日韩在线| 免费人成网站在线观看欧美高清| 国产精品swag| 在线成人免费观看| 亚洲综合欧美日韩| 欧美高潮视频| 国产亚洲欧美aaaa| 国产精品99久久久久久有的能看| 久久久免费精品视频| 欧美日韩国产在线看| 国产精品网红福利| 日韩视频免费观看高清完整版| 欧美在线亚洲一区| 欧美天天视频| 亚洲高清av| 久久不见久久见免费视频1| 欧美激情综合网| 一区二区三区在线观看国产| 亚洲视频中文| 欧美国产亚洲另类动漫| 国产精品久久久久久亚洲毛片| 国产自产精品| 亚洲欧美日韩一区二区在线| 欧美日本一区二区视频在线观看 | 国产精品亚洲综合天堂夜夜| 亚洲精品一二区| 久久久久久夜| 国产日韩综合| 亚洲午夜激情网站| 欧美日韩成人一区| 亚洲欧洲偷拍精品| 毛片一区二区三区| 国产日韩在线亚洲字幕中文| 一区二区三区精密机械公司 | 女生裸体视频一区二区三区| 国产亚洲成年网址在线观看| 亚洲一区二区三区欧美 | 午夜在线视频观看日韩17c| 欧美三级电影网| 亚洲精品一区二区三区樱花 | 国产精品jvid在线观看蜜臀| 亚洲日本成人| 久久综合网络一区二区| 国产中文一区二区三区| 欧美亚洲网站| 国产九九视频一区二区三区| 亚洲一二区在线| 欧美日韩国产小视频| 亚洲美女视频网| 欧美黄色影院| 亚洲人成7777| 欧美高清在线精品一区| 亚洲国内欧美| 欧美高清视频一区二区| 91久久久国产精品| 欧美激情综合五月色丁香小说| 亚洲激情视频在线| 欧美a级在线| 亚洲欧洲三级| 欧美久久久久免费| 一个色综合导航| 欧美视频日韩视频在线观看| 在线综合视频| 欧美国产日本| 日韩午夜av在线| 免费欧美在线| 亚洲精品自在在线观看| 美女脱光内衣内裤视频久久影院| 在线观看亚洲专区| 欧美α欧美αv大片| 亚洲精品国产品国语在线app | 欧美性做爰毛片| 亚洲一区二区在线播放| 国产欧美高清| 久久国产精品一区二区三区四区| 国产夜色精品一区二区av| 久久成人免费网| 一区二区三区我不卡| 欧美高清影院| 亚洲一级在线| 国产香蕉97碰碰久久人人| 久久天天躁狠狠躁夜夜av| 亚洲福利视频在线| 欧美日韩国产不卡| 亚洲自拍三区| 国产一区二区丝袜高跟鞋图片| 玖玖玖国产精品| 一区二区免费在线观看| 国产精品久在线观看| 久久九九99| 亚洲精品男同| 国产精品久久午夜夜伦鲁鲁| 欧美一站二站| 亚洲黄网站黄| 欧美色一级片| 欧美专区亚洲专区| 91久久国产精品91久久性色| 鲁鲁狠狠狠7777一区二区| 亚洲国产精品ⅴa在线观看 | 久久久亚洲国产天美传媒修理工| 91久久国产精品91久久性色| 欧美性猛交一区二区三区精品| 亚洲精品乱码久久久久| 国产精品九色蝌蚪自拍| 久久日韩精品| 一本色道久久综合一区| 国产一区二区三区在线观看视频 | 国产人久久人人人人爽| 噜噜噜久久亚洲精品国产品小说| 亚洲国产精品久久人人爱蜜臀| 欧美新色视频| 欧美一区二区免费| 亚洲黄色大片| 欧美午夜精品久久久久久人妖 | 久久久久久穴| 日韩午夜激情| 国产性猛交xxxx免费看久久| 欧美巨乳在线| 欧美自拍偷拍午夜视频| 亚洲美女av黄| 韩国av一区二区三区在线观看| 欧美日韩高清在线观看| 亚洲视频中文| 亚洲高清视频一区| 国产麻豆综合| 欧美日韩系列| 麻豆视频一区二区| 午夜精品久久久久久久男人的天堂| 在线精品国产成人综合| 国产精品青草久久| 欧美激情一区二区三区不卡| 久久国产精品亚洲77777| 在线观看欧美激情| 国产精品一区二区三区四区 | 蜜臀久久99精品久久久久久9 | 久久婷婷色综合| 午夜精品婷婷| 夜夜爽www精品| 亚洲第一中文字幕在线观看| 国产美女诱惑一区二区| 欧美日韩亚洲网| 麻豆精品视频在线| 久久国产欧美日韩精品| 亚洲手机在线| 亚洲人体影院| 伊人蜜桃色噜噜激情综合| 国产欧美一级| 国产日韩欧美三级| 国产日产亚洲精品| 国产日韩欧美在线观看| 国产视频一区欧美| 国语对白精品一区二区| 曰韩精品一区二区| 亚洲国产成人久久综合| 亚洲国产精品99久久久久久久久|