日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 元宇宙 > AI

LeCun 團(tuán)隊(duì)開源首款代碼世界模型,能像程序員一樣思考的 LLM 來了

來源: 責(zé)編: 時間:2025-09-26 17:37:53 440觀看
導(dǎo)讀 瘋狂挖人的 Meta,終于在今天發(fā)布了最新 AI 研發(fā)成果!代碼世界模型 CWM 是本次發(fā)布的模型,創(chuàng)新性地將世界模型引入了代碼生成任務(wù)中。這是否會成為編程模型新范式?瘋狂挖人的 Meta,終于把他們的 AI 研發(fā)新成果端上

瘋狂挖人的 Meta,終于在今天發(fā)布了最新 AI 研發(fā)成果!代碼世界模型 CWM 是本次發(fā)布的模型,創(chuàng)新性地將世界模型引入了代碼生成任務(wù)中。這是否會成為編程模型新范式?cQm28資訊網(wǎng)——每日最新資訊28at.com

瘋狂挖人的 Meta,終于把他們的 AI 研發(fā)新成果端上來了!cQm28資訊網(wǎng)——每日最新資訊28at.com

就在今天,Meta 官宣發(fā)布了一款名為代碼世界模型(Code World Model,CWM)的 LLM,探索如何使用世界模型改進(jìn) AI 代碼生成性能。cQm28資訊網(wǎng)——每日最新資訊28at.com

cQm28資訊網(wǎng)——每日最新資訊28at.com

Yann LeCun 也親自下場轉(zhuǎn)發(fā)撐場子了。cQm28資訊網(wǎng)——每日最新資訊28at.com

cQm28資訊網(wǎng)——每日最新資訊28at.com

CWM 究竟有哪些創(chuàng)新點(diǎn)?這個 32B 的參數(shù)相對較小的大模型,究竟有多強(qiáng)?cQm28資訊網(wǎng)——每日最新資訊28at.com

CWM 創(chuàng)新點(diǎn)

本次發(fā)布的 CWM,最大的創(chuàng)新點(diǎn)是,將世界模型引入了代碼生成任務(wù)中。cQm28資訊網(wǎng)——每日最新資訊28at.com

簡言之,該模型的核心正如 Yann LeCun 所言:生成代碼時,通過提前預(yù)測即將生成的代碼指令可能產(chǎn)生的效果,來更好地規(guī)劃出能夠滿足人類期望達(dá)成的效果的代碼,從而改進(jìn)生成代碼的質(zhì)量。cQm28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)人類進(jìn)行規(guī)劃時,我們會設(shè)想不同行動可能產(chǎn)生的結(jié)果。cQm28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)人類思考代碼時,會在腦海中模擬其部分執(zhí)行過程。cQm28資訊網(wǎng)——每日最新資訊28at.com

而目前市面上的主流語言模型,還很難做到這一點(diǎn)。cQm28資訊網(wǎng)——每日最新資訊28at.com

專門訓(xùn)練一個代碼世界模型,補(bǔ)足這一點(diǎn),生成代碼的效果會不會好很多,是 Meta 要通過本次發(fā)布的 CWM 驗(yàn)證的猜想。cQm28資訊網(wǎng)——每日最新資訊28at.com

cQm28資訊網(wǎng)——每日最新資訊28at.com

CWM 基于大量編程數(shù)據(jù),加上專門定制的 Python 和 Bash(Linux 和 macOS 的命令行解釋器腳本語言)的世界建模數(shù)據(jù),進(jìn)行該模型的訓(xùn)練。cQm28資訊網(wǎng)——每日最新資訊28at.com

通過這種訓(xùn)練,CWM 能夠模擬 Python 程序在 Bash 環(huán)境中的執(zhí)行及與 Agent 之間的交互。cQm28資訊網(wǎng)——每日最新資訊28at.com

對于「數(shù)數(shù) strawberry 中有多少個 r」這個難倒無數(shù)大模型的問題,CWM 也用類似 pdb(Python Debug 用的調(diào)試器)的形式演示了其工作流程:cQm28資訊網(wǎng)——每日最新資訊28at.com

cQm28資訊網(wǎng)——每日最新資訊28at.com

cQm28資訊網(wǎng)——每日最新資訊28at.com

CWM 直接發(fā)布了 3 個不同的 Checkpoint,用于不同目的。cQm28資訊網(wǎng)——每日最新資訊28at.com

cQm28資訊網(wǎng)——每日最新資訊28at.com

cQm28資訊網(wǎng)——每日最新資訊28at.com

CWM 性能測試

「光說不練假把式」,我們直接看看這個 32B 的小參數(shù)大模型在各類編程基準(zhǔn)測試中的表現(xiàn)如何。cQm28資訊網(wǎng)——每日最新資訊28at.com

SWE-bench Verified 是一個真實(shí)開源項(xiàng)目修復(fù)的最常用的編程評測標(biāo)準(zhǔn),讓模型在真實(shí)的大型開源倉庫里,根據(jù) GitHub issue+failing tests,定位并修復(fù)缺陷,最終以自動化測試是否全部通過來判定是否解決。cQm28資訊網(wǎng)——每日最新資訊28at.com

在該項(xiàng)測試中,32B 小參數(shù)的 CWM 成績?yōu)?65.8%,遜于 Qwen3-Coder 和 Kimi-K2-Instruct,與閉源的 Gemini-2.5-Thinking 接近,屬于開源陣營第一梯隊(duì)了。cQm28資訊網(wǎng)——每日最新資訊28at.com

cQm28資訊網(wǎng)——每日最新資訊28at.com

其他測試成績 Alexandr Wang 也直接發(fā)出來了:cQm28資訊網(wǎng)——每日最新資訊28at.com

LiveCodeBench:68.6%cQm28資訊網(wǎng)——每日最新資訊28at.com

Math-500:96.6%cQm28資訊網(wǎng)——每日最新資訊28at.com

AIME 2024:76.0%cQm28資訊網(wǎng)——每日最新資訊28at.com

cQm28資訊網(wǎng)——每日最新資訊28at.com

CWM 模型算是 Meta 的一次概念驗(yàn)證,投入了不算多的算力訓(xùn)練這個小參數(shù)大模型,主要是為了檢驗(yàn)將世界模型引入代碼生成任務(wù)是否會顯著提高生成代碼質(zhì)量。cQm28資訊網(wǎng)——每日最新資訊28at.com

換言之,我們今日看到的這個模型只能算 Demo。大的還在后面?cQm28資訊網(wǎng)——每日最新資訊28at.com

參考資料:cQm28資訊網(wǎng)——每日最新資訊28at.com

https://ai.meta.com/research/publications/cwm-an-open-weights-llm-for-research-on-code-generation-with-world-models/cQm28資訊網(wǎng)——每日最新資訊28at.com

https://x.com/syhw/status/1970960837721653409cQm28資訊網(wǎng)——每日最新資訊28at.com

https://x.com/AIatMeta/status/1970963571753222319cQm28資訊網(wǎng)——每日最新資訊28at.com

https://x.com/ylecun/status/1970967341052854748cQm28資訊網(wǎng)——每日最新資訊28at.com

https://x.com/alexandr_wang/status/1970973317227225433cQm28資訊網(wǎng)——每日最新資訊28at.com

本文來自微信公眾號:新智元(ID:AI_era)cQm28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://m.www897cc.com/showinfo-45-28120-0.htmlLeCun 團(tuán)隊(duì)開源首款代碼世界模型,能像程序員一樣思考的 LLM 來了

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 上海AI實(shí)驗(yàn)室創(chuàng)新:借學(xué)術(shù)講座打造AI研究助手評測新基準(zhǔn)

下一篇: OpenAI 最強(qiáng) AI 智能體曝光:基于 GPT-5,輕松駕馭寫作、編程、生圖等任務(wù)

標(biāo)簽:
  • 熱門焦點(diǎn)
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
亚洲在线网站| 亚洲国产三级网| 国产精品国码视频| 国产精品国产三级欧美二区| 国产精品高潮久久| 国产日韩综合| 欧美成人精品激情在线观看| 欧美激情四色| 国产精品色一区二区三区| 国产在线播放一区二区三区| 亚洲第一视频网站| 一区二区三区精密机械公司 | 尤物精品在线| 亚洲精品精选| 亚洲免费视频网站| 亚洲午夜日本在线观看| 欧美自拍偷拍| 欧美日韩1区2区| 国产色产综合色产在线视频| 亚洲人成欧美中文字幕| 亚洲免费在线观看视频| 蜜臀a∨国产成人精品| 久久资源在线| 免费日韩视频| 国产精品免费一区豆花| 在线观看一区视频| 亚洲视频免费观看| 久久久久国产精品午夜一区| 久久久久综合网| 巨胸喷奶水www久久久免费动漫| 久久久水蜜桃av免费网站| 欧美激情亚洲一区| 国产欧美一区二区三区在线老狼| 国产欧美在线观看| 亚洲黄色视屏| 欧美诱惑福利视频| 乱中年女人伦av一区二区| 欧美亚洲成人网| 亚洲国产清纯| 欧美在线观看一二区| 欧美日韩在线播放三区| 国产精品二区影院| 亚洲福利视频一区| 欧美一区二区日韩| 欧美日韩在线不卡一区| 亚洲电影免费| 99re6这里只有精品| 亚洲视频一起| 老色批av在线精品| 国产色产综合色产在线视频| 一区二区三区 在线观看视| 午夜精品视频| 欧美日韩亚洲综合| 亚洲国产影院| 久久久欧美一区二区| 国产精品日本欧美一区二区三区| 国产一区91精品张津瑜| 999亚洲国产精| 欧美国产日产韩国视频| 国产精品蜜臀在线观看| 国内精品99| 午夜亚洲激情| 国产精品区一区二区三| 一区精品在线播放| 午夜欧美理论片| 欧美系列电影免费观看| 99精品国产99久久久久久福利| 性欧美videos另类喷潮| 欧美99在线视频观看| 国产综合久久久久影院| 欧美一区二区三区视频在线| 国产精品福利在线观看| 激情小说另类小说亚洲欧美| 性娇小13――14欧美| 国产精品日韩电影| 亚洲免费一区二区| 国产精品高潮呻吟久久| 亚洲视频欧美视频| 欧美视频在线观看| 在线一区二区三区四区| 久久在线视频在线| 国产精品嫩草影院av蜜臀| 一区二区黄色| 国产精品白丝jk黑袜喷水| 一区二区欧美亚洲| 欧美日韩在线看| 一本色道**综合亚洲精品蜜桃冫| 欧美一区二区高清在线观看| 国产精品私房写真福利视频| 亚洲自拍16p| 国产精品嫩草影院一区二区| 亚洲免费一级电影| 国产日韩欧美黄色| 久久精品一区二区| 国产精品日韩欧美| 99re6热只有精品免费观看| 久久一二三四| 亚洲高清成人| 欧美高清视频在线| 9色精品在线| 国产精品久久久久一区二区| 亚洲精品视频啊美女在线直播| 欧美在线视频网站| 国产午夜精品美女毛片视频| 久久精品国产一区二区三区免费看| 欧美亚洲成人免费| 亚洲欧美精品在线观看| 欧美日韩伦理在线| 亚洲午夜激情| 国产日韩欧美制服另类| 久久久人人人| 亚洲精华国产欧美| 欧美视频在线免费看| 亚洲女人小视频在线观看| 国产日韩一区二区三区在线| 久久久久青草大香线综合精品| 国产美女精品| 久久久久九九视频| 亚洲日本欧美日韩高观看| 欧美日韩国产在线观看| 亚洲三级免费| 国产精品多人| 亚洲视频1区2区| 国产欧美一区二区精品性| 老司机精品福利视频| 在线性视频日韩欧美| 国产视频精品xxxx| 欧美jizzhd精品欧美巨大免费| 在线视频观看日韩| 欧美日本网站| 午夜一区二区三区不卡视频| 国产精品欧美日韩| 久久亚洲精品伦理| 亚洲国产精品成人综合色在线婷婷| 久久综合九色| 一本久久综合亚洲鲁鲁| 国产精品视频一| 免费黄网站欧美| 亚洲一区二区在线观看视频| 激情五月综合色婷婷一区二区| 久久久久综合网| 亚洲理论在线观看| 国产亚洲精品一区二区| 欧美大片免费看| 午夜综合激情| 亚洲精品国产无天堂网2021| 国产农村妇女精品| 欧美国产在线观看| 欧美在线你懂的| 一本色道久久| 影音先锋亚洲一区| 国产精品午夜国产小视频| 欧美成人免费一级人片100| 午夜精品一区二区三区四区| 韩国成人理伦片免费播放| 欧美美女操人视频| 久久精品理论片| 亚洲深夜福利视频| 亚洲国产精品一区二区第一页| 欧美激情一区二区在线| 洋洋av久久久久久久一区| 国产精品高清在线| 性色av一区二区三区| 国内精品**久久毛片app| 欧美日韩综合在线免费观看| 久久中文字幕导航| 欧美在线视频不卡| 中国成人黄色视屏| 亚洲精品久久久久久一区二区| 欧美午夜不卡影院在线观看完整版免费| 一区二区三区免费网站| 激情综合色综合久久综合| 国产精品乱码人人做人人爱| 久久精品一区二区| 亚洲一品av免费观看| 亚洲精品久久久久久下一站| 激情一区二区| 国产午夜精品一区理论片飘花 | 亚洲欧美在线一区二区| 亚洲美女视频网| 亚洲高清视频在线| 狠狠综合久久av一区二区小说| 欧美激情亚洲另类| 午夜精品亚洲| 亚洲国产另类久久久精品极度| 欧美午夜精彩| 欧美经典一区二区| 欧美影片第一页| 亚洲欧美国产77777| 在线一区二区视频| aⅴ色国产欧美| 亚洲免费观看高清完整版在线观看熊| 国产精品一区视频| 欧美成人免费视频| 久色成人在线| 久久女同互慰一区二区三区| 亚洲图片欧洲图片av| 在线精品视频一区二区三四| 海角社区69精品视频| 国产日韩精品一区二区三区| 国产精品视频导航| 国产老女人精品毛片久久| 欧美久久久久中文字幕| 欧美精品91|