日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 網絡

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

來源: 責編: 時間:2023-08-14 22:01:29 461觀看
導讀 用AI生成的指令微調羊駝大模型,數學能力超ChatGPT——微軟新開源大模型WizardMath來了。如下圖所示,經過GSM8k數據集測試,WizardMath數學能力直接擊敗了ChatGPT、Claude Instant 1、PaLM 2-540B等一

用AI生成的指令微調羊駝大模型,數學能力超ChatGPT——Rca28資訊網——每日最新資訊28at.com

微軟新開源大模型WizardMath來了。Rca28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIRca28資訊網——每日最新資訊28at.com

如下圖所示,經過GSM8k數據集測試,WizardMath數學能力直接擊敗了ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型——Rca28資訊網——每日最新資訊28at.com

并且是在參數只有700億,遠不及后三者的情況之下。Rca28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIRca28資訊網——每日最新資訊28at.com

HuggingFace已上線3個在線可玩版本(分別為7B、13B和70B參數),各種數學題可以直接丟進去試一試。Rca28資訊網——每日最新資訊28at.com

比如解決下面這道四次多項式方程:Rca28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIRca28資訊網——每日最新資訊28at.com

或者是一道簡單的微積分:Rca28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIRca28資訊網——每日最新資訊28at.com

亦或者是稍微修改過的拉格朗日方程推導:Rca28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIRca28資訊網——每日最新資訊28at.com

它都全部正確(過程也不需要等太久)。Rca28資訊網——每日最新資訊28at.com

有網友向作者表示:Rca28資訊網——每日最新資訊28at.com

效果真的很驚人,感謝你們對開源LLM的貢獻。Rca28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIRca28資訊網——每日最新資訊28at.com

目前,相關代碼、復現方式以及論文也都開源或上線,GitHub短短幾天已攬獲4.8k標星。Rca28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIRca28資訊網——每日最新資訊28at.com

那么,WizardMath究竟是如何做到的?Rca28資訊網——每日最新資訊28at.com

用AI生成的指令增強大模型能力Rca28資訊網——每日最新資訊28at.com

OpenAI的大模型(InstructGPT、GPT-4等)能夠取得巨大成功、去執行各種復雜和多樣化的任務,一部分原因是使用了真實人類用戶生成的開放域指令數據進行了微調。Rca28資訊網——每日最新資訊28at.com

然而,不是誰都能像這家公司一樣獲得這樣的指令數據集。Rca28資訊網——每日最新資訊28at.com

一是因為整個注釋過程極其昂貴且耗時,二是人工難以創建出足夠比例的高難度指令。Rca28資訊網——每日最新資訊28at.com

因此,開發出一種成本相對較低的、大規模開放域指令自動生產方法,成為當下指令調優語言模型的關鍵。Rca28資訊網——每日最新資訊28at.com

在此,作者將他們的方法命名為Evol Instruction。Rca28資訊網——每日最新資訊28at.com

它是一種利用AI來代替人類自動生成涵蓋各種難度級別開放域指令的新方法。Rca28資訊網——每日最新資訊28at.com

具體而言,Evol Instruction分為指令進化器和指令消除器。Rca28資訊網——每日最新資訊28at.com

其中指令進化器可通過深度進化(藍線)或廣度進化(紅線)兩種路徑,將簡單指令升級為更復雜的指令或創建一條全新指令。Rca28資訊網——每日最新資訊28at.com

具體執行哪一條?隨機選擇就好。Rca28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIRca28資訊網——每日最新資訊28at.com

其中,深度進化的具體“進化法”,則是通過五種類型的操作來完成,包括:Rca28資訊網——每日最新資訊28at.com

添加約束(add constraints)、深化(deepening)、具體化(concretizing)、增加推理步驟(increase reasoning steps)和使輸入復雜化(complicate input)。Rca28資訊網——每日最新資訊28at.com

由于所有指令均由AI完成,有時難免會出現錯誤。因此,指令消除器就是用于過濾失敗指令的。Rca28資訊網——每日最新資訊28at.com

以下是一個具體示例,該方法從“1+1=?”開始,終通過以上步驟自動生成了相當多的新指令。Rca28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIRca28資訊網——每日最新資訊28at.com

通過重復這一生成過程,終我們就能得到足夠多的指令,然后將它們合并并隨機打亂,組成一個難度級別均勻分布的指令集,就可以對基礎大模型進行微調了。Rca28資訊網——每日最新資訊28at.com

在此,作者選擇Alpaca的訓練數據(僅由175條人工創建的種子指令生成)作為初始數據集,然后使用ChatGPT的API執行了四個進化周期,終獲得25萬條指令。Rca28資訊網——每日最新資訊28at.com

為了與Vicuna的70k真實用戶數據(ShareGPT)進行公平比較,作者從這25萬條數據中抽取了等量的樣本,訓練LLaMA 7B模型,終得到WizardLM,結果WizardLM的性能明顯優于Vicuna。Rca28資訊網——每日最新資訊28at.com

(Alpaca:斯坦福在LLaMa-7B基礎上微調出來的模型;Vicuna,UC伯克利在LLaMa-13B的基礎上微調得來)Rca28資訊網——每日最新資訊28at.com

此外,在更為復雜的測試指令下,人類更喜歡WizardLM的輸出,而非ChatGPT,這表明該方法可以顯著提高LLM處理復雜指令的能力。Rca28資訊網——每日最新資訊28at.com

基于此,作者又利用Evol Instruction生成了很多數學領域相關的指令,然后微調羊駝大模型,得到了WizardMath。Rca28資訊網——每日最新資訊28at.com

其效果如開頭所示,在GSM8k數據集上測得其數學能力超越包括ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型,位列第5名,僅次于GPT-4、Claud1.3和2.0,以及5400億參數的Flan-PaLM 2之后。Rca28資訊網——每日最新資訊28at.com

以此類推,作者還在羊駝之上得到了專攻代碼能力的WizardCoder,效果超越Claude和Bard(詳情可戳文末地址)。Rca28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIRca28資訊網——每日最新資訊28at.com

團隊介紹本文共9位作者,全華人。Rca28資訊網——每日最新資訊28at.com

一作有3位:Rca28資訊網——每日最新資訊28at.com

Can Xu,微軟亞洲互聯網工程院S+D NLP組高級應用科學家,之前曾在微軟小冰研究組和微軟亞研院從事聊天機器人系統工作;Rca28資訊網——每日最新資訊28at.com

Qingfeng Sun, Microsoft Research科學家,研究方向為自然語言處理和信息檢索,精通構建高效搜索系統,為Microsoft Bing和Office 365貢獻了核心深度模型;Rca28資訊網——每日最新資訊28at.com

Kai Zheng,Microsoft Research科學家,研究方向為自然語言處理、搜索和推薦排名,同樣為Microsoft Bing和Office 365貢獻了核心深度模型。Rca28資訊網——每日最新資訊28at.com

數學能力超ChatGPT 70B開源大模型火了:用AI微調AIRca28資訊網——每日最新資訊28at.com

通訊作者為姜大昕,微軟全球合伙人、副總裁、前微軟亞洲研究院首席科學家,在微軟工作16年有余、曾作為微軟必應搜索引擎和Cortana智能助手自然語言理解負責人,日前已被曝離職投身大模型創業。Rca28資訊網——每日最新資訊28at.com

另還有一位作者Jiazhan Feng,是北大學生,這篇合著論文是TA在微軟實習時產出的。Rca28資訊網——每日最新資訊28at.com

項目主頁: https://github.com/nlpxucan/WizardLM/tree/main/WizardMathRca28資訊網——每日最新資訊28at.com


文章出處:量子位

本文鏈接:http://m.www897cc.com/showinfo-17-5471-0.html數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 車輛被高速路石子砸了下 博主:成功向高速路政索賠了1600元

下一篇: 這款“讀博模擬器”太逼真!玩過的人都要崩潰了:你敢試試?

標簽:
  • 熱門焦點
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
久久综合影视| 亚洲精品日韩一| 欧美日韩一区二区三区免费看| 欧美国产日本| 国产精品国产三级国产aⅴ浪潮| 国产精品免费观看在线| 国产一区二区三区成人欧美日韩在线观看 | 一本久道久久综合中文字幕| 国产精品国产三级国产aⅴ入口| 欧美视频中文在线看| 国产精品综合视频| 国产自产高清不卡| 亚洲日产国产精品| 亚洲已满18点击进入久久| 欧美在线视频网站| 欧美黄色成人网| 国产精品一二一区| 亚洲激情影视| 亚洲免费视频在线观看| 老司机凹凸av亚洲导航| 欧美视频一区二区在线观看| 国产日韩一区二区三区在线| 亚洲三级毛片| 欧美一区二区成人6969| 欧美高清视频一区| 国产精品美女久久福利网站| 国产综合久久久久久鬼色| 夜夜夜久久久| 老司机一区二区三区| 国产精品伦子伦免费视频| 亚洲高清免费视频| 欧美一区二区大片| 欧美日韩亚洲在线| 亚洲福利视频三区| 午夜精品久久久久久久久久久| 欧美国产日韩在线观看| 国模精品一区二区三区色天香| 中文国产成人精品久久一| 蜜桃av一区| 国产日本欧洲亚洲| 亚洲视频在线观看| 欧美激情一区二区| 尤物九九久久国产精品的特点| 亚洲在线免费视频| 欧美日韩精品是欧美日韩精品| 国内外成人在线视频| 亚洲免费在线视频| 欧美日韩在线不卡| 亚洲精品久久嫩草网站秘色| 久久婷婷蜜乳一本欲蜜臀| 国产精品夜夜夜一区二区三区尤| 亚洲作爱视频| 欧美精品久久99久久在免费线| 狠狠色丁香久久综合频道 | 亚洲欧美精品在线观看| 欧美日韩一卡二卡| 亚洲免费观看在线观看| 老司机精品导航| 国内精品伊人久久久久av影院 | 欧美人与性动交α欧美精品济南到| 黄色另类av| 久久国产精品一区二区三区四区| 国产精品区一区二区三| 亚洲天堂成人在线观看| 欧美日韩国产美| 亚洲理论在线观看| 欧美激情第3页| 亚洲成人直播| 久久久久久久综合色一本| 国产乱码精品一区二区三区忘忧草| 亚洲视频在线观看一区| 欧美福利一区| 精品白丝av| 久久伊人免费视频| 精品av久久707| 久久久久久网站| 黄色在线一区| 久久久午夜电影| 一色屋精品视频在线看| 蜜臀av性久久久久蜜臀aⅴ| 精品福利免费观看| 狂野欧美激情性xxxx欧美| 精品成人免费| 免费在线看成人av| 最新国产成人在线观看| 欧美久久婷婷综合色| 99视频日韩| 欧美视频第二页| 亚洲一区bb| 国产精品一区免费观看| 香蕉久久一区二区不卡无毒影院 | 久久久99国产精品免费| 一色屋精品视频免费看| 欧美1区2区3区| 亚洲精品久久久久久下一站 | 欧美激情久久久久| 一本色道88久久加勒比精品 | 免费不卡在线视频| 亚洲精品自在久久| 欧美日韩一本到| 亚洲自拍电影| 国产亚洲精品自拍| 久久久免费av| 亚洲激情av在线| 欧美日韩1区2区| 在线中文字幕一区| 国产精品综合色区在线观看| 久久蜜桃香蕉精品一区二区三区| 亚洲国产另类 国产精品国产免费| 欧美精品免费播放| 亚洲欧美日韩天堂| 影音先锋日韩有码| 欧美精品一区二区三区久久久竹菊 | 国产精品久久久久9999| 性18欧美另类| 亚洲第一福利视频| 欧美日本一区二区高清播放视频| 亚洲一区二区三区777| 国产视频一区在线| 麻豆精品网站| 99精品视频免费| 国产一区二区久久| 亚洲在线不卡| 日韩午夜黄色| 国产精品蜜臀在线观看| 久久国产66| 亚洲人成网站色ww在线| 国产精品久久久久久户外露出 | 国产精品一二三| 另类专区欧美制服同性| 在线一区亚洲| 国产视频一区免费看| 欧美高清视频在线播放| 午夜精品久久久99热福利| 影音先锋亚洲视频| 欧美日韩综合网| 久久国产精彩视频| 91久久国产综合久久91精品网站| 国产精品久久影院| 噜噜噜噜噜久久久久久91 | 久久精品99| 99精品欧美一区| 国产免费亚洲高清| 欧美电影电视剧在线观看| 9i看片成人免费高清| 国产日韩精品一区二区浪潮av| 美女精品在线| 亚洲天堂网在线观看| 国产自产高清不卡| 欧美日韩国产高清| 久久国产福利国产秒拍| 亚洲精品日韩精品| 国产手机视频精品| 欧美日一区二区在线观看 | 欧美日本国产| 久久夜色精品国产亚洲aⅴ | 欧美日韩亚洲国产一区| 久久天天躁狠狠躁夜夜av| 亚洲在线观看视频网站| 亚洲黄一区二区三区| 国产亚洲福利社区一区| 欧美午夜精品久久久久久浪潮| 久热国产精品| 久久大逼视频| 亚洲一区免费视频| 99国产精品私拍| 永久久久久久| 国产三级精品在线不卡| 欧美亚一区二区| 欧美激情麻豆| 免费不卡在线观看| 久久精品综合一区| 香蕉视频成人在线观看| 在线一区二区日韩| 亚洲片在线资源| 亚洲春色另类小说| 激情亚洲网站| 国产一区二区三区自拍| 国产精品亚洲综合久久| 国产精品swag| 欧美日韩久久| 欧美日韩不卡| 欧美精品成人| 欧美成人精品一区| 免费成人小视频| 麻豆久久久9性大片| 久久久久久国产精品mv| 欧美在线三级| 欧美一区二区三区播放老司机| 亚洲欧美综合网| 亚洲一区二区免费看| 一区二区欧美视频| 夜夜嗨av一区二区三区网站四季av| 91久久久久久久久| 亚洲国产精品www| 黄色成人小视频| 在线成人激情黄色| 影音先锋欧美精品| 亚洲国产清纯| 亚洲日本欧美天堂| 亚洲精品社区| 99成人免费视频| 一区二区三区四区五区精品视频| 一个人看的www久久|