日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 知識百科

谷歌:性能不佳的微調模型不要扔,求一下平均權重就能提升性能

來源: 責編: 時間:2023-08-07 16:30:02 332觀看
導讀 本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。如何最大限度地提升模型精度?最近,谷歌等機構發現:性能不好的微調模型先不要扔,求一下平均權重!就能在不增加推理

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。8QQ28資訊網——每日最新資訊28at.com

如何最大限度地提升模型精度?8QQ28資訊網——每日最新資訊28at.com

最近,谷歌等機構發現:8QQ28資訊網——每日最新資訊28at.com

性能不好的微調模型先不要扔,求一下平均權重!8QQ28資訊網——每日最新資訊28at.com

就能在不增加推理時間以及內存開銷的情況下,提高模型的準確性和魯棒性。8QQ28資訊網——每日最新資訊28at.com

比如,研究人員就使用該方法創造了ImageNet1K的新紀錄:90.94%。8QQ28資訊網——每日最新資訊28at.com

8QQ28資訊網——每日最新資訊28at.com

將它擴展到多個圖像分類以及自然語言處理任務中,也能提高模型的分布外性能,并改善新下游任務的零樣本性能。8QQ28資訊網——每日最新資訊28at.com

而這個方法還有一個有趣的名字,叫Module soup——8QQ28資訊網——每日最新資訊28at.com

是不是讓人一下子就讓人聯想到了斐波那契湯的笑話?(昨天的湯+前天的湯=今天的新湯)8QQ28資訊網——每日最新資訊28at.com

8QQ28資訊網——每日最新資訊28at.com

△ 知乎網友@hzwer,已授權8QQ28資訊網——每日最新資訊28at.com

一共三種配方8QQ28資訊網——每日最新資訊28at.com

回想一下在此之前,大家是如何給模型漲點的呢?8QQ28資訊網——每日最新資訊28at.com

是不是先用各種超參數訓練出多個微調模型,然后再挑出驗證集上表現最好的那一個留下,其余丟掉?8QQ28資訊網——每日最新資訊28at.com

由于神經網絡是非線性的,在不同的loss basin中可能有許多解,因此Module soup這一采用保留所有微調模型的權重,對其進行平均的方法就可以提高性能,還是讓人有點驚訝的。8QQ28資訊網——每日最新資訊28at.com

不過,最近就已有研究發現,從相同的初始化配置中中獨立優化的微調模型,位于相同的誤差范圍內 (lie in the same basin of the error landscape)。8QQ28資訊網——每日最新資訊28at.com

之前也有研究證明,沿單個訓練軌跡進行權重平均,可以提高隨機初始化訓練模型的性能。8QQ28資訊網——每日最新資訊28at.com

作者正是從這些結論中受到啟發。8QQ28資訊網——每日最新資訊28at.com

Module soup一共有三種“配方”(實現):統一湯(uniform soup)、貪婪湯(greedy soup)和學習湯(learned soup)。8QQ28資訊網——每日最新資訊28at.com

其中greedy soup是最主要采用的實現,因為它的性能比直接均勻地平均所有權重更高。8QQ28資訊網——每日最新資訊28at.com

具體來說,Greedy soup通過順序添加每個模型作為“湯”中的潛在成分構建而成,并且只有在保持驗證集上的性能有所提高時才將相應模型保留在“湯”中。8QQ28資訊網——每日最新資訊28at.com

排序按驗證集精度的降序排列。8QQ28資訊網——每日最新資訊28at.com

8QQ28資訊網——每日最新資訊28at.com

性能超越單個最佳微調模型8QQ28資訊網——每日最新資訊28at.com

作者進行了全面的微調實驗來確定Module soup的有效性。8QQ28資訊網——每日最新資訊28at.com

首先是微調CLIP和ALIGN,這兩個模型在圖像-文本對上進行了對比損失預訓練。8QQ28資訊網——每日最新資訊28at.com

結果經過module soup操作后,兩者在分布內和自然分布轉移(distribution shifts)測試集上的表現都比最佳的單個微調模型性能更佳。8QQ28資訊網——每日最新資訊28at.com

8QQ28資訊網——每日最新資訊28at.com

△ 左為CLIP,右為ALIGN8QQ28資訊網——每日最新資訊28at.com

然后是在JFT數據集上預訓練的ViT-G模型。8QQ28資訊網——每日最新資訊28at.com

也就是它在ImageNet1K數據集實現了90.94%的精度,打破了此前CoAtNet保持的90.88%,同時在推理階段還減少了25%的FLOPs。8QQ28資訊網——每日最新資訊28at.com

8QQ28資訊網——每日最新資訊28at.com

在圖像分類任務以外,作者在NLP領域也對module soup進行了驗證。8QQ28資訊網——每日最新資訊28at.com

下表是BERT和T5模型在GLUE benchmark的四個文本分類任務上的結果:8QQ28資訊網——每日最新資訊28at.com

8QQ28資訊網——每日最新資訊28at.com

可以發現,雖然改進不如圖像分類中的效果明顯,但在多數任務下,greedy soup都可以相較最好的單個模型提高性能。8QQ28資訊網——每日最新資訊28at.com

當然,作者也指出,module soup在適用性等方面存在局限,比如現在測試的都是在大型異構數據集上預先訓練的模型,在這些模型之外,效果并不是非常明顯。8QQ28資訊網——每日最新資訊28at.com

最后,知乎網友@宮醬手藝人表示,其實這樣的模型參數平均是一個經典trick,transformer原始論文就用了。8QQ28資訊網——每日最新資訊28at.com

8QQ28資訊網——每日最新資訊28at.com

你發現了嗎?8QQ28資訊網——每日最新資訊28at.com

論文地址:8QQ28資訊網——每日最新資訊28at.com
https://arxiv.org/abs/2203.05488QQ28資訊網——每日最新資訊28at.com

 8QQ28資訊網——每日最新資訊28at.com

本文鏈接:http://m.www897cc.com/showinfo-119-2219-0.html谷歌:性能不佳的微調模型不要扔,求一下平均權重就能提升性能

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 云安全日報220317:紅帽OpenShift云應用平臺發現執行任意代碼漏洞,需要盡快升級

下一篇: 終于不瞎編了!AI學會“谷歌一下”,Q&A正確率達90%

標簽:
  • 熱門焦點
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
国产日韩欧美在线播放| 欧美伊人精品成人久久综合97| 国产亚洲精品成人av久久ww| 国产精品午夜在线| 国产综合在线看| 亚洲私人影院在线观看| 国产精品日韩欧美一区二区| 欧美日韩美女| 国产日韩av高清| 嫩草伊人久久精品少妇av杨幂| 亚洲一区在线看| 亚洲精品美女在线观看| 亚洲国产一区二区精品专区| 亚洲国产精品成人| 在线免费观看视频一区| 国内精品视频一区| 狠狠做深爱婷婷久久综合一区| 国产亚洲精品久久飘花| 亚洲国产精品一区二区第一页| 国产精品日韩欧美综合| 欧美在线视频观看| 伊人一区二区三区久久精品| 韩国美女久久| 日韩视频免费观看| 欧美国产精品日韩| 欧美午夜三级| 欧美午夜宅男影院在线观看| 国产午夜一区二区三区| 亚洲风情亚aⅴ在线发布| 亚洲午夜久久久| 美国成人直播| 国产精品久久午夜| 欧美激情国产日韩精品一区18| 欧美视频精品在线| 在线成人激情| 欧美一级大片在线免费观看| 欧美91福利在线观看| 国产精品免费一区二区三区观看| 亚洲国产精品女人久久久| 亚洲小视频在线| 免费试看一区| 国产伦精品一区二区三区免费迷 | 国产精品都在这里| 亚洲第一黄色网| 欧美亚洲一区在线| 欧美午夜无遮挡| 亚洲电影毛片| 欧美在线不卡视频| 欧美日韩亚洲不卡| 在线免费观看日本欧美| 亚洲午夜精品一区二区| 欧美成人午夜激情视频| 国产一区在线观看视频| 亚洲欧美成人网| 午夜激情综合网| 欧美精选在线| 在线电影国产精品| 欧美在线亚洲在线| 国产精品成人av性教育| 亚洲人成欧美中文字幕| 久久一区二区三区av| 国产日韩欧美视频| 午夜精品亚洲| 国产精品久久久久久一区二区三区| 欧美高清视频一二三区| 激情视频亚洲| 久久久久久久成人| 国产亚洲一区二区在线观看| 亚洲欧美日韩精品久久久| 欧美午夜精品久久久| 一区二区欧美视频| 欧美日本三级| 亚洲毛片视频| 欧美人体xx| 夜夜嗨av一区二区三区中文字幕| 欧美11—12娇小xxxx| 在线免费高清一区二区三区| 久久久久国产精品一区| 国语自产精品视频在线看一大j8| 久久av最新网址| 你懂的视频欧美| 精品成人在线| 久久一二三四| 在线观看一区二区视频| 卡通动漫国产精品| 亚洲大胆美女视频| 免费视频久久| 亚洲人成77777在线观看网| 欧美激情一区二区三区四区| 91久久精品国产91久久| 欧美激情在线有限公司| 一区二区高清| 国产精品久久久久久久久免费樱桃 | 美乳少妇欧美精品| 亚洲高清电影| 欧美国产日韩精品| 99精品久久| 国产精品jizz在线观看美国 | 国产综合视频| 久久婷婷麻豆| 亚洲精品综合精品自拍| 欧美日韩国产大片| 亚洲视频视频在线| 国产欧美日韩91| 久久青草福利网站| 亚洲国产精品t66y| 欧美日韩亚洲另类| 亚洲欧美日韩综合aⅴ视频| 国产区精品视频| 六月天综合网| 日韩视频二区| 国产精品久久午夜| 久久久www成人免费无遮挡大片| 在线播放日韩专区| 欧美精品色网| 亚洲欧美另类中文字幕| 国产一区二区精品久久91| 久久综合九色99| 一本久久综合亚洲鲁鲁五月天| 国产精品日本精品| 久久久久亚洲综合| 亚洲欧洲精品一区二区| 国产精品国产三级国产专播精品人| 亚洲在线播放| 激情亚洲网站| 欧美日韩国产一级片| 亚洲欧美日韩综合一区| 怡红院精品视频| 欧美精品亚洲二区| 亚洲一区二区动漫| 精品成人国产在线观看男人呻吟| 欧美国产日韩xxxxx| 亚洲男人的天堂在线| 亚洲国产成人av| 国产精品福利av| 久久综合九色综合久99| 亚洲无线视频| 136国产福利精品导航网址应用| 欧美日韩久久| 久久久久久久性| 一区二区三区偷拍| 在线色欧美三级视频| 欧美一区精品| 亚洲国产精品电影在线观看| 国产精品入口福利| 欧美国产乱视频| 欧美在线观看一区二区| 日韩亚洲欧美成人| 一区二区三区在线免费观看| 欧美色精品在线视频| 久久永久免费| 亚洲欧美一区在线| 亚洲精品一级| 一区二区在线视频| 国产精品久久久久毛片软件| 免费在线亚洲| 久久激五月天综合精品| 正在播放亚洲| 91久久久亚洲精品| 狠狠入ady亚洲精品| 欧美午夜免费影院| 欧美精品在线一区| 麻豆精品一区二区av白丝在线| 午夜激情一区| 一道本一区二区| 亚洲高清影视| 国产有码一区二区| 国产精品毛片va一区二区三区 | 红桃视频国产精品| 国产精品视频yy9299一区| 欧美人与性动交cc0o| 久久综合999| 欧美一级理论片| 亚洲欧美国产不卡| 亚洲色图制服丝袜| 亚洲精品一区久久久久久| 在线免费观看成人网| 国产自产女人91一区在线观看| 国产精品久久7| 欧美日韩在线精品| 欧美精品色一区二区三区| 欧美~级网站不卡| 毛片一区二区| 久久综合福利| 久久视频在线免费观看| 久久精品视频99| 久久av一区| 久久国产主播| 久久成人国产| 久久超碰97人人做人人爱| 性色av香蕉一区二区| 亚洲欧美日本国产专区一区| 亚洲视频一区二区| 国产精品爽爽爽| 国产精品国产三级国产aⅴ入口| 欧美日韩一区二区三| 欧美理论电影在线观看| 欧美寡妇偷汉性猛交| 欧美电影免费观看高清| 欧美福利电影网| 欧美激情一二区| 欧美理论片在线观看| 欧美日韩成人在线观看| 欧美日韩色婷婷|