日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 科技  > 知識百科

模型難復(fù)現(xiàn)不一定是作者的錯,研究發(fā)現(xiàn)模型架構(gòu)要背鍋

來源: 責(zé)編: 時間:2023-08-07 16:30:03 293觀看
導(dǎo)讀 本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。在不同初始化條件下,同一神經(jīng)網(wǎng)絡(luò)經(jīng)過兩次訓(xùn)練可以得到相同的結(jié)果嗎?CVPR 2022的一篇研究通過將決策邊界 (Decis

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。QlJ28資訊網(wǎng)——每日最新資訊28at.com

在不同初始化條件下,同一神經(jīng)網(wǎng)絡(luò)經(jīng)過兩次訓(xùn)練可以得到相同的結(jié)果嗎?QlJ28資訊網(wǎng)——每日最新資訊28at.com

CVPR 2022的一篇研究通過將決策邊界 (Decision Boundary)可視化的方法,給出了答案——QlJ28資訊網(wǎng)——每日最新資訊28at.com

有的容易,有的很難。QlJ28資訊網(wǎng)——每日最新資訊28at.com

例如,從下面這張圖來看,研究人員就發(fā)現(xiàn),ViT比ResNet要更難復(fù)現(xiàn)(兩次訓(xùn)練過后,顯然ViT決策邊界的差異更大):QlJ28資訊網(wǎng)——每日最新資訊28at.com

QlJ28資訊網(wǎng)——每日最新資訊28at.com

研究人員還發(fā)現(xiàn),模型的可復(fù)現(xiàn)性和模型本身的寬度也有很大關(guān)聯(lián)。QlJ28資訊網(wǎng)——每日最新資訊28at.com

同樣,他們利用這種方法,對2019年機(jī)器學(xué)習(xí)最重要的理論之一——雙下降 (Double Descent)現(xiàn)象進(jìn)行了可視化,最終也發(fā)現(xiàn)了一些很有意思的現(xiàn)象。QlJ28資訊網(wǎng)——每日最新資訊28at.com

QlJ28資訊網(wǎng)——每日最新資訊28at.com

來看看他們具體是怎么做的。QlJ28資訊網(wǎng)——每日最新資訊28at.com

更寬的CNN模型,可復(fù)現(xiàn)性更高QlJ28資訊網(wǎng)——每日最新資訊28at.com

深度學(xué)習(xí)中的決策邊界,可以用來最小化誤差。QlJ28資訊網(wǎng)——每日最新資訊28at.com

簡單來說,分類器會通過決策邊界,把線內(nèi)線外的點歸為不同類。QlJ28資訊網(wǎng)——每日最新資訊28at.com

在這項研究中,作者從CIFAR-10訓(xùn)練集中選擇了三幅隨機(jī)圖像,然后使用三次不同的隨機(jī)初始化配置在7種不同架構(gòu)上訓(xùn)練,繪制出各自的決策區(qū)域。QlJ28資訊網(wǎng)——每日最新資訊28at.com

QlJ28資訊網(wǎng)——每日最新資訊28at.com

從中我們可以發(fā)現(xiàn):QlJ28資訊網(wǎng)——每日最新資訊28at.com

左邊三個和右邊四個差異很大,也就是說不同架構(gòu)之間的相似性很低。QlJ28資訊網(wǎng)——每日最新資訊28at.com

再進(jìn)一步觀察,左邊的全連接網(wǎng)絡(luò)、ViT和MLP Mixer之間的決策邊界圖又不太一樣,而右邊CNN模型的則很相似。QlJ28資訊網(wǎng)——每日最新資訊28at.com

在CNN模型中,我們還可以觀察到不同隨機(jī)數(shù)種子之間明顯的的重復(fù)性趨勢,這說明不同初始化配置的模型可以產(chǎn)生一樣的結(jié)果。QlJ28資訊網(wǎng)——每日最新資訊28at.com

作者設(shè)計了一種更直觀的度量方法來衡量各架構(gòu)的可復(fù)現(xiàn)性得分,結(jié)果確實驗證了我們的直觀感受:QlJ28資訊網(wǎng)——每日最新資訊28at.com

QlJ28資訊網(wǎng)——每日最新資訊28at.com

并發(fā)現(xiàn)更寬的CNN模型似乎在其決策區(qū)域具有更高的可復(fù)現(xiàn)性,比如WideRN30。QlJ28資訊網(wǎng)——每日最新資訊28at.com

以及采用殘差連接結(jié)構(gòu)的CNN模型(ResNet和DenseNet )的可復(fù)現(xiàn)性得分比無此連接的模型要略高(VGG)。QlJ28資訊網(wǎng)——每日最新資訊28at.com

此外,優(yōu)化器的選擇也會帶來影響。QlJ28資訊網(wǎng)——每日最新資訊28at.com

在下表中,我們可以看到SAM比標(biāo)準(zhǔn)優(yōu)化器(如SGD和Adam)產(chǎn)生了更多可重復(fù)的決策邊界。QlJ28資訊網(wǎng)——每日最新資訊28at.com

不過對于MLP Mixer和ViT,SAM的使用不能總是保證模型達(dá)到最高的測試精度。QlJ28資訊網(wǎng)——每日最新資訊28at.com

QlJ28資訊網(wǎng)——每日最新資訊28at.com

有網(wǎng)友表示好奇,如果通過改善模型本身的設(shè)計,能改變這種現(xiàn)象嗎?QlJ28資訊網(wǎng)——每日最新資訊28at.com

對此作者回應(yīng)稱,他們已經(jīng)試著調(diào)整過ViT的學(xué)習(xí)率,但得到的結(jié)果仍然比ResNet差。QlJ28資訊網(wǎng)——每日最新資訊28at.com

QlJ28資訊網(wǎng)——每日最新資訊28at.com

可視化ResNet-18的雙下降現(xiàn)象QlJ28資訊網(wǎng)——每日最新資訊28at.com

雙下降(Double Descent)是一個有趣的概念,描述是測試/訓(xùn)練誤差與模型大小的關(guān)系。QlJ28資訊網(wǎng)——每日最新資訊28at.com

在此之前,大家普遍認(rèn)為參數(shù)太少的模型泛化能力差——因為欠擬合;參數(shù)太多的模型泛化能力也差——因為過擬合。QlJ28資訊網(wǎng)——每日最新資訊28at.com

QlJ28資訊網(wǎng)——每日最新資訊28at.com

而它證明,兩者的關(guān)系沒有那么簡單。具體來說:QlJ28資訊網(wǎng)——每日最新資訊28at.com

誤差會先隨著模型的增大而減小,然后經(jīng)過模型過擬合,誤差又增大,但隨著模型大小或訓(xùn)練時間的進(jìn)一步增加,誤差又會再次減小。QlJ28資訊網(wǎng)——每日最新資訊28at.com

作者則繼續(xù)使用決策邊界方法,可視化了ResNet-18的雙下降現(xiàn)象。QlJ28資訊網(wǎng)——每日最新資訊28at.com

他們通過寬度參數(shù)(k:1-64)的改變來增加模型容量。QlJ28資訊網(wǎng)——每日最新資訊28at.com

訓(xùn)練出的兩組模型,其中一組使用無噪聲標(biāo)簽(label noise)的訓(xùn)練集,另一組則帶有20%的噪聲標(biāo)簽。QlJ28資訊網(wǎng)——每日最新資訊28at.com

最終,在第二組模型中觀察到了明顯的雙下降現(xiàn)象。QlJ28資訊網(wǎng)——每日最新資訊28at.com

QlJ28資訊網(wǎng)——每日最新資訊28at.com

對此作者表示:QlJ28資訊網(wǎng)——每日最新資訊28at.com

線性模型預(yù)測的模型不穩(wěn)定性也適用于神經(jīng)網(wǎng)絡(luò),不過這種不穩(wěn)定性表現(xiàn)為決策區(qū)域的大量碎片。QlJ28資訊網(wǎng)——每日最新資訊28at.com

也就說,雙下降現(xiàn)象是由噪聲標(biāo)簽情況下決策區(qū)域的過度碎片引起的。QlJ28資訊網(wǎng)——每日最新資訊28at.com

具體來說,當(dāng)k接近/達(dá)到10 (也就是插值閾值)時,由于模型此時擬合了大部分訓(xùn)練數(shù)據(jù),決策區(qū)域被分割成很多小塊,變得“混亂和破碎”,并不具備可重復(fù)性;此時模型的分類功能存在明顯的不穩(wěn)定性。QlJ28資訊網(wǎng)——每日最新資訊28at.com

而在模型寬度很窄(k=4)和很寬(k=64)時,決策區(qū)域碎片較少,有高水平的可重復(fù)性。QlJ28資訊網(wǎng)——每日最新資訊28at.com

為了進(jìn)一步證明該結(jié)果,作者又設(shè)計了一個碎片分?jǐn)?shù)計算方法,最終再次驗證上圖的觀察結(jié)果。QlJ28資訊網(wǎng)——每日最新資訊28at.com

QlJ28資訊網(wǎng)——每日最新資訊28at.com

模型的可復(fù)現(xiàn)性得分如下:QlJ28資訊網(wǎng)——每日最新資訊28at.com

QlJ28資訊網(wǎng)——每日最新資訊28at.com

同樣可以看到,在參數(shù)化不足和過參數(shù)化的情況下,整個訓(xùn)練過程的可復(fù)現(xiàn)性很高,但在插值閾值處會出現(xiàn)“故障”。QlJ28資訊網(wǎng)——每日最新資訊28at.com

有趣的是,即使沒有噪聲標(biāo)簽,研究人員發(fā)現(xiàn)他們設(shè)計的量化方法也足夠敏感,可以檢測到可復(fù)現(xiàn)性的細(xì)微下降(上圖藍(lán)線部分)。QlJ28資訊網(wǎng)——每日最新資訊28at.com

目前代碼已經(jīng)開源,要不要來試試你的模型是否容易復(fù)現(xiàn)?QlJ28資訊網(wǎng)——每日最新資訊28at.com

論文地址:QlJ28資訊網(wǎng)——每日最新資訊28at.com

https://arxiv.org/abs/2203.08124QlJ28資訊網(wǎng)——每日最新資訊28at.com

GitHub鏈接:QlJ28資訊網(wǎng)——每日最新資訊28at.com

https://github.com/somepago/dbViQlJ28資訊網(wǎng)——每日最新資訊28at.com

 QlJ28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://m.www897cc.com/showinfo-119-2227-0.html模型難復(fù)現(xiàn)不一定是作者的錯,研究發(fā)現(xiàn)模型架構(gòu)要背鍋

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 七句話讓AI給我做了個小游戲,還是極簡版塞爾達(dá),一玩簡直停不下來

下一篇: 微軟智能云在華新增數(shù)據(jù)中心區(qū)域正式啟用 看好中國市場機(jī)會

標(biāo)簽:
  • 熱門焦點
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
欧美日本一道本在线视频| 正在播放欧美一区| 在线观看日韩av| 亚洲黄色免费网站| 国产精品99久久99久久久二8| 亚洲欧美日本在线| 久久噜噜亚洲综合| 欧美日韩在线精品| 国产综合色精品一区二区三区| **欧美日韩vr在线| 一区二区三区免费网站| 小黄鸭精品aⅴ导航网站入口| 狂野欧美一区| 欧美色另类天堂2015| 国产一区香蕉久久| 亚洲精品一区二区三区福利| 欧美一区二区视频免费观看| 欧美成人免费视频| 国产精品日韩一区二区三区| 久久―日本道色综合久久| 久久中文在线| 国产精品国产三级国产aⅴ无密码| 国产综合视频| 一区二区三区精密机械公司 | 国产人成精品一区二区三| 在线观看日韩av电影| 亚洲天堂网在线观看| 久久亚洲影音av资源网| 欧美性大战久久久久久久蜜臀| 韩国av一区二区三区在线观看| 99re6热在线精品视频播放速度| 欧美一区二区黄色| 欧美精品一区二区三区在线播放| 国产色视频一区| 一本色道久久综合亚洲精品不卡| 久久蜜桃av一区精品变态类天堂| 欧美午夜www高清视频| 在线观看欧美一区| 欧美一区二区日韩| 欧美性色视频在线| 亚洲精品极品| 久久久夜夜夜| 国产精品久久久久久久久免费| 亚洲国产婷婷香蕉久久久久久| 小嫩嫩精品导航| 欧美三区在线观看| 亚洲欧洲精品一区二区三区 | 久久精品99国产精品日本 | 国产一区日韩二区欧美三区| 在线亚洲精品福利网址导航| 欧美va亚洲va国产综合| 欧美99久久| 国产一区亚洲| 亚洲永久在线| 欧美日韩情趣电影| 亚洲国产婷婷综合在线精品| 久久九九热免费视频| 国产精品日日做人人爱| 亚洲色图综合久久| 欧美日韩亚洲国产精品| 亚洲国产精品美女| 久久久噜噜噜久久中文字免| 国产亚洲精品久久久久婷婷瑜伽| 亚洲制服丝袜在线| 欧美性猛交一区二区三区精品| 亚洲精品国产精品国自产观看浪潮 | 欧美日韩一区二区三区高清| 亚洲日本电影在线| 免费日韩成人| 影音先锋国产精品| 性色av一区二区三区在线观看| 国产精品99一区二区| 亚洲最新在线| 欧美三级日本三级少妇99| 亚洲国产精品嫩草影院| 女同一区二区| 亚洲国产一区在线观看| 蜜臀久久久99精品久久久久久 | 亚洲电影免费观看高清完整版在线观看| 久久精品国产综合| 国内精品模特av私拍在线观看| 欧美在线首页| 狠狠色狠狠色综合日日五| 久久精品成人| 激情综合色综合久久| 久久激情综合网| 国外成人免费视频| 久久影院午夜论| 亚洲国产精品悠悠久久琪琪| 欧美成人乱码一区二区三区| 亚洲毛片在线| 欧美日韩国产一级片| 老牛国产精品一区的观看方式| 久久成人综合视频| 国产精品久久久久影院亚瑟| 国产精品99久久久久久有的能看| 欧美日韩成人| 日韩一区二区免费高清| 欧美日本一道本| 亚洲最黄网站| 国产精品久久毛片a| 亚洲欧美中文另类| 国产欧美另类| 欧美午夜视频| 亚洲一级免费视频| 国产精品你懂的在线欣赏| 小黄鸭精品aⅴ导航网站入口| 国产婷婷精品| 美国十次成人| 亚洲精品一区二区三区蜜桃久| 欧美久久综合| 在线视频你懂得一区二区三区| 国产精品极品美女粉嫩高清在线 | 欧美精品亚洲二区| 亚洲深夜福利网站| 国产伦精品一区二区三区照片91 | 久久综合激情| 亚洲精品久久久久中文字幕欢迎你| 欧美日韩在线播放一区二区| 亚洲欧美日韩精品在线| 国产中文一区二区三区| 欧美成人免费小视频| 亚洲天堂成人在线观看| 国产亚洲日本欧美韩国| 欧美成人情趣视频| 亚洲一区二区三区精品在线观看 | 国产精品欧美一区喷水| 狼人社综合社区| 日韩一级精品视频在线观看| 国产欧美精品日韩区二区麻豆天美| 久久久久久午夜| 99热这里只有成人精品国产| 国产欧美va欧美va香蕉在| 美女尤物久久精品| 这里只有精品视频| 韩国av一区二区三区四区| 欧美人与性动交α欧美精品济南到| 午夜视频在线观看一区| 亚洲激情欧美激情| 国产精品日韩精品| 欧美成人精品一区二区| 亚洲你懂的在线视频| 一区在线免费观看| 国产精品久久久一区二区三区| 两个人的视频www国产精品| 亚洲午夜精品福利| 136国产福利精品导航网址| 国产精品视频免费观看| 欧美刺激性大交免费视频| 先锋资源久久| 日韩一二在线观看| 韩日成人av| 国产精品国产三级国产aⅴ浪潮 | 久久久精品网| 亚洲一区二区免费| 亚洲国产精品悠悠久久琪琪| 国产精品久久夜| 欧美高清自拍一区| 久久精品国产一区二区三区免费看| 在线一区二区日韩| 最新亚洲电影| 国产亚洲精久久久久久| 欧美日韩直播| 欧美成人a视频| 久久精品毛片| 亚洲自拍另类| 99视频精品| 亚洲欧洲另类国产综合| 国语自产精品视频在线看一大j8 | 欧美高清视频在线播放| 久久久国产午夜精品| 亚洲欧美国产77777| 99国产欧美久久久精品| 亚洲成人在线视频播放| 国产午夜精品一区理论片飘花| 欧美日韩一区在线观看| 欧美国产专区| 鲁大师成人一区二区三区| 久久成人免费电影| 亚洲欧美资源在线| 亚洲一区自拍| 在线一区日本视频| 日韩视频亚洲视频| 最新国产拍偷乱拍精品| 影音先锋亚洲精品| 国模一区二区三区| 国产在线精品成人一区二区三区| 国产精品自拍在线| 国产精品女主播在线观看 | 国产精品久久久久久久久久尿| 欧美日韩中文字幕| 欧美日韩精品一区二区在线播放 | 久久精品一二三区| 久久成人精品| 久久国产精品久久久久久电车| 午夜免费日韩视频| 午夜激情亚洲| 午夜精品视频在线观看| 亚洲欧美日韩国产成人| 亚洲欧美另类在线观看| 亚洲欧美精品| 午夜欧美理论片| 欧美在线网站| 久久精品国产欧美激情|