日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

大模型“記性差一點”反而更聰明:金魚損失隨機剔除 token,讓 AI 不再死記硬背

來源: 責編: 時間:2025-09-06 10:46:49 54觀看
導讀 訓練大模型時,有時讓它“記性差一點”,反而更聰明!大語言模型如果不加約束,很容易把訓練數(shù)據(jù)原封不動地復刻出來。為解決這個問題,來自馬里蘭大學、圖賓根大學和馬普所的研究團隊提出了一個新方法 —— 金魚損失(Go

訓練大模型時,有時讓它“記性差一點”,反而更聰明!BdQ28資訊網(wǎng)——每日最新資訊28at.com

大語言模型如果不加約束,很容易把訓練數(shù)據(jù)原封不動地復刻出來。為解決這個問題,來自馬里蘭大學、圖賓根大學和馬普所的研究團隊提出了一個新方法 —— 金魚損失(Goldfish Loss)。BdQ28資訊網(wǎng)——每日最新資訊28at.com

BdQ28資訊網(wǎng)——每日最新資訊28at.com

顧名思義,金魚損失就是讓模型像金魚一樣,不去死記每一個細節(jié),而是在損失函數(shù)計算時隨機剔除一小部分 token。BdQ28資訊網(wǎng)——每日最新資訊28at.com

由此,模型不再逐字記住訓練集內(nèi)容,但仍能學會語言規(guī)律。BdQ28資訊網(wǎng)——每日最新資訊28at.com

實驗顯示,LLaMA-2 在使用金魚損失后:BdQ28資訊網(wǎng)——每日最新資訊28at.com

記憶化內(nèi)容顯著減少:模型不再復現(xiàn)訓練數(shù)據(jù)BdQ28資訊網(wǎng)——每日最新資訊28at.com

下游任務性能幾乎不受影響:仍然能流暢生成文本BdQ28資訊網(wǎng)——每日最新資訊28at.com

用網(wǎng)友的精辟評論概括就是:dropout,但損失函數(shù)!BdQ28資訊網(wǎng)——每日最新資訊28at.com

BdQ28資訊網(wǎng)——每日最新資訊28at.com

在梯度計算中隨機屏蔽部分 token

金魚損失的核心理念非常簡單,就是在模型訓練過程中隨機剔除一部分訓練文本中的 tokens,使其不參與損失計算。BdQ28資訊網(wǎng)——每日最新資訊28at.com

這樣一來,當模型在推理階段遇到這些位置時,就只能“猜測”,而不是逐字逐句復現(xiàn)訓練數(shù)據(jù)的完整序列。BdQ28資訊網(wǎng)——每日最新資訊28at.com

此外,為了保證被剔除 token 的一致性,研究人員設計了一種基于哈希(hashing)的掩碼策略。BdQ28資訊網(wǎng)——每日最新資訊28at.com

BdQ28資訊網(wǎng)——每日最新資訊28at.com

那么,這和同樣是防止模型背會的正則化方法有什么不同呢?BdQ28資訊網(wǎng)——每日最新資訊28at.com

以 Dropout 這樣的正則化方法為例,它通過在訓練時“加噪聲”來防止模型過度依賴某些參數(shù),從而提高模型舉一反三的能力。BdQ28資訊網(wǎng)——每日最新資訊28at.com

但這樣做的問題在于:如果只是隨機丟 token,那么,每次看到同一段落時,丟掉的地方不一樣,模型累計幾次就能拼湊出完整段落。BdQ28資訊網(wǎng)——每日最新資訊28at.com

所以,說到底,模型還是靠死記硬背,記住了答案。BdQ28資訊網(wǎng)——每日最新資訊28at.com

相比之下,金魚損失則用哈希掩碼確保每次遇到同一段落,掩蓋位置都一樣,這就從根本上阻止了模型復現(xiàn)完整訓練文本。BdQ28資訊網(wǎng)——每日最新資訊28at.com

接下來,我們來看金魚損失具體是怎么做的。BdQ28資訊網(wǎng)——每日最新資訊28at.com

在傳統(tǒng)的 next-token prediction 中,模型以序列中的下一個真實 token 作為目標,輸出預測分布,并基于該分布計算交叉熵損失。BdQ28資訊網(wǎng)——每日最新資訊28at.com

BdQ28資訊網(wǎng)——每日最新資訊28at.com

在金魚損失下,模型雖然也在前向傳播中預測序列里下一個 token。但在計算損失時,會以一定的概率將某些位置的 token 從損失計算里“抹掉”。BdQ28資訊網(wǎng)——每日最新資訊28at.com

也就是說,有些真實的下一個 token 不會作為目標來訓練。BdQ28資訊網(wǎng)——每日最新資訊28at.com

BdQ28資訊網(wǎng)——每日最新資訊28at.com

在這里,研究人員采用了簡單的靜態(tài)掩碼(static mask),剔除每序列中的第 4 個 token。BdQ28資訊網(wǎng)——每日最新資訊28at.com

更進一步,為了確保模型不會從其他地方學到被掩碼的數(shù)據(jù)(例如不同的文檔會在不同的網(wǎng)頁中反復出現(xiàn)),研究團隊還提出了一種局部化哈希掩碼(localized hashed mask),使得當相同的前 h 個 token 出現(xiàn)時,掩蓋模式是相同的(可重復)。BdQ28資訊網(wǎng)——每日最新資訊28at.com

實驗測試與結(jié)果

為了驗證金魚損失確實能防止記憶化,研究團隊設計了兩種實驗場景:BdQ28資訊網(wǎng)——每日最新資訊28at.com

一種是極端場景,通過對少量樣本進行多個訓練周期(即重復)來強烈促使記憶化;BdQ28資訊網(wǎng)——每日最新資訊28at.com

另一種是標準場景,模擬現(xiàn)實模型訓練中使用的批次處理方式。BdQ28資訊網(wǎng)——每日最新資訊28at.com

同時,為了評估模型的記憶化程度,研究采用了以下指標:BdQ28資訊網(wǎng)——每日最新資訊28at.com

RougeL 得分:該指標衡量最長公共(非連續(xù))子序列的長度。得分為 1.0 表示完美記憶。BdQ28資訊網(wǎng)——每日最新資訊28at.com

精確匹配率(Exact Match):該指標衡量正確預測的序列占真實序列的百分比.BdQ28資訊網(wǎng)——每日最新資訊28at.com

實驗表明,在極端場景下,標準訓練導致模型逐字記憶了 100 篇文章中的 84 篇,而金魚損失沒有記憶任何文章。BdQ28資訊網(wǎng)——每日最新資訊28at.com

BdQ28資訊網(wǎng)——每日最新資訊28at.com

注:實驗讓 LLaMA-2-7B 在《哈利?波特》第一章或 100 篇維基百科文檔上進一步訓練了 100 個 epoch

此外,在標準訓練場景下,金魚損失也明顯減少了模型逐字復現(xiàn)訓練語料庫中目標序列的情況。BdQ28資訊網(wǎng)——每日最新資訊28at.com

BdQ28資訊網(wǎng)——每日最新資訊28at.com

但這里可能有個直覺式的反應 —— 如果讓模型“隨機漏學”一些 token,它的能力會不會也隨之降低呢?BdQ28資訊網(wǎng)——每日最新資訊28at.com

對此,研究人員進行了測試:研究表明,金魚損失模型、標準損失模型和對照模型之間的總體性能沒有系統(tǒng)性差異。BdQ28資訊網(wǎng)——每日最新資訊28at.com

BdQ28資訊網(wǎng)——每日最新資訊28at.com

需要注意的是,金魚損失的核心在于忽略部分 token 的梯度計算。因此,為了學到足夠的語言模式,模型必須通過更多數(shù)據(jù)來補償這些空缺,這可能導致計算效率的下降。BdQ28資訊網(wǎng)——每日最新資訊28at.com

參考鏈接BdQ28資訊網(wǎng)——每日最新資訊28at.com

[1]https://arxiv.org/pdf/2406.10209BdQ28資訊網(wǎng)——每日最新資訊28at.com

本文來自微信公眾號:量子位(ID:QbitAI),作者:henry,原標題《大模型“記性差一點”反而更聰明!金魚損失隨機剔除 token,讓 AI 不再死記硬背》BdQ28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://m.www897cc.com/showinfo-45-27337-0.html大模型“記性差一點”反而更聰明:金魚損失隨機剔除 token,讓 AI 不再死記硬背

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI股票出售再擴容:員工可售103億美元股份,估值穩(wěn)坐5000億

下一篇: 2.5 億元,優(yōu)必選再次斬獲全球人形機器人最大合同

標簽:
  • 熱門焦點
  • AI網(wǎng)紅能年賺百萬,普通人的新機會來了?

    來源|運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔2023 年 ,數(shù)字人成為了當紅的“流量話題”和“商業(yè)機會"。不管是 AI 孫燕姿走紅網(wǎng)絡,還是 AI 數(shù)字
  • ChatGPT訪問量增速下滑,AI真的是一場泡沫嗎?

    來源:首席商業(yè)評論2023年,最火的莫過于ChatGPT,席卷全球的同時也引發(fā)了生成式AI(人工智能)的投資熱潮。在美股,ChatGPT相關概念股飆漲,以AI算力龍頭英偉達為例,其股價年內(nèi)一度累計上
  • 風口已至,多領域平臺融入社交元素!

    在眾多領域平臺中,社交元素都扮演著重要角色,如直播營銷帶貨、線上配對聽歌、游戲局內(nèi)互動等。隨著元宇宙時代的來臨,社交產(chǎn)品不斷升級,社交元素推動流量變現(xiàn),多平臺領域融入社交
  • 以太坊倫敦升級后,隨之生效的以太坊EIP-1559是什么?

    作者:三黎過去的一年里,除了 BTC 一如既往穩(wěn)坐王位,DEFI 則是貫穿一整年的狂歡熱點。 DeFi 在讓 ETH 實現(xiàn)價值增長的同時,也使得其網(wǎng)絡日漸擁堵、交易費用增高,成為
  • 元宇宙風歸何處?

    元宇宙持續(xù)大火,在過去一段時間內(nèi),其屢次登上熱點,吸引了一波又一波投資者。近期,在“2022中國·金魚嘴元宇宙生態(tài)賦能大會”上,南京建鄴區(qū)金魚嘴基金街區(qū)宣布計劃
  • NFT領域,我們是否應該遵守版權法

    NFTs中最有爭議的因素之一是你是否真的 "擁有 "你所購買的藝術品。除此之外,圍繞著NFT行業(yè)內(nèi)的版權和知識產(chǎn)權盜竊的問題也同樣重要,因為人們很容易誤解這些事情
  • 為什么元宇宙將永遠改變體育和你的生活?

    自從Facebook更名為Meta以來,Metaverse這個詞已經(jīng)被大家所熟知。但是當Metaverse仍然被許多人視為一個虛擬的平行世界時,一些項目已經(jīng)顯示出Metaverse將如何永遠
  • GameFi 深度解析,元宇宙內(nèi)容雛形顯現(xiàn)

    GameFi=Game(游戲)+Defi(去中心化金融),核心特點為“Play to Earn”。通過技術與去中心化價值觀賦能,GameFi 游戲資產(chǎn)化身為NFT 和代幣上鏈,具備了可驗證性和流通性;開
  • NFT行業(yè)周報:NBA巨星勒布朗·詹姆斯申請NFT相關商標

    1. “無聊猿”BAYC交易總額突破14億美元3月10日,據(jù)DappRader最新數(shù)據(jù)顯示,“無聊猿”Bored Ape Yacht Club(BAYC)交易總額已突破14億美元,創(chuàng)下歷史新高,本文撰寫時為
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
韩国av一区二区三区四区| 蜜臀av国产精品久久久久| 亚洲素人一区二区| 午夜精品在线| 久久亚洲国产精品日日av夜夜| 久久在线视频在线| 欧美另类视频| 国产精自产拍久久久久久| 精品福利免费观看| 一区二区三区成人精品| 亚洲女与黑人做爰| 麻豆免费精品视频| 欧美日韩久久久久久| 国产精品一香蕉国产线看观看| 伊伊综合在线| 中文精品视频一区二区在线观看| 欧美一区二区三区喷汁尤物| 欧美成人午夜激情在线| 国产精品日韩精品欧美精品| 亚洲电影在线观看| 亚洲欧美在线另类| 欧美黑人在线观看| 国产午夜精品福利| 99日韩精品| 国产欧美日本一区视频| 亚洲成人自拍视频| 亚洲免费在线| 欧美夫妇交换俱乐部在线观看| 国产精品久久久免费| 亚洲福利视频网| 亚洲欧美日本伦理| 欧美激情一区二区三区全黄| 国产色视频一区| 99v久久综合狠狠综合久久| 久久国产免费| 欧美三日本三级少妇三2023| **网站欧美大片在线观看| 亚洲欧美日韩国产综合在线| 欧美成人一区在线| 国产午夜精品一区二区三区视频| 亚洲免费观看在线观看| 久久久噜噜噜| 国产精品羞羞答答xxdd| 亚洲美女视频| 美女诱惑一区| 国内伊人久久久久久网站视频| 亚洲视频一起| 欧美金8天国| 激情另类综合| 午夜视频久久久| 欧美视频二区36p| 亚洲黄页视频免费观看| 久久精品亚洲一区| 国产精品亚洲аv天堂网| 日韩一级黄色片| 欧美成人有码| 亚洲第一网站| 久久亚洲春色中文字幕| 国产啪精品视频| 亚洲一区二区三区免费观看| 欧美日本韩国在线| 亚洲日本在线观看| 麻豆成人在线观看| 狠狠色丁香久久综合频道| 亚洲欧美日韩国产精品 | 女女同性精品视频| 韩日视频一区| 欧美在线播放一区| 国产精品久久久久久久电影 | 伊人成人在线视频| 久久久国产精品亚洲一区| 国产日韩一区在线| 久久9热精品视频| 国产日韩欧美精品综合| 亚洲欧美日韩在线观看a三区| 国产精品久久久久77777| 亚洲深夜影院| 国产精品第十页| 亚洲一区二区精品视频| 欧美性事在线| 中国女人久久久| 国产精品二区二区三区| 国产精品99久久久久久久久| 欧美视频一区二区三区…| 一本久久精品一区二区| 欧美日韩黄色一区二区| 一区二区三区蜜桃网| 欧美日韩精品二区第二页| 日韩亚洲精品电影| 欧美吻胸吃奶大尺度电影| 一区二区三区四区在线| 国产精品久久久对白| 亚洲男人天堂2024| 国产精品亚洲一区| 午夜精品久久久久久久男人的天堂 | 美国十次成人| 在线成人小视频| 猛男gaygay欧美视频| 亚洲激情av| 欧美高清在线| 亚洲美女少妇无套啪啪呻吟| 欧美日韩不卡视频| 在线亚洲观看| 国产精品午夜在线| 久久精品亚洲一区| 雨宫琴音一区二区在线| 欧美高清一区二区| 亚洲视频网在线直播| 国产精品色婷婷久久58| 欧美一区激情| 国内精品视频在线观看| 美女主播一区| 日韩一级黄色av| 国产精品久久综合| 久久久久久久波多野高潮日日| 亚洲国产一区二区三区在线播| 欧美日韩精品综合| 亚洲欧美日韩一区二区三区在线观看 | 亚洲精品免费电影| 国产精品v欧美精品v日本精品动漫| 亚洲男人天堂2024| 精品88久久久久88久久久| 欧美黄色一区| 亚洲欧美日韩爽爽影院| 亚洲高清免费| 国产精品日韩在线观看| 久久这里只有精品视频首页| 夜夜嗨网站十八久久| 国产婷婷色一区二区三区在线| 欧美激情网友自拍| 欧美一级在线播放| 亚洲精品在线观看免费| 国产精品一区二区在线| 久久综合色天天久久综合图片| 最新国产成人av网站网址麻豆| 欧美日韩在线看| 久久久www免费人成黑人精品| 亚洲精品久久久久久久久久久久久| 国产精品久久网站| 久久综合久久88| 一区二区三区精品视频| 国产一区二区三区免费不卡 | 亚洲视频电影图片偷拍一区| 国产一区二区成人| 欧美久久久久久久| 欧美中日韩免费视频| 亚洲精品乱码| 国产视频欧美| 欧美日韩精品免费看| 亚洲国产裸拍裸体视频在线观看乱了中文| 欧美日韩成人在线播放| 久久精品理论片| 一区二区欧美亚洲| 在线成人av.com| 国产精品久久久久毛片软件| 欧美精品www在线观看| 久久久精品国产一区二区三区| 亚洲剧情一区二区| 国产一区亚洲| 国产精品xxx在线观看www| 老司机成人网| 欧美在线综合| 亚洲一区二区三区在线| 亚洲国产一区二区精品专区| 国产乱码精品一区二区三区忘忧草 | 欧美1区2区3区| 久久国产精品久久精品国产| 一区二区三区四区五区视频 | 亚洲黄页视频免费观看| 国产日韩成人精品| 欧美婷婷久久| 欧美全黄视频| 欧美国内亚洲| 蜜臀av国产精品久久久久| 久久精品久久99精品久久| 亚洲欧洲99久久| 中国成人黄色视屏| 亚洲日本无吗高清不卡| 亚洲丰满在线| 在线观看视频免费一区二区三区| 国产欧美一区二区精品忘忧草 | 国产欧美在线观看一区| 国产精品网站在线播放| 欧美色综合网| 欧美精品福利| 欧美国产日产韩国视频| 久久综合狠狠| 欧美一区二区日韩一区二区| 亚洲一品av免费观看| 一本色道久久综合亚洲二区三区| 91久久久国产精品| 在线欧美福利| 精品999在线播放| 很黄很黄激情成人| 国产一区亚洲| 国产偷自视频区视频一区二区| 国产精品羞羞答答xxdd| 国产精品久久久久久五月尺| 欧美日韩视频在线一区二区| 欧美欧美午夜aⅴ在线观看| 欧美电影在线免费观看网站| 男人插女人欧美| 免费亚洲网站| 猛干欧美女孩|