日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 知識百科

?什么是Transformer機器學習模型? 譯文

來源: 責編: 時間:2023-08-07 16:30:24 303觀看
導讀 近年來, Transformer 機器學習模型已經成為深度學習和深度神經網絡技術進步的主要亮點之一。它主要用于自然語言處理中的高級應用。谷歌正在使用它來增強其搜索引擎結果。Op

 c9i28資訊網——每日最新資訊28at.com

近年來, Transformer 機器學習模型已經成為深度學習和深度神經網絡技術進步的主要亮點之一。它主要用于自然語言處理中的高級應用。谷歌正在使用它來增強其搜索引擎結果。OpenAI 使用 Transformer 創建了著名的 GPT-2和 GPT-3模型。c9i28資訊網——每日最新資訊28at.com

圖片c9i28資訊網——每日最新資訊28at.com

自從2017年首次亮相以來,Transformer 架構不斷發展并擴展到多種不同的變體,從語言任務擴展到其他領域。它們已被用于時間序列預測。它們是 DeepMind 的蛋白質結構預測模型 AlphaFold 背后的關鍵創新。OpenAI 的源代碼生成模型 Codex 也基于 Transformer。Transformer 最近也進入了計算機視覺領域,在許多復雜任務中它們正在慢慢取代卷積神經網絡(CNN)。c9i28資訊網——每日最新資訊28at.com

研究人員仍在探索改進 Transformer 并將其用于新應用的方法。以下是關于 Transformer 令人興奮的原因以及它們如何工作的簡要解釋。c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

1.采用神經網絡處理序列數據c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

圖片c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

傳統的前饋神經網絡并非旨在跟蹤序列數據并將每個輸入映射到輸出。它適用于諸如圖像分類之類的任務,但在諸如文本之類的序列數據上卻失敗了。處理文本的機器學習模型不僅必須處理每個單詞,還必須考慮單詞如何按順序排列并相互關聯。而一個單詞的含義可能會隨著句子中出現在它們之前和之后的其他單詞而改變。c9i28資訊網——每日最新資訊28at.com

在 Transformer 出現之前,遞歸神經網絡(RNN)是自然語言處理的首選解決方案。當提供一個單詞序列時,遞歸神經網絡(RNN)將處理第一個單詞,并將結果反饋到處理下一個單詞的層。這使它能夠跟蹤整個句子,而不是單獨處理每個單詞。c9i28資訊網——每日最新資訊28at.com

遞歸神經網絡(RNN)的缺點限制了它們的用處。首先,它們的處理速度非常緩慢。由于它們必須按順序處理數據,因此無法在訓練和推理中利用并行計算硬件和圖形處理單元(GPU)。其次,它們無法處理長序列的文本。隨著遞歸神經網絡(RNN)深入到文本摘錄中,句子開頭幾個單詞起到的效果逐漸減弱。當兩個鏈接的詞在文本中相距很遠時,這個被稱為“梯度消失”的問題就會出現。第三,它們只捕捉到一個單詞和它之前的單詞之間的關系。實際上,單詞的含義取決于它們之前和之后的單詞。c9i28資訊網——每日最新資訊28at.com

長短時記憶(LSTM)網絡是遞歸神經網絡(RNN)的繼任者,能夠在一定程度上解決梯度消失問題,并且能夠處理更大的文本序列。但是長短時記憶(LSTM)的訓練速度甚至比遞歸神經網絡(RNN)還要慢,并且仍然無法充分利用并行計算。他們仍然依賴于文本序列的串行處理。c9i28資訊網——每日最新資訊28at.com

2017年發表的一篇名為《注意就是所需要的一切》的論文介紹了 Transformer,指出 Transformer c9i28資訊網——每日最新資訊28at.com
做出了兩個關鍵貢獻:首先,它們使并行處理整個序列成為可能,從而可以將順序深度學習模型的速度和容量擴展到前所未有的速度。其次,它們引入了“注意機制”,可以在正向和反向的非常長的文本序列中跟蹤單詞之間的關系。c9i28資訊網——每日最新資訊28at.com

圖片c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

在討論 Transformer 模型的工作原理之前,有必要討論一下序列神經網絡解決的問題類型。c9i28資訊網——每日最新資訊28at.com

“向量到序列”模型采用單個輸入(例如圖像)并生成數據序列(例如描述)。“序列到向量”模型將序列數據作為輸入,例如產品評論或社交媒體帖子,并輸出單個值,例如情緒分數。“序列到序列”模型將一個序列作為輸入,例如一個英文句子,并輸出另一個序列,例如該句子的法語翻譯。c9i28資訊網——每日最新資訊28at.com

盡管存在差異,但所有這些類型的模型都有一個共同點——他們學習表達。神經網絡的工作是將一種類型的數據轉換為另一種類型的數據。在訓練期間,神經網絡的隱藏層(位于輸入和輸出之間的層)以最能代表輸入數據類型特征的方式調整其參數,并將其映射到輸出。最初的 Transformer 被設計為用于機器翻譯的序列到序列(seq2seq)模型(當然,序列到序列模型不限于翻譯任務)。它由一個編碼器模塊組成,該模塊將來自源語言的輸入字符串壓縮為一個向量,該向量表示單詞及其相互之間的關系。解碼器模塊將編碼向量轉換為目標語言的文本字符串。c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

2.標記和嵌入 c9i28資訊網——每日最新資訊28at.com

圖片c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

輸入文本必須經過處理并轉換為統一格式,然后才能輸入到 Transformer。首先,文本通過“標記器”,將其分解為可以單獨處理的字符塊。標記化算法可以取決于應用程序。在大多數情況下,每個單詞和標點符號大致算作一個標記。一些后綴和前綴算作單獨的標記(例如,“ize”、“ly”和“pre”)。標記器生成一個數字列表,表示輸入文本的標記ID。c9i28資訊網——每日最新資訊28at.com

然后將標記轉換為“單詞嵌入”。單詞嵌入是一種試圖在多維空間中捕捉單詞價值的向量。例如,“貓”和“狗”這兩個詞在某些維度上可能具有相似的值,因為它們都用于關于動物和寵物的句子中。然而,在區分貓科動物和犬科動物的其他維度上,“貓”比“狼”更接近“獅子”。同樣,“巴黎”和“倫敦”可能彼此更加接近,因為它們都是城市。然而,“倫敦”更接近于“英格蘭”,“巴黎”更接近于“法國”,這是因為在一個國家的區分維度上。而單詞嵌入通常有數百個維度。c9i28資訊網——每日最新資訊28at.com

單詞嵌入是通過嵌入模型創建的,這些模型與 Transformer 分開訓練。有幾種用于語言任務的預訓練嵌入模型。c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

3.注意層   c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

圖片c9i28資訊網——每日最新資訊28at.com

一旦句子被轉換成一個單詞嵌入列表,它就會被輸入到 Transformer 的編碼器模塊中。與遞歸神經網絡(RNN)和長短時記憶(LSTM)模型不同,Transformer 一次不會接收一個輸入。它可以接收整個句子的嵌入值,并并行處理它們。這使得 Transformer 比它們的前輩更具有計算效率,并且還使它們能夠在正向和反向序列中檢查文本的場景。c9i28資訊網——每日最新資訊28at.com

為了保持句子中單詞的順序,Transformer 應用“位置編碼”,這基本上意味著它修改每個嵌入向量的值,以表示其在文本中的位置。c9i28資訊網——每日最新資訊28at.com

接下來,輸入被傳遞到第一個編碼器塊,它通過“注意層”對其進行處理。注意層試圖捕捉句子中單詞之間的關系。例如,考慮 “一只大黑貓碰掉一個瓶子之后橫穿馬路”(The big black cat crossed the road after it dropped a bottle on its side)這個句子。在這里,模型必須將“it”與“cat”相關聯,將“its”與“bottle”相關聯。因此,它應該建立其他關聯,例如“big”和“cat”或“crossed”和“cat”。否則,注意層接收表示單個單詞值的單詞嵌入列表,并生成表示單個單詞及其相互關系的向量列表。注意層包含多個“attention heads” (注意頭),每個“attention heads”都可以捕獲單詞之間的不同類型的關系。c9i28資訊網——每日最新資訊28at.com

注意層的輸出被饋送到前饋神經網絡,該網絡將其轉換為向量表示,并將其發送到下一個注意層。Transformers c9i28資訊網——每日最新資訊28at.com
包含幾個注意塊和前饋層,以逐漸捕捉更復雜的關系。c9i28資訊網——每日最新資訊28at.com

解碼器模塊的任務是將編碼器的注意向量轉換為輸出數據(例如,輸入文本的翻譯版本)。在訓練階段,解碼器可以訪問編碼器產生的注意向量和預期的結果(例如,翻譯的字符串)。c9i28資訊網——每日最新資訊28at.com

解碼器使用相同的標記化、單詞嵌入和注意機制來處理預期結果并創建注意向量。然后,它在編碼器模塊中傳遞該注意向量和注意層,從而在輸入和輸出值之間建立關系。在翻譯應用程序中,這是源語言和目標語言中的單詞相互映射的部分。與編碼器模塊一樣,解碼器注意向量通過前饋層傳遞。然后其結果被映射到一個非常大的向量池,即目標數據的大小(在翻譯的情況下,這可以涉及數萬個單詞)。c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

4.訓練Transformerc9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

在訓練期間,Transformer 提供了非常大的配對示例語料庫(例如,英語句子及其相應的法語翻譯)。編碼器模塊接收并處理完整的輸入字符串。然而,解碼器接收到輸出字符串的掩碼版本(一次一個單詞),并嘗試建立編碼的注意向量和預期結果之間的映射。編碼器嘗試預測下一個單詞,并根據其輸出與預期結果之間的差異進行更正。這種反饋使轉換器能夠修改編碼器和解碼器的參數,并逐漸在輸入和輸出語言之間創建正確的映射。c9i28資訊網——每日最新資訊28at.com

Transformer 擁有的訓練數據和參數越多,它就越有能力在較長文本序列中保持連貫性和一致性。c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

5.Transformer的變化c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

 在以上研究的機器翻譯示例中,Transformer 的編碼器模塊學習英語單詞和句子之間的關系,而解碼器學習英語和法語之間的映射。c9i28資訊網——每日最新資訊28at.com

但并非所有 Transformer 應用都需要編碼器和解碼器模塊。例如,大型語言模型的GPT系列使用解碼器模塊堆棧來生成文本。BERT是谷歌研究人員開發的 Transformer 模型的另一種變體,而它只使用編碼器模塊。c9i28資訊網——每日最新資訊28at.com

其中一些架構的優點是它們可以通過自我監督學習或無監督方法進行訓練。例如,BERT 通過獲取大量未標記文本的語料庫,可以屏蔽其中的一部分,并嘗試預測缺失的部分來進行大部分訓練。然后,它根據其預測接近或遠離實際數據的程度調整其參數。通過不斷地重復這個過程,BERT 捕捉到了不同場景中不同單詞之間的關系。在這個預訓練階段之后,BERT 可以通過在少量標記示例上進行訓練來針對下游任務進行微調,例如問答、文本摘要或情感分析。使用無監督和自我監督的預訓練可以減少注釋訓練數據所需的工作量。c9i28資訊網——每日最新資訊28at.com

關于 Transformer 和他們正在解鎖的新應用程序還有更多,這超出了本文的范圍。研究人員如今仍在尋找從Transformer中獲得更多幫助的方法。c9i28資訊網——每日最新資訊28at.com

Transformer 還引發了關于語言理解和通用人工智能的討論。顯而易見的是,Transformer 與其他神經網絡一樣是一種統計模型,能夠以巧妙而復雜的方式捕捉數據中的規律性。雖然它們不像人類那樣“理解”語言,但是其發展仍然令人興奮并且可以提供更多新事物。c9i28資訊網——每日最新資訊28at.com

原文鏈接:https://bdtechtalks.com/2022/05/02/what-is-the-transformer/c9i28資訊網——每日最新資訊28at.com

 c9i28資訊網——每日最新資訊28at.com

本文鏈接:http://m.www897cc.com/showinfo-119-2382-0.html?什么是Transformer機器學習模型? 譯文

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 云安全日報220616:思科電子郵件安全設備發現身份驗證繞過漏洞,需要盡快升級

下一篇: 基于深度學習的文本情感識別技術在5G不良消息安全管控平臺中的應用

標簽:
  • 熱門焦點
  • 天貓精靈Sound Pro體驗:智能音箱沒有音質?來聽聽我的

    這幾年除了手機作為智能生活終端最主要的核心之外,第二個可以成為中心點的產品是什么?——是智能音箱。 手機在執行命令的時候有兩種操作方式,手和智能語音助手,而智能音箱只
  • Rust中的高吞吐量流處理

    作者 | Noz編譯 | 王瑞平本篇文章主要介紹了Rust中流處理的概念、方法和優化。作者不僅介紹了流處理的基本概念以及Rust中常用的流處理庫,還使用這些庫實現了一個流處理程序
  • 一文看懂為蘋果Vision Pro開發應用程序

    譯者 | 布加迪審校 | 重樓蘋果的Vision Pro是一款混合現實(MR)頭戴設備。Vision Pro結合了虛擬現實(VR)和增強現實(AR)的沉浸感。其高分辨率顯示屏、先進的傳感器和強大的處理能力
  • 三萬字盤點 Spring 九大核心基礎功能

    大家好,我是三友~~今天來跟大家聊一聊Spring的9大核心基礎功能。話不多說,先上目錄:圖片友情提示,本文過長,建議收藏,嘿嘿嘿!一、資源管理資源管理是Spring的一個核心的基礎功能,不
  • 使用LLM插件從命令行訪問Llama 2

    最近的一個大新聞是Meta AI推出了新的開源授權的大型語言模型Llama 2。這是一項非常重要的進展:Llama 2可免費用于研究和商業用途。(幾小時前,swyy發現它已從LLaMA 2更名為Lla
  • 共享單車的故事講到哪了?

    來源丨海克財經與共享充電寶相差不多,共享單車已很久沒有被國內熱點新聞關照到了。除了一再漲價和用戶直呼用不起了。近日多家媒體再發報道稱,成都、天津、鄭州等地多個共享單
  • 三星推出Galaxy Tab S9系列平板電腦以及Galaxy Watch6系列智能手表

    2023年7月26日,三星電子正式發布了Galaxy Z Flip5與Galaxy Z Fold5。除此之外,Galaxy Tab S9系列平板電腦以及三星Galaxy Watch6系列智能手表也同期
  • AMD的AI芯片轉單給三星可能性不大 與臺積電已合作至2nm制程

    據 DIGITIMES 消息,英偉達 AI GPU 出貨逐季飆升,接下來 AMD MI 300 系列將在第 4 季底量產。而半導體業內人士表示,近日傳出 AMD 的 AI 芯片將轉單給
  • iQOO Neo8 Pro真機諜照曝光:天璣9200+和V1+旗艦雙芯加持

    去年10月,iQOO推出了iQOO Neo7系列機型,不僅搭載了天璣9000+,而且是同價位唯一一款天璣9000+直屏旗艦,一經上市便受到了用戶的廣泛關注。在時隔半年后,
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
国产主播在线一区| 国产精品久久久久aaaa| 久久精品女人天堂| 久久国产日本精品| 免费观看亚洲视频大全| 欧美日韩免费视频| 国产精品一区二区三区四区五区| 国产一区 二区 三区一级| 亚洲国产精品成人精品| 一本一本久久| 久久爱www.| 欧美精品成人91久久久久久久| 国产精品草莓在线免费观看| 国产丝袜一区二区| 亚洲精品在线看| 先锋影院在线亚洲| 麻豆精品视频在线观看| 国产精品国产三级国产普通话三级| 国产一区日韩欧美| 一区二区成人精品| 久久久蜜桃一区二区人| 欧美日韩一区二区在线播放| 国产一本一道久久香蕉| 99这里只有精品| 久久久噜噜噜久久人人看| 欧美日韩一区不卡| 一区在线播放视频| 亚洲在线1234| 欧美激情精品久久久| 国产亚洲aⅴaaaaaa毛片| 日韩亚洲不卡在线| 久久深夜福利免费观看| 国产精品色网| 日韩视频在线观看国产| 久久频这里精品99香蕉| 国产精品入口尤物| 99在线精品观看| 久久综合九色欧美综合狠狠| 国产精品专区第二| 亚洲美女一区| 久久综合久久综合久久| 国产精品三区www17con| 亚洲裸体俱乐部裸体舞表演av| 久久精品亚洲一区二区| 国产精品理论片| 99成人免费视频| 欧美a级理论片| 狠狠综合久久av一区二区老牛| 亚洲一区二区视频| 欧美日韩国产不卡| 亚洲福利国产精品| 久久精品国产999大香线蕉| 国产精品久久福利| 99成人在线| 欧美国产一区在线| 在线播放豆国产99亚洲| 欧美在线视频a| 国产精品视频xxxx| 亚洲一区二区三区在线播放| 欧美v日韩v国产v| 在线播放日韩专区| 久久久久久自在自线| 国产婷婷一区二区| 性xx色xx综合久久久xx| 国产精品欧美在线| 亚洲综合视频在线| 国产精品乱人伦一区二区 | 99视频有精品| 欧美大片一区二区三区| 在线观看成人一级片| 久久久久久久久久久久久女国产乱 | 国产一区二区久久精品| 午夜伦欧美伦电影理论片| 国产精品国产三级欧美二区| 这里是久久伊人| 欧美日韩中文另类| 亚洲无线视频| 国产精品久久久久99| 亚洲一级黄色av| 国产精品区一区| 欧美一区二区精品久久911| 国产午夜亚洲精品理论片色戒| 午夜精品福利在线| 国产亚洲欧美另类中文| 久久精品视频在线看| 黄色综合网站| 免费成人黄色av| 亚洲精品欧美激情| 欧美日韩在线免费观看| 中文在线资源观看视频网站免费不卡| 欧美日韩一区综合| 亚洲欧美成人一区二区三区| 国产精品专区第二| 久久不射网站| 亚洲第一精品夜夜躁人人躁| 欧美国产专区| 一本久久综合| 国产精品一区二区你懂得| 欧美在线不卡| 亚洲成人在线网站| 欧美精品一二三| 亚洲淫性视频| 国产一区二区三区不卡在线观看| 久久久久久久久久久久久久一区| 亚洲成人在线观看视频| 欧美日韩精品免费| 亚洲欧美成人一区二区在线电影| 国产一区二区三区免费不卡| 鲁鲁狠狠狠7777一区二区| 日韩视频在线观看一区二区| 国产精品国产精品| 久久国产直播| 亚洲人成网站影音先锋播放| 欧美午夜电影网| 欧美一区午夜视频在线观看| 亚洲第一精品电影| 欧美三级网页| 久久精品国产第一区二区三区最新章节| 尤物精品在线| 欧美色图一区二区三区| 欧美综合第一页| 亚洲精品国产系列| 国产伦精品一区二区三| 麻豆av一区二区三区| 宅男66日本亚洲欧美视频| 国产一区二区视频在线观看 | 久久精品主播| 99riav1国产精品视频| 国产欧美日韩在线视频| 免费看黄裸体一级大秀欧美| 亚洲桃色在线一区| 狠色狠色综合久久| 欧美三级黄美女| 久久精品中文字幕一区二区三区 | 久久五月激情| 亚洲婷婷在线| 亚洲二区在线视频| 国产精品萝li| 欧美1级日本1级| 亚洲综合日韩在线| 亚洲欧洲一区| 国产色婷婷国产综合在线理论片a| 欧美成人免费在线视频| 西瓜成人精品人成网站| 91久久国产综合久久| 国产乱肥老妇国产一区二 | 在线高清一区| 国产精品丝袜xxxxxxx| 女人色偷偷aa久久天堂| 小处雏高清一区二区三区| 亚洲伦理在线观看| 国产一区二区高清| 国产精品mm| 欧美精品粉嫩高潮一区二区| 久久成人一区二区| 亚洲天堂偷拍| 亚洲欧洲日本专区| 国产一级久久| 国产精品久久久久久影视| 欧美人妖另类| 欧美 日韩 国产精品免费观看| 欧美中在线观看| 亚洲一区精品在线| 日韩午夜免费视频| 亚洲国产高清在线| 国内精品免费午夜毛片| 国产精品久久激情| 欧美日韩精品在线播放| 欧美77777| 麻豆av一区二区三区| 久久精品首页| 久久成人免费网| 欧美亚洲在线视频| 亚洲免费在线精品一区| 一本一本久久| 99国产精品国产精品久久| 亚洲国产精品va在线观看黑人| 国一区二区在线观看| 国产欧美一区二区三区久久| 国产精品成人播放| 欧美日韩中文字幕精品| 欧美日韩黄色大片| 欧美极品影院| 欧美承认网站| 欧美jizz19性欧美| 蜜臀av在线播放一区二区三区| 久久久精品一区二区三区| 欧美在线观看视频| 欧美一站二站| 久久精品二区| 久久xxxx| 久久午夜视频| 久久综合狠狠综合久久综合88| 久久久精品999| 久久久夜精品| 榴莲视频成人在线观看| 玖玖国产精品视频| 免费91麻豆精品国产自产在线观看| 久久婷婷蜜乳一本欲蜜臀| 裸体歌舞表演一区二区| 欧美国产综合一区二区| 欧美激情四色| 欧美日本免费| 欧美视频在线一区二区三区|