【申萬宏源】必然的碎片化AI落地,哪種路徑可能勝出? | 元宇宙Meta洞見
來源:
責編:
時間:2023-08-11 16:52:27
3909觀看
導讀 大規模預訓GPT(Generative PreTraining)是OpenAI在2018年提出的模型,大規模預訓練模型(大模型)漸漸成為了AI算法領域的熱點。AI產業鏈:從算力到應用工作流程視角? 算法設計環節:機器視覺、語音識別、自然語
aC728資訊網——每日最新資訊28at.com
大規模預訓GPT(Generative PreTraining)是OpenAI在2018年提出的模型,大規模預訓練模型(大模型)漸漸成為了AI算法領域的熱點。aC728資訊網——每日最新資訊28at.com
工作流程視角
aC728資訊網——每日最新資訊28at.com
? 算法設計環節:機器視覺、語音識別、自然語音處理、知識圖譜aC728資訊網——每日最新資訊28at.com
? 算法實現環節:深度學習框架,訓練、推理部署,對模型的調參優化aC728資訊網——每日最新資訊28at.com
? 算法運行環節:AI芯片和AIDC超算中心,提供硬件基礎aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
AI平臺:少量企業參與的AI高地之爭
aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
? 訓練軟件框架:實現深度學習訓練算法的模塊化封裝aC728資訊網——每日最新資訊28at.com
? 模型生產平臺:實現模型的工業級生產aC728資訊網——每日最新資訊28at.com
? 推理部署框架:實現模型生產完成后的工業級高效、自動的部署aC728資訊網——每日最新資訊28at.com
? 數據平臺:包括數據采集、數據標注、數據生產、數據存儲等功能aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
訓練框架:調節參數,生成參數aC728資訊網——每日最新資訊28at.com
訓練框架是AI的重要基石,也是AI發展戰略的制高點。當算法變成改造甚至顛覆軟件行業的力量時,最后核心就是看這些AI的公司有沒有平臺化的能力,即“能夠批量、高效、比競爭對手更及時地供應優質算法。aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
推理框架:與硬件和設備端緊密相關aC728資訊網——每日最新資訊28at.com
推理框架:主要部署在設備端和云端,因此與硬件廠商緊密相關。aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
開源框架的選擇:規模效應與生態aC728資訊網——每日最新資訊28at.com
四大頂級深度學習框架陣營可以滿足絕大部分開發者要求。社區規模效應:維護力量、貢獻人員決定了算法庫擴展及時性、API水平,軟件框架規模效應較強。aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
行業更新熱點在“大模型”
aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
傳統機器學習里,模型過小則欠擬合,模型過大則過擬合。深度學習里Double Descent現象在2018年揭示,隨著模型參數變多,Test Error是先下降,再上升,然后第二次下降;原則上,在成本可接受的情況下,模型越大,準確率越好。aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
OpenAI :GPT-3aC728資訊網——每日最新資訊28at.com
GPT-3在許多NLP數據集上均具有出色的性能,包括翻譯、問答和文本填空任務,這還包括一些需要即時推理或領域適應的任務,例如給一句話中的單詞替換成同義詞,或執行3位數的數學運算。aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
GPT-3工具DALL·E和“邏輯”優化aC728資訊網——每日最新資訊28at.com
基于GPT-3構建,僅使用了120億個參數樣本,相當于GPT-3參數量的十四分之一;有利于降低了深度學習需要的數據標注量,文本和圖像理解結合起來aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
優勢顯著aC728資訊網——每日最新資訊28at.com
? 自監督學習功能,大幅降低對數據量的需求:GPT舍棄Fine-tuning,先使用海量數據預訓練大模型,得到一套模型參數,然后用這套參數對模型進行初始化,再進行訓練。大幅降低后續對數據量的需求。aC728資訊網——每日最新資訊28at.com
? 預訓練大模型+細分場景微調,更適合長尾落地:大規模預訓練可以有效地從大量標記和未標記的數據中捕獲知識,通過將知識存儲到大量的參數中并對特定任務進行微調,極大擴展模型的泛化能力。aC728資訊網——每日最新資訊28at.com
? 有望進一步突破現有模型結構的精度局限:可能繼續突破精度上限。aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
AI落地和碎片化需求同時出現
aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
業界在2015-2017年后開始發生變化,AI走出實驗室和商業模式轉變:aC728資訊網——每日最新資訊28at.com
? 工業場景更復雜的邏輯:編程模式從靜態網絡結構描述向動態計算過程轉變。aC728資訊網——每日最新資訊28at.com
? SDK商業模式可能無法在國內落地:早期試圖復制海外SDK銷售路線,但這一模式無法在國內復制。aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
兩種路徑的總結aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
aC728資訊網——每日最新資訊28at.com
設計并訓練工業級的高性能AI模型需要大量的成本投入和深厚的技術沉淀,包含多場景匯總的海量數據,復雜的模型設計和訓練算法,以及復雜的軟件框架和硬件系統在內的大型計算基礎設施,AI公司需要突破技術發展的瓶頸。aC728資訊網——每日最新資訊28at.com
-END-
aC728資訊網——每日最新資訊28at.com
本文鏈接:http://m.www897cc.com/showinfo-40-64-0.html【申萬宏源】必然的碎片化AI落地,哪種路徑可能勝出? | 元宇宙Meta洞見
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 【東方證券】虛擬世界照進現實,元宇宙中有什么? | 元宇宙Meta洞見
下一篇: 元宇宙將會如何塑造未來的工作方式?
標簽:
-
來源 | 光子星球撰文 | 文燁豪 編輯 | 吳先之 蘋果終于呈上了它的“答卷”。 北京時間6月6日凌晨,蘋果2023年全球開發者大會(WWDC)如期舉行。作為蘋果CEO庫克口中&ld
-
上周的元宇宙和明星圈因為一則“林俊杰在推特上宣布持有Decentraland元宇宙虛擬地塊”的新聞而備受關注,該新聞一方面在娛樂圈引起了吃瓜群眾的好奇,另一方面在
-
一家初創公司宣布在紐約市開放一臺NFT自動售貨機,允許任何人——即使是沒有加密資產的人也能購買NFT。該交易平臺名為Neon,上個月完成了一輪300萬美元的種子募捐
-
Block-807DAO要么是定義虛擬未來、無領導組織的革命性概念,要么是充滿存在主義和自我毀滅挑戰的反烏托邦結構,取決于你在與誰交談。近幾個月來, DAO已經從Crypto
-
競爭優勢正在改變競爭優勢是每個企業都在努力爭取的,由谷歌、Facebook和Netflix等大型科技公司主導的市場中,兩大重要類別的競爭優勢十分突出。第一個競爭優勢來
-
NFTs中最有爭議的因素之一是你是否真的 "擁有 "你所購買的藝術品。除此之外,圍繞著NFT行業內的版權和知識產權盜竊的問題也同樣重要,因為人們很容易誤解這些事情
-
NFT市場的火熱讓越來越多的投資者投身其中,但當前的 NFT 生態系統存在幾個問題卻困擾了大多數人,如難以準確評估 NFT 項目的資產價格、缺乏 NFT 市場動態信息、
-
根據公開信息顯示,國際奧委會官方授權的冰墩墩數字盲盒于北京時間2月12日凌晨在nWayPlay平臺發售,總數為500個,每個99美元,每人限購5個。此外,不同的奧運徽章數字藏
-
元宇宙聽起來像不像是科幻小說中出現的術語?事實確實如此。小說家尼爾·斯蒂芬森在1992年的小說《雪崩》中首次用這個詞來定義了一個多連接的虛擬宇宙,它能夠模