日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 軟件

厲害,美國人又搞了一個壟斷的生態系統

來源: 責編: 時間:2024-01-22 17:25:34 344觀看
導讀去年AIGC大火,程序員都把注意力放在了最上層,而忽略了提供算力的最底層:GPU。不過這也正常,就像很少人直接針對CPU編程一樣,直接針對GPU編程的人也不多。但是了解一下GPU編程,絕對大有好處。今天先聊聊GPU編程,然后再聊聊一

去年AIGC大火,程序員都把注意力放在了最上層,而忽略了提供算力的最底層:GPU。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

不過這也正常,就像很少人直接針對CPU編程一樣,直接針對GPU編程的人也不多。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

但是了解一下GPU編程,絕對大有好處。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

今天先聊聊GPU編程,然后再聊聊一個CUDA這個新的生態系統,對編程細節不感興趣的可以直接拉到最后。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

對了,文末還有免費送書的福利。he728資訊網——每日最新資訊28at.com

CPU vs GPU

he728資訊網——每日最新資訊28at.com

圖片圖片he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

CPU的設計目標是“盡可能地降低延時”he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

(1) 強大的ALU(算術邏輯單元),可以在很少的時鐘周期內完成算術運算。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

(2) 巨大的Cache:加快指令和數據的存取速度he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

(3) 復雜的邏輯控制:當程序員有多個分支,它可以通過分支預測來降低延時。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

GPU的目標是:“盡可能地實現大吞吐量”he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

(1) ALU 簡單,但是超級多he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

(2) Cache很小he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

(3) 邏輯控制簡單。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

如果把GPU的單個核心比作小學生,那一個CPU的核心就是老教授。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

如果要做微積分,幾千個小學生也比如上老教授。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

但是,如果只是100以內的加減法,幾千個小學生同時做(并行計算),那效率肯定要比老教授高。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

老教授處理復雜任務的能力是碾壓小學生的,但是對于沒有那么復雜的任務,還是頂不住人多。he728資訊網——每日最新資訊28at.com

把串行改成并行

he728資訊網——每日最新資訊28at.com

我們用一個例子來展示一下:he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

int a[] = {1,2,3,4,5,6,8,9,10};int b[] = {11,12,13,14,15,16,17,18,19,20};int c[10];int main() {    int N = 10;  // Number of elements    for (int i = 0; i < N; i++) {        c[i] = a[i] + b[i];    }    return 0;}

he728資訊網——每日最新資訊28at.com

這段簡單的代碼大家都能看懂,CPU在執行時會做一個循環,然后把兩個數組對應的元素進行相加,結果存到數組c中。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

由于是順序處理的,如果數組非常大,就會比較耗時。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

如何把它改成并行計算呢?he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

數組中有10個元素,我們可以創建10個線程,把每個線程扔到一個GPU核心中去運行。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

圖片圖片he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

程序員該怎么寫代碼,來表達這個想法呢?he728資訊網——每日最新資訊28at.com

CUDA

he728資訊網——每日最新資訊28at.com

英偉達的CUDA是一個并行計算平臺,可以讓程序員可以通過C、C++等語言在GPU上并行執行代碼。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

圖片圖片he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

在CUDA中,把CPU所在的部分叫做Host,GPU稱為Device,它們之間通過總線相連。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

圖片圖片he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

對于之前的例子,CUDA代碼是這樣的:he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

__global__ void vectorAdd(int* a, int* b, int* c){    int i = threadIdx.x;    c[i] = a[i] + b[i];    return;}

he728資訊網——每日最新資訊28at.com

估計大部分小伙伴都能猜出來這段代碼的含義。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

a,b分別是兩個要想加的數組,c用來保存結果。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

__global__應該是個指示符,表示這段代碼是個“內核函數”,要被放到GPU上來執行。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

threadIdx是個什么東西?he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

似乎是個線程的索引,找到這個線程的index以后,取出a,b中index對應的值,加起來放到c中。例如index是0,那就取出a[0],b[0]加起來,放到c[0]中,這就實現了我們之前的想法。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

值得注意的是,這里的a,b,c不是Host的內存,而是Device(GPU)的內存,所以我們得把原始的數據復制到GPU中。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

1. 先在GPU中分配內存he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

int* cudaA = 0;int* cudaB = 0;int* cudaC = 0;// 使用cudaMalloc在GPU中分配內存cudaMalloc(&cudaA,sizeof(a));cudaMalloc(&cudaB,sizeof(b));cudaMalloc(&cudaC,sizeof(c));

he728資訊網——每日最新資訊28at.com

2.然后把原始數據從Host復制到Device(即GPU)中he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

//注意第4個參數,是從Host 到 DevicecudaMemcpy(cudaA, a, sizeof(a), cudaMemcpyHostToDevice);cudaMemcpy(cudaB, b, sizeof(b), cudaMemcpyHostToDevice);

he728資訊網——每日最新資訊28at.com

3. 調用內核函數he728資訊網——每日最新資訊28at.com

vectorAdd <<<1, sizeof(a) / sizeof(a[0])>>> (cudaA, cudaB, cudaC);

he728資訊網——每日最新資訊28at.com

調用vectorAdd的時候,被<<< >>>包圍起來的部分是配置參數,這里指定了一組10個線程(數組長度為10)。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

這10個線程會被放到10個GPU核心中去執行,他們的索引是從0到9。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

所以在vectorAdd函數中可以通過threadIdx.x引用到當前線程的索引,例如9 , 那就知道當前線程要做的事情:把a[9]和b[9]加起來,放到c[9]中。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

這樣10個GPU核心就是同時執行10次加法,速度飛快。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

4. 把結果復制回Host

he728資訊網——每日最新資訊28at.com

// 注意第4個參數,是從Device 到 HostcudaMemcpy(c, cudaC, sizeof(c), cudaMemcpyDeviceToHost);

he728資訊網——每日最新資訊28at.com

小伙伴們肯定已經意識到了,這里邊有個核心的概念:Thread(線程),每個線程都會被映射到一個GPU核心去執行。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

圖片圖片he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

多個Thread可以組成一個塊(Block),被映射到多個核心he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

圖片圖片he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

多個Block又形成一個Grid,被映射到整個CPUhe728資訊網——每日最新資訊28at.com

圖片圖片he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

在啟動內核函數的時候,需要指定配置參數,它的格式是:he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

kenerl_function<<<grid_size,block_size>>>he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

就是告訴CUDA,這次運行的grid的size和block的size,在我們的例子中vectorAdd<<<1,10>>>表示的意思是:Grid中只有一個block,這個block中有10個Thread。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

Grid和Block都可以是1維,2維,3維的,這里就不詳細描述了。he728資訊網——每日最新資訊28at.com

CUDA生態

he728資訊網——每日最新資訊28at.com

前面介紹的是CUDA的冰山一角,希望小伙伴們對CUDA,對GPU編程有個初步認識。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

大家也肯定意識到了上面很多cuda開頭的各種函數,上層的應用一旦開始使用它們,基本上就和英偉達的CUDA生態綁定了。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

圖片圖片he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

在CUDA發展過程中,一個斯坦福的博士生起到了關鍵作用。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

1999年,Nvidia發布了一塊叫GeForce的顯卡,它的圖形處理性能非常出色,非常適合《雷神之錘》游戲。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

這時候,斯坦福博士Ian Buck出場了,他瘋狂地將32塊GeForce顯卡連接在一起,再加上8臺投影儀,實現了8K分辨率的《雷神之錘》。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

玩歸玩,他還研究了一下GeForce顯卡自帶的一個非常原始的編程工具,隨后在DARPA的資助下,實現了在GPU上進行通用并行編程。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

隨后他便加入了英偉達,負責英偉達超級計算包(就是CUDA)的開發。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

英偉達的黃教主認為超級計算在未來必將平民化,英偉達要通過CUDA成為領先者。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

CUDA的軟硬件開發耗資巨大,當2006年正式推出的時候,科技界反應冷淡,認為英偉達瞄準了一個小眾的市場,數十億美元投資有可能打水漂。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

英偉達為了推銷CUDA,在金融、石油勘探、分子生物等方面孜孜不倦地尋找客戶,但都沒有起色。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

CUDA發展艱難,沒有關鍵應用,缺少重要客戶支持。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

2008年底,英偉達的股票下跌了70%。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

轉折點出現在2012年,Hinton團隊僅用4個GTX580顯卡,利用CUDA技術進行訓練出的神經網絡,獲得了ImageNet比賽的第一名!he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

機器學習,深度學習徹底被引爆了。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

黃仁勛的“賭注”成功了,他在一封郵件中說道:....我們不在是一家GPU公司了,我們是一家AI公司.....he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

英偉達開始和Google,Facebook等公司合作,推廣開源AI框架TensorFlow、PyTorch,當然,它們都構建在CUDA之上。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

圖片圖片he728資訊網——每日最新資訊28at.com

CUDA徹底統治了AI市場,隨后CUDA又發力機器人,自動駕駛等領域。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

2023年,以ChatGPT為代表的大模型爆火,英偉達的GPU供不應求,被搶爆了,GPU和CUDA一起攻城掠地,無人可擋。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

經過17年的發展,繼Windows+Intel , Android + ARM之后,又一個龐大的生態形成了。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

這個生態的厲害之處在于:它牢牢占據了軟件和硬件的結合之處,CUDA的設計基本就是英偉達硬件形態的抽象。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

如果其他GPU廠商想兼容CUDA,就得跟隨英偉達的硬件路線,亦步亦趨,相當難受。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

如果想重建一套新的生態和API,就會遇到那個老大難問題:軟件生態。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

英偉達開發了世界上性能最強的GPU,又有著CUDA這個寬廣的護城河,照理說,國內廠商是沒啥辦法的,不用也得用。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

但是美國政府送上了神助攻,繼A100及H100,連中國專供的“閹割版”A800和H800也不讓賣了,禁令甚至波及到了消費級的4090。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

原來大家都用英偉達,根本看不上國內產品,現在好了,不得不選國內GPU,比如華為昇騰。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

雖然性能差一些,編程接口難用一些,但有總比沒有強。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

去年11月,百度已經下令將“文心一言”使用的芯片,改向華為芯片,并且為200臺服務器購買了1600顆華為昇騰910B AI芯片。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

360也表示,采購了華為1,000片左右的AI芯片,和華為合作將AI框架移植到華為昇騰910B的AI芯片。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

在實際應用中不斷反饋、改善,國產的人工智能芯片肯定會越來越好。he728資訊網——每日最新資訊28at.com

he728資訊網——每日最新資訊28at.com

這么發展下去,國內肯定會建立起自己的GPU生態,也會有自己的CUDA。he728資訊網——每日最新資訊28at.com

本文鏈接:http://m.www897cc.com/showinfo-26-66202-0.html厲害,美國人又搞了一個壟斷的生態系統

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 在實際項目中如何評估數據庫的實際需求?

下一篇: CSS 滾動驅動動畫實現圓弧滾動條

標簽:
  • 熱門焦點
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
亚洲经典三级| 女仆av观看一区| 亚洲精品欧美极品| 亚洲韩国精品一区| 亚洲精品一区二| 亚洲自拍三区| 欧美在线视频免费观看| 久久视频精品在线| 牛人盗摄一区二区三区视频| 国产精品hd| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ入口 | 午夜精品国产精品大乳美女| 亚洲一区二区三区三| 午夜精品福利一区二区蜜股av| 久久精品人人做人人综合| 欧美成人综合网站| 欧美日一区二区在线观看 | 亚洲精品视频免费| 亚洲精品久久| 久久精品成人| 欧美日韩精品免费| 国产亚洲欧洲997久久综合| 亚洲日本视频| 久久国产福利| 欧美天天影院| 亚洲国产精品成人精品| 亚洲综合日韩在线| 欧美国产亚洲精品久久久8v| 国产午夜精品久久久久久久| 9l国产精品久久久久麻豆| 久久五月天婷婷| 国产精品都在这里| 亚洲国产天堂久久综合| 先锋影音国产精品| 欧美日韩色婷婷| 亚洲国产成人久久| 久久精品国内一区二区三区| 国产精品激情av在线播放| 亚洲电影免费观看高清完整版在线观看| 亚洲欧美日韩在线观看a三区| 欧美另类一区| 伊人成人网在线看| 欧美一级视频精品观看| 欧美日韩在线一区二区三区| 亚洲国产视频直播| 久久久久久久久久久久久女国产乱| 国产精品成人va在线观看| 91久久在线播放| 久久香蕉国产线看观看av| 国产欧美va欧美不卡在线| 国产精品99久久久久久白浆小说| 欧美成人免费全部观看天天性色| 国模 一区 二区 三区| 亚洲综合精品四区| 欧美午夜精品久久久久久人妖 | 香蕉久久精品日日躁夜夜躁| 免费国产自线拍一欧美视频| 国产又爽又黄的激情精品视频| 亚洲一区二区三区免费观看| 欧美日韩国产丝袜另类| 亚洲国产精品一区| 久久手机免费观看| 国产在线一区二区三区四区| 欧美一区二区性| 国产欧美一区二区三区在线看蜜臀| 亚洲天堂av在线免费| 欧美日韩精品免费观看| 亚洲欧洲日产国产网站| 欧美aaaaaaaa牛牛影院| 在线观看欧美| 老司机精品视频网站| 黄色成人av在线| 久久久久九九九九| 国产一区二区三区成人欧美日韩在线观看 | 国内精品美女在线观看| 性做久久久久久| 国产精品一区二区你懂得| 亚洲一区自拍| 国产伦精品一区二区三区四区免费 | 国产一区二区av| 欧美在线观看www| 国产网站欧美日韩免费精品在线观看 | 亚洲视频在线播放| 欧美性猛交xxxx乱大交蜜桃| 一区二区三区不卡视频在线观看| 欧美日韩一区二区三区免费看| 一区二区三区成人| 国产精品国产三级欧美二区| 亚洲自拍偷拍一区| 国产乱码精品一区二区三| 欧美一区亚洲二区| 狠狠色狠狠色综合日日小说| 老色鬼久久亚洲一区二区| 亚洲国产成人tv| 欧美另类一区| 亚洲午夜精品久久| 国产欧美精品一区| 久久久亚洲国产美女国产盗摄| 亚洲国产你懂的| 欧美日韩一区综合| 亚洲欧美综合| 狠色狠色综合久久| 欧美国产综合视频| 一区二区日韩免费看| 国产精品免费一区二区三区观看| 欧美在线免费视频| 在线精品视频免费观看| 欧美久久久久中文字幕| 亚洲伊人久久综合| 国产一区二区三区四区五区美女| 蜜桃av噜噜一区二区三区| 一本色道久久综合精品竹菊 | 国产日韩欧美| 免费观看30秒视频久久| 日韩天堂在线观看| 国产精品激情| 久久人体大胆视频| 99热免费精品| 国产亚洲欧美色| 美女精品在线观看| 亚洲午夜精品17c| 一区二区视频在线观看| 欧美理论在线播放| 欧美一区二区网站| 亚洲欧洲精品一区二区三区不卡| 欧美精品videossex性护士| 国产在线乱码一区二区三区| 久久久久久久综合| 亚洲激情国产| 国产精品久久| 久久久久久夜| 夜夜精品视频一区二区| 国产婷婷色一区二区三区四区| 久久综合999| 国产精品99久久久久久久久| 韩国在线一区| 欧美三区在线| 久久人人97超碰精品888 | 蜜臀va亚洲va欧美va天堂| 9l国产精品久久久久麻豆| 国产亚洲欧美日韩美女| 欧美女人交a| 久久久www| 亚洲婷婷免费| 亚洲国产精品欧美一二99| 国产精品青草久久| 欧美大片va欧美在线播放| 亚洲欧美一级二级三级| 亚洲国产高清在线| 国产乱码精品一区二区三区av| 欧美激情一二三区| 久久国产欧美精品| 久久精品综合| 欧美高清视频一区| 一区二区三区欧美视频| 国产综合久久久久影院| 欧美日韩大陆在线| 久久精品成人欧美大片古装| 一区二区欧美日韩视频| 亚洲高清久久网| 国产日韩欧美高清免费| 欧美日韩免费网站| 久久综合九色欧美综合狠狠| 亚洲欧美欧美一区二区三区| 亚洲精品色婷婷福利天堂| 国内精品久久久久久久果冻传媒| 欧美午夜无遮挡| 欧美精品二区| 老司机午夜免费精品视频| 欧美一级黄色网| 亚洲视频在线播放| 亚洲精品美女91| 在线国产亚洲欧美| 国产亚洲欧洲997久久综合| 国产精品v日韩精品| 欧美激情在线免费观看| 亚洲国产第一页| 国产午夜精品一区二区三区视频| 国产精品久久久久久av福利软件| 欧美高清视频免费观看| 久久综合色影院| 久久精品国产99| 欧美亚洲一区在线| 亚洲男人av电影| 亚洲少妇自拍| 一本久久a久久免费精品不卡| 亚洲国产精品一区二区第一页| 狠狠色狠狠色综合人人| 国产一区在线播放| 国产日韩欧美高清免费| 国产精品视频在线观看| 国产精品成人播放| 欧美午夜在线观看| 国产精品成人v| 国产精品极品美女粉嫩高清在线| 欧美三级视频| 欧美亚州在线观看| 欧美午夜在线视频| 国产精品久久久久77777| 国产精品国产三级国产普通话蜜臀 | 亚洲国产另类久久精品| 在线免费观看视频一区| 在线不卡亚洲| 亚洲国产成人av在线|