DeepSeek在知乎平臺(tái)上發(fā)布了關(guān)于其V3/R1推理系統(tǒng)的概覽,揭示了該系統(tǒng)理論上可達(dá)545%的成本利潤(rùn)率。該系統(tǒng)通過(guò)大規(guī)模跨節(jié)點(diǎn)專(zhuān)家并行技術(shù),旨在提升吞吐量和降低延遲。
DeepSeek的V3和R1模型采用了混合專(zhuān)家模型(MoE)架構(gòu),將復(fù)雜任務(wù)分解為多個(gè)子任務(wù),由不同子模型處理,從而在有限資源下實(shí)現(xiàn)高效運(yùn)算。然而,這一技術(shù)也帶來(lái)了更大的批次處理需求和負(fù)載均衡挑戰(zhàn)。
據(jù)DeepSeek透露,其V3和R1模型平均占用226.75個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)配置8個(gè)H800 GPU。
在假設(shè)GPU租賃成本為每小時(shí)2美元的情況下,每日運(yùn)營(yíng)成本高達(dá)8.7萬(wàn)美元。但按照R1當(dāng)前的定價(jià)策略,DeepSeek的每日潛在營(yíng)收可達(dá)56.2萬(wàn)美元,理論成本利潤(rùn)率驚人。
然而,DeepSeek強(qiáng)調(diào),這一理論數(shù)據(jù)僅供參考,實(shí)際情況可能有所不同。V3模型的定價(jià)較低,且收費(fèi)服務(wù)僅占其業(yè)務(wù)的一部分。
此外,在非高峰時(shí)段,DeepSeek還提供使用折扣,進(jìn)一步影響實(shí)際營(yíng)收。同時(shí),研發(fā)和訓(xùn)練成本也是不可忽視的因素,這些因素都可能對(duì)DeepSeek的實(shí)際盈利產(chǎn)生影響。
本文鏈接:http://m.www897cc.com/showinfo-27-135677-0.htmlDeepSeek公布成本利潤(rùn)率高達(dá)545%,但實(shí)際情況或有出入
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 惠普發(fā)布2025財(cái)年第一季度財(cái)報(bào),并計(jì)劃調(diào)整供應(yīng)鏈布局