
中國經濟導報、中國發(fā)展網訊 4月23日,商湯科技在上海舉辦技術交流日活動,發(fā)布行業(yè)首個“云、端、邊”全棧大模型產品矩陣,以滿足不同規(guī)模場景的應用需求。同時還全新升級“日日新SenseNova 5.0”大模型體系,其綜合能力全面對標GPT-4 Turbo,技術領跑加速生成式AI向產業(yè)落地的全面躍遷,實現(xiàn)大模型按需所取。
在人工智能發(fā)展的最基本法則——尺度定律(Scaling Law)的準則下,商湯持續(xù)尋求最優(yōu)數(shù)據(jù)配比并建立數(shù)據(jù)質量評價體系,推動自身大模型研發(fā)的同時,也為行業(yè)伙伴提供大模型訓練、微調、部署和各類生成式AI的能力及服務。商湯科技董事長兼CEO徐立表示,商湯在尺度定律的指導下,會持續(xù)探索大模型能力的KRE三層架構(知識—推理—執(zhí)行),不斷突破大模型能力邊界。
自去年4月首次發(fā)布,商湯“日日新SenseNova”大模型體系已正式推出五個大版本迭代。基于超過10TB tokens訓練、覆蓋大量合成數(shù)據(jù),全新的“日日新SenseNova 5.0”(以下簡稱:日日新5.0)采用混合專家架構,推理時上下文窗口可以有效到200K左右。
據(jù)悉,本次更新主要聚集增強了知識、數(shù)學、推理及代碼能力,全面對標 GPT-4 Turbo,主流客觀評測上達到或超越 GPT-4 Turbo。在文科能力方面,“日日新5.0”的創(chuàng)意寫作能力、推理能力以及總結能力均大幅提升,相同的中文知識注入后,可以獲得更好的理解總結及問答,為教育、內容產業(yè)等垂直應用場景提供有力輔助。在理科能力方面,“日日新5.0”數(shù)理能力、代碼能力及推理能力達到業(yè)內領先水平,為金融、數(shù)據(jù)分析等場景落地提供堅實基礎。

此外,本次發(fā)布的“日日新5.0”另一核心指標就是多模態(tài)能力,商湯多模態(tài)大模型的圖文感知能力達到全球領先水平,在多模態(tài)大模型權威綜合基準測試MMBench中綜合得分排名首位,在多個知名多模態(tài)榜單MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU 取得領先成績。同時,還在應用產品層面也實現(xiàn)了更卓越的多模態(tài)能力,支持高清長圖的解析和理解以及文生圖交互式生成,還可以實現(xiàn)復雜的跨文檔知識抽取及總結問答展示,還具備豐富的多模態(tài)交互能力。
前瞻洞察中心化算力需求向端側擴展的未來趨勢及企業(yè)級在邊緣側的AI需求,商湯科技領先業(yè)內首次推出“云、端、邊”全棧大模型產品矩陣,其中包括應用于終端設備的“商湯端側大模型”,以及面向金融、代碼、醫(yī)療、政務等多個領域的邊緣產品“商湯企業(yè)級大模型一體機”。
今年是端側大模型應用的元年,為了滿足移動終端用戶對大模型技術的應用需求,商湯推出日日新·端側大模型,性能實現(xiàn)同等尺度性能最優(yōu),跨級尺度全面領先。同時,還推出端云協(xié)同解決方案,可以通過智能化判斷協(xié)同發(fā)揮端云各自優(yōu)勢,需要聯(lián)網搜索或處理復雜場景時分流至云端處理,部分場景端側處理占比超過80%,從而顯著降低推理成本。

據(jù)了解,商湯日日新·端側大語言模型的推理速度達到了業(yè)內最快,可在中端平臺實現(xiàn)18.3字/s的平均生成速度,旗艦平臺更是達到了78.3字/s。擴散模型同樣可在端側實現(xiàn)業(yè)內最快的推理速度,端側LDM-AI擴圖技術在某主流平臺上,推理速度小于1.5秒,比友商云端app快10倍,支持輸出1200萬像素及以上的高清圖片,支持在端上快速進行等比擴圖、自由擴圖、旋轉擴圖等圖像編輯功能。
對于金融、代碼、醫(yī)療、政務等重點行業(yè)邊緣側日益增長的AI應用需求,商湯推出企業(yè)級大模型一體機,可同時支持企業(yè)級千億模型加速和知識檢索硬件加速,實現(xiàn)本地化部署,即買即用,降低企業(yè)應用大模型的門檻。相比行業(yè)同類產品,推理成本節(jié)約80%,檢索大大加速,CPU工作負載50%。
當天,商湯科技董事長兼CEO徐立還帶來了三段完全由大模型生成的視頻,并強調文生視頻平臺對于人物、動作和場景的可控性。通過商湯打造的智能算力中心,可以不斷賦能于大模型的訓練,目前,日日新大模型體系在自然語言處理、視頻生成和深度學習優(yōu)化等多個方面取得創(chuàng)新。未來,通過輸入一段文字或一個完整的描述,就可以生成一段視頻,而且人物的服飾、發(fā)型、場景都可以根據(jù)預先設定,保持視頻內容的連貫性和一致性。(倪珺)
本文鏈接:http://m.www897cc.com/showinfo-28-7983-0.html商湯科技發(fā)布行業(yè)首個“云、端、邊”全棧大模型布局 實現(xiàn)AI自由
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 上海“文化人才之家”浦東世博璟尚項目啟用
下一篇: “鏈”動長三角,“破”浪“慧”新篇