日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 網絡

DeepSeek昨天開源的新模型 有點邪門

來源: 責編: 時間:2025-10-22 13:25:10 44觀看
導讀 DeepSeek 又整出新東西來了,只用到原本十分之一 token,就能存下幾乎一樣的文字信息,這壓縮比,香農看了都要流淚,馮·諾伊曼看了都要沉默。更是直接把一堆老外給釣成了翹嘴。昨天,DeepSeek 發布了新模型 Dee

DeepSeek 又整出新東西來了,只用到原本十分之一 token,就能存下幾乎一樣的文字信息,這壓縮比,香農看了都要流淚,馮·諾伊曼看了都要沉默。55N28資訊網——每日最新資訊28at.com

更是直接把一堆老外給釣成了翹嘴。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

昨天,DeepSeek 發布了新模型 DeepSeek-OCR,OCR 這東西咱們都熟悉,就是把圖片里的文字給識別出來。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

經常用微信的差友應該知道,微信客戶端里的圖片,被咱們點開后,是可以直接復制文字的。55N28資訊網——每日最新資訊28at.com

沒錯,這就是一種 OCR 技術的應用。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

但是 DeepSeek 這次的 「技能 OCR」則是剛好相反,它可以把大量文字變成一張圖片,作為 AI 的“記憶載體”。55N28資訊網——每日最新資訊28at.com

是的,用文字來存儲信息,已經不夠滿足它了。55N28資訊網——每日最新資訊28at.com

過去的大模型,不管是什么 ChatGPT、Gemini、Llama、Qwen、還是 DeepSeek 過去的自己,在讀取數據的用的都是一種方式:文字,也就是平時常說的 token。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

我們寫的 Prompt,會被轉換成一大堆的 token 給大模型,我們提供的參考資料,會被轉換成一大堆的 token 給大模型,就算是能識別圖像的多模態的大模型,也是要先把圖片轉換成了一段文字描述,來交給大模型來做辨認才行。55N28資訊網——每日最新資訊28at.com

但文字 token 真的就是大模型理解世界的唯一方式么?55N28資訊網——每日最新資訊28at.com

DeepSeek 決定試一試新的路子,畢竟,如果咱們把一張圖片和一段文字放在一起,前者明顯可以包含下更多的信息。55N28資訊網——每日最新資訊28at.com

比如這個描述,就不夠全面55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

既然如此,那我們能不能直接用圖片來訓練大模型?55N28資訊網——每日最新資訊28at.com

于是 DeepSeek 就開始整,結果發現這個用圖片訓練出來的模型,既中看,又中用。55N28資訊網——每日最新資訊28at.com

一方面,它可以用更少的 token,來記住更多的內容。55N28資訊網——每日最新資訊28at.com

在測試文檔理解能力的任務里,DeepSeek-OCR 只用了 100 個視覺 token, 就超過了需要 256 個 token 的 GOT-OCR 2.0。55N28資訊網——每日最新資訊28at.com

再放狠點,它用 不到 800 個視覺 token, 就吊打了平均要 6000+ token 的 MinerU 2.0。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

這就意味著、當我們讓大模型開始使用圖像的這種方式來記住數據了之后,模型就有能力用更少的token資源,來取得更好的表達效果。55N28資訊網——每日最新資訊28at.com

另外,DeepSeek-OCR 還支持多種分辨率和壓縮模式,來適應不同復雜度的文檔:55N28資訊網——每日最新資訊28at.com

比如說一張只有圖片背景和標題文案的 PPT,可能只需要 64 個 視覺token 就足夠表示了。55N28資訊網——每日最新資訊28at.com

如果這頁的文字內容比較多,那就會自動切換到 Large 模式,用上多 400 個 視覺token 來記錄。55N28資訊網——每日最新資訊28at.com

如果覺得還不夠的話,DeepSeek-OCR 還能支持動態調整的 Gundam 模式來記憶圖片,主打一個應記就記,分清輕重緩急的記。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

而且比起過去只能識別文字的傳統模型來說,DeepSeek-OCR 能記住的數據還會更多。55N28資訊網——每日最新資訊28at.com

論文里的一張柱狀體,DeepSeek-OCR 能夠自動把它給識別成 Excel 格式給保存下來。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

文章里出現的有機化合物的分子結構圖片,也能自動轉化為標準的 SMILES(簡化分子線性輸入規范)格式存儲。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

不但能記住圖片本身,DeepSeek-OCR 還會同時記住這張圖片的位置,記住圖片附近的文字在寫些什么東西。。。55N28資訊網——每日最新資訊28at.com

過去很多看不到的二維信息,都會被 DeepSeek-OCR 給再次捕獲。55N28資訊網——每日最新資訊28at.com

這玩意的價值有多大,可能大家一下都還沒意識到。55N28資訊網——每日最新資訊28at.com

這兩年做大模型,除了顯卡不夠之外的大問題,就是沒有訓練的數據了。55N28資訊網——每日最新資訊28at.com

常規的數據集之前都用過了,想要再搞點高質量的數據集,要么偷偷去網上爬,要么花大價錢去買,再要么就是想辦法自己合成。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

但現在,很多過去沒采集到的數據,就可以在二維信息里被采集到了。55N28資訊網——每日最新資訊28at.com

就比如說很多論文文件,過去,大模型只能學到里面的文字信息,但是里面的各種圖表,插圖那都是兩眼一摸黑。55N28資訊網——每日最新資訊28at.com

但用上了 DeepSeek-OCR 之后,就可以把之前缺的這部分給無痛補上了。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

實際上 DeepSeek 也是這么想的,在論文里還特意提了一嘴,說這個新模型在一張 A100 上,一天可以給大模型采集出 20 萬頁以上的訓練數據。55N28資訊網——每日最新資訊28at.com

所以說,在有了 DeepSeek-OCR 之后,過去的所有數據都值得用它來再識別一遍。55N28資訊網——每日最新資訊28at.com

毫無疑問,這些數據,又會成為下一個大模型的養料。55N28資訊網——每日最新資訊28at.com

另一方面,用二維的方式來存儲數據后,整個模型運行起來也變得更省資源了。55N28資訊網——每日最新資訊28at.com

咱都知道,我們在用大模型的時候,聊天聊的越久、上下文越長,這個模型就越容易出 bug。55N28資訊網——每日最新資訊28at.com

這是因為大模型在運行的時候,要處理每一個單詞,和其他所有單詞的關系。55N28資訊網——每日最新資訊28at.com

你把對話的長度增加一倍,整個模型的計算量就增加了四倍,增加了兩倍,那整個模型的計算量就變成了原本的九倍。55N28資訊網——每日最新資訊28at.com

這也是為啥現在大模型廠商都在給你限制上下文長度的原因之一,你要是在一個對話里聊的太嗨了的話,成本要直接卷上天去了。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

而在用上了圖像記憶之后,DeepSeek 可以把 token 的數量,壓縮到原本的十分之一。。。55N28資訊網——每日最新資訊28at.com

同時,還不會讓性能有太大的損失。55N28資訊網——每日最新資訊28at.com

在論文里可以看到,初出茅廬的 DeepSeek-OCR,就能用原本 1/10 的token 數量,達到原模型 96.5%的準確率。55N28資訊網——每日最新資訊28at.com

即使哥們再狠點,給它壓縮個20倍,模型的準確率,也還能保持個六成左右。。。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

同時,DeepSeek 的研究人員還發現了一件好玩的事情。55N28資訊網——每日最新資訊28at.com

他們會感覺大模型通過不同的清晰度來存儲圖像的方式,其實和我們人類遺忘信息的方式很像。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

對我們人類來說,遺忘是一個循序漸進的過程。55N28資訊網——每日最新資訊28at.com

剛發生的事情,就有點像是 DeepSeek 用 Gundam 模式存下來的數據,清晰。55N28資訊網——每日最新資訊28at.com

而隨著時間的推移,這件事的重要性也會逐漸降低,存儲它的格式也會從大的 Gundam 一路降級,從 Large 一路降到小的 Tiny,占用的 token 數量也會越來越少。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

把這個概念引入到大模型里的話,咱們就可以把近的聊天記錄,用“4K HDR藍光” 的格式來存儲,而那些早年不太重要的聊天記錄,則是給壓縮成 480P 的文件保存。55N28資訊網——每日最新資訊28at.com

通過這種主動遺忘的方式,是否能讓大模型的上下文能力變得更強呢?55N28資訊網——每日最新資訊28at.com

這個想法很有意思,只不過目前就連 DeepSeek 自己也沒能給出一個明確的答案。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

不過好在 DeepSeek-OCR 還是和過去一樣開源的,相信這個問題,要不了多久就會變成熱門,整出不少新東西來。55N28資訊網——每日最新資訊28at.com

后,提到開源,我還注意到另外一件事。。。55N28資訊網——每日最新資訊28at.com

這次研究不但是 DeepSeek 自己的成果,也是開源社區集體的勝利55N28資訊網——每日最新資訊28at.com

比如訓練數據里,用到了 華為的 Wukong 數據集,在生成樣本文字時,借助了 百度的 PaddleOCR,而在圖像特征提取部分,核心組件竟然是 Meta 開源的 SAM,在視覺語義理解層面,還整合了 OpenAI 的 CLIP 模型。55N28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門55N28資訊網——每日最新資訊28at.com

正是這些來自全球的開源成果,被 DeepSeek 重新編織成了一個能“用圖片思考”的 AI。55N28資訊網——每日最新資訊28at.com

所以,R2 什么時候會來呢。55N28資訊網——每日最新資訊28at.com


文章出處:差評

本文鏈接:http://m.www897cc.com/showinfo-17-184425-0.htmlDeepSeek昨天開源的新模型 有點邪門

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI也缺卡!僧多粥少 自曝內部搶卡搶到發瘋

下一篇: 又菜又愛玩的荷蘭人 在安世半導體上翻車了

標簽:
  • 熱門焦點
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
在线国产欧美| 欧美婷婷久久| 欧美在线日韩| 久久精品一区二区三区不卡牛牛| 久久精品女人天堂| 免费欧美在线视频| 欧美日韩成人在线| 国产精品入口| 在线成人黄色| 99综合精品| 香蕉久久夜色精品| 久久婷婷国产麻豆91天堂| 欧美精品免费观看二区| 国产精品福利片| 国产一区二区三区四区hd| 亚洲激情电影在线| 在线亚洲国产精品网站| 免费视频最近日韩| 亚洲一区二区三区视频播放| 亚洲黑丝在线| 亚洲国产欧美久久| 亚洲欧美日韩直播| 在线一区视频| 中国日韩欧美久久久久久久久| 亚洲亚洲精品三区日韩精品在线视频| 欧美成人一区二区三区| 欧美刺激性大交免费视频| 亚洲一区欧美一区| 久久成人免费视频| 日韩午夜在线电影| 国产一区二区福利| 欧美高清日韩| 久久久91精品| 国产一区久久| 国内成+人亚洲| 亚洲成人中文| 国内精品久久久| 午夜在线精品偷拍| 欧美中文字幕久久| 欧美日本韩国| 久久国产欧美精品| 国产精品男女猛烈高潮激情| 一区二区亚洲精品国产| 欧美女激情福利| 亚洲天堂成人在线观看| 久久久久免费视频| 国产精品一区二区三区成人| 毛片av中文字幕一区二区| 国产日韩综合| 欧美日韩色一区| 久久这里只有| 久久精品亚洲乱码伦伦中文 | 欧美日韩国产区一| 国产精品视频一区二区高潮| 久久精品国产亚洲5555| 午夜影视日本亚洲欧洲精品| 亚洲欧美视频在线观看| 亚洲乱码久久| av成人免费| 国产精品天天看| 国产精品高精视频免费| 亚洲第一福利视频| 久久激情网站| 国产精品丝袜xxxxxxx| 一区电影在线观看| 欧美黄色片免费观看| 影音先锋欧美精品| 久久精品视频在线播放| 国产农村妇女精品一区二区| 亚洲一区二区三区777| 欧美日韩国产欧| 亚洲日本电影| 欧美h视频在线| 亚洲第一综合天堂另类专| 久久久久欧美| 国产在线播放一区二区三区| 欧美一区2区视频在线观看| 国产精品久久毛片a| 亚洲天堂网在线观看| 欧美天天视频| 亚洲午夜久久久| 欧美天堂亚洲电影院在线观看 | 韩日视频一区| 久久精品成人一区二区三区| 国产视频欧美| 久久国产福利| 国产资源精品在线观看| 久久免费黄色| 依依成人综合视频| 麻豆精品91| 亚洲激情国产精品| 欧美激情视频一区二区三区免费| 亚洲欧洲日产国产综合网| 美女图片一区二区| 91久久国产自产拍夜夜嗨| 欧美国产精品久久| 日韩网站在线| 欧美午夜久久| 午夜精品久久久久久久99樱桃| 国产精品一香蕉国产线看观看 | 国产午夜亚洲精品羞羞网站 | 久久精品99国产精品酒店日本| 国产一区二区三区四区五区美女 | 中文在线资源观看视频网站免费不卡| 欧美午夜欧美| 欧美一区二区视频97| 国产在线观看91精品一区| 久久免费视频网站| 亚洲精品久久久久| 国产精品扒开腿爽爽爽视频| 欧美在线观看视频| 在线不卡免费欧美| 欧美精品久久一区| 亚洲午夜av在线| 国产亚洲一区二区三区在线观看| 噜噜噜躁狠狠躁狠狠精品视频| 亚洲精品视频二区| 国产精品白丝黑袜喷水久久久| 欧美一区1区三区3区公司| 亚洲电影在线免费观看| 欧美日韩在线第一页| 性一交一乱一区二区洋洋av| 伊人久久噜噜噜躁狠狠躁 | 亚洲第一主播视频| 欧美日韩免费观看一区=区三区 | 欧美大学生性色视频| 一区二区三区欧美成人| 国产日韩欧美中文| 欧美高清你懂得| 亚洲欧美不卡| 伊人春色精品| 欧美日韩一区二区三区在线观看免| 午夜精品久久久久久久久久久久| 亚洲第一狼人社区| 国产精品成人国产乱一区| 久久精品在线播放| 99pao成人国产永久免费视频| 国产欧美另类| 欧美激情导航| 欧美一区二区三区免费观看| 亚洲日本精品国产第一区| 国产精品久久综合| 免费不卡在线观看| 亚洲永久精品国产| 亚洲国产经典视频| 国产精品嫩草影院一区二区| 欧美a级一区二区| 亚洲欧美日韩综合国产aⅴ| 亚洲大片免费看| 国产精品日韩在线| 欧美激情女人20p| 久久精品国内一区二区三区| 一本色道久久99精品综合 | 国产精品香蕉在线观看| 欧美成人首页| 欧美在线影院| 一区二区黄色| 在线观看91精品国产入口| 国产精品国产精品| 欧美国产日韩一区二区| 欧美中文字幕在线观看| 一区二区精品在线| 亚洲国产精品ⅴa在线观看 | 正在播放日韩| 亚洲国产高清在线观看视频| 国产视频一区在线观看一区免费 | 国产字幕视频一区二区| 国产精品www.| 欧美精品福利视频| 狂野欧美激情性xxxx欧美| 午夜精品av| 一区二区三区欧美| 亚洲精品网站在线播放gif| 国产综合亚洲精品一区二| 国产精品美女久久久久av超清 | 亚洲国产精品久久久久| 国产主播一区| 国产日韩精品在线观看| 国产精品久久夜| 欧美另类综合| 免费在线欧美视频| 久久久久久有精品国产| 欧美一区二区三区精品电影| 亚洲影院色在线观看免费| 99精品国产在热久久| 亚洲国产日韩欧美在线图片| 国模一区二区三区| 国内精品久久久久久| 国产美女精品视频| 国产精品日韩高清| 国产精品久久久久久妇女6080 | 久久免费视频网站| 久久精品视频一| 久久久九九九九| 久久精品国产视频| 久久国产精品99久久久久久老狼| 香蕉成人伊视频在线观看| 亚洲欧美日本日韩| 亚洲砖区区免费| 亚洲一区二区少妇| 亚洲免费婷婷| 午夜国产精品视频| 午夜欧美精品| 欧美一区永久视频免费观看|