日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

新研究:人類讀指針鐘準確率近九成,頂尖AI模型準確率僅一成多

來源: 責編: 時間:2025-09-15 11:51:32 57觀看
導讀一項名為“ClockBench”的全新測試揭示,人類在讀取指針式時鐘方面的準確率高達89.1%,而當前最先進的人工智能模型準確率僅為13.3%。這一差距凸顯了AI在視覺推理能力上與人類的顯著差異,尤其是在處理復雜視覺信息時,AI的表

一項名為“ClockBench”的全新測試揭示,人類在讀取指針式時鐘方面的準確率高達89.1%,而當前最先進的人工智能模型準確率僅為13.3%。這一差距凸顯了AI在視覺推理能力上與人類的顯著差異,尤其是在處理復雜視覺信息時,AI的表現遠未達到預期水平。NaK28資訊網——每日最新資訊28at.com

NaK28資訊網——每日最新資訊28at.com

該測試由研究者阿萊克·薩法爾設計,旨在通過定制化的指針式時鐘數據集,評估AI在視覺推理任務中的表現。測試中,來自6家企業的11個大型語言模型與5名人類參與者展開對比。數據集包含180個獨特的指針式時鐘,涵蓋36種鐘面設計,融合了羅馬數字與阿拉伯數字、不同朝向、時針標識、鏡像布局及彩色背景等元素,確保測試的復雜性和多樣性。NaK28資訊網——每日最新資訊28at.com

每個時鐘需通過四類問題測試:讀取時間、時間計算、按特定角度調整指針及時區轉換。為保證公平性,數據集從零構建,避免與模型訓練數據重疊。測試結果顯示,AI模型在讀取時間時的中位誤差達1小時,而人類的中位誤差僅為3分鐘。性能最差的AI模型誤差甚至接近3小時,幾乎與隨機猜測無異。NaK28資訊網——每日最新資訊28at.com

在參與測試的AI模型中,谷歌旗下的Gemini 2.5 Pro以13.3%的準確率位居榜首,Gemini 2.5 Flash和GPT-5分別以10.5%和8.4%的準確率緊隨其后。然而,Grok 4模型的表現令人意外,其準確率僅0.7%,且將63.3%的時鐘判定為“無效”,遠高于實際無效時鐘的比例(180個中僅37個)。這種過度謹慎的策略雖在技術上增加了正確答案數量,但并未真正提升模型能力。NaK28資訊網——每日最新資訊28at.com

NaK28資訊網——每日最新資訊28at.com

測試還發現,鐘面特征對AI判斷影響顯著。當鐘面采用羅馬數字時,AI準確率驟降至3.2%;采用圓形數字時,準確率也僅為4.5%。秒針、彩色背景及鏡像布局均會干擾AI的判斷。相比之下,僅含時針的時鐘(準確率23.6%)和采用阿拉伯數字的標準時鐘,能讓AI取得相對更好的成績。NaK28資訊網——每日最新資訊28at.com

一個意外發現是,AI模型在成功讀取時間后,能正確完成時間計算、指針調整或時區轉換任務。這表明,AI的挑戰并非在于時間相關的數學運算,而在于從視覺信息中提取時間的初始步驟。薩法爾分析,原因可能包括:指針式時鐘讀取對視覺推理能力要求極高;罕見或特殊的鐘面設計在訓練數據中極少出現;以及將視覺信息轉化為文字描述對當前AI模型而言難度較大。NaK28資訊網——每日最新資訊28at.com

ClockBench被定位為長期基準測試,其完整數據集目前保密,以避免污染未來AI的訓練過程,但已有一個公開版本供測試使用。盡管AI在該測試中得分普遍較低,薩法爾認為,性能最佳的模型已展現出基礎的視覺推理能力,優于隨機猜測。然而,這些能力能否通過擴大現有方法規模提升,還是需要全新技術路徑突破,仍是一個待解的問題。NaK28資訊網——每日最新資訊28at.com

此前,中國一項研究也曾發現多模態語言模型存在類似短板,但當時GPT-4o模型在包含“讀時鐘、讀儀表”的任務中準確率達54.8%。此次ClockBench測試中,AI最高準確率僅為13.3%,既表明新基準測試難度顯著提升,也反映出AI在時鐘讀取能力上并未取得明顯進步。NaK28資訊網——每日最新資訊28at.com

   更多>同類資訊?OpenAI未來六年算力與研發投入或達3500億美元,2030年盈利穩定性存疑?09-14海馬emoji是否存在?ChatGPT等AI深陷“記憶迷局”反復糾錯難自明09-14螞蟻開源聯合Inclusion AI發布大模型生態全景圖,呈現AI開源新特征與三大開發趨勢09-14OpenAI稱GPT-5有博士級能力,谷歌DeepMind CEO:尚缺全面博士能力,AGI或需5到10年09-14缺錢仍具洞察:陶哲軒直指AI在數學研究中隱性目標被忽視之困09-14谷歌DeepMind CEO:當前AI系統難達博士級,GPT-5綜合能力被指差距大09-14OpenAI 2024-2030年擬投巨資:算力租賃與研發成本高企,盈利前景存疑09-14岳麓大會十二年:從“閉門論道”到“鏈上生長”,湖南數字生態如何崛起?09-14谷歌DeepMind CEO:當前AI系統難達博士級,GPT-5能力被指夸大09-14新學期新氣象!北京1400余所中小學全學段開設人工智能通識課09-14宇樹王興興福耀科大開講:AI時代機遇均等,新生當懷熱忱逐夢前行09-14螞蟻開源2025外灘大會發布大模型全景圖,AI開發現三大趨勢:工具、路線與生態分化月 13 日,在 2025 Inclusion·外灘大會AI開源見解論壇上,螞蟻開源聯合Inclusion AI 發布了全新的《全球大模型開源開發生態全景與趨勢告》。本次發布的大模型開源開發生態全景圖共收錄了…09-14?對話京東方陳炎順:AI驅動產業升級,未來三年500億研發攜手伙伴共拓新局?“早在2024年初,京東方就將AI提高到了企業的整體發展戰略”,陳炎順對作者表示,“一方面我們成立了AI+創新與應用委員會,要求以營業收入的0.5%來用于AI的研發。 陳炎順指出,從CES到SID等國際展會上…09-14OpenAI奧爾特曼坦言:ChatGPT問世后,模型細微調整牽動數億人思維行為致其難眠9月14日消息,據《財富》報道,OpenAI CEO 薩姆·奧爾特曼在接受采訪時表示,“自從 ChatGPT 推出以來,我就沒睡過一個好覺。” 奧爾特曼描述了監管這項如今每天有數億人使用的技術的壓力,他擔憂的…09-14上海創智學院:90后導師領航 博士CEO逐夢 機器人奇境挑戰未來2023年,劉鵬飛完成美國博后工作回國加盟上海交通大學,去年以雙聘的形式加盟創智學院,他深深感受時代的機遇正在眼前——“三個低概率事件”交匯:智能革命的發生、創智學院模式的獨一無二,學院對師生資源的傾斜。就…09-14點擊查看更多 +全站最新鴻蒙智行MPV新車諜照現身 智界品牌或迎新成員 明年上半年有望上市鴻蒙智行MPV新車諜照現身 智界品牌或迎新成員 明年上半年有望上市岳麓大會十二年:從“閉門論道”到“鏈上生長”,湖南數字生態如何崛起?岳麓大會十二年:從“閉門論道”到“鏈上生長”,湖南數字生態如何崛起?抖音圖文創作新思路:精選素材+用心運營,輕松開啟自媒體變現路!抖音圖文創作新思路:精選素材+用心運營,輕松開啟自媒體變現路!方形CMOS加持!iPhone 17前置攝像頭如何打破自拍構圖限制?方形CMOS加持!iPhone 17前置攝像頭如何打破自拍構圖限制??杭州全球農創客大賽落幕:AI養豬、超濾凈水,青年科技繪就農業新藍圖??杭州全球農創客大賽落幕:AI養豬、超濾凈水,青年科技繪就農業新藍圖?億級賣家吞吞揭秘:TikTok美區直播如何選渠道、控成本、定布局?億級賣家吞吞揭秘:TikTok美區直播如何選渠道、控成本、定布局?熱門內容
  • 熱度攀升!千億科技龍頭頻獲機構調研,業務增長透露哪些行業新動向?
  • 蘋果加速AI布局,或收購兩家法國AI初創企業
  • DeepSeek V3.1大模型升級,適配國產新芯片,性能顯著提升
  • 蘋果秋季發布會亮相iPhone 17系列:"史上最薄"Air登場,Pro Max 2TB版定價17999元
  • ?小米16系列或提前登場,首發驍龍8 Elite Gen5,9月機圈大戰一觸即發?
  • 蘋果AI布局加速,或將斥巨資收購歐洲兩大AI初創企業
  • 紅米Note15系列前瞻:7s芯片、7000mAh大電池,防水新標桿即將登場
  • 華為智能手表登頂全球,蘋果需直面挑戰求變革
  • 科創板AI基金8月22日凈值飆升7.79%,重倉股表現搶眼
  • vivo X300系列新機入網:首發LYT-828+2億像素,衛通版支持北斗衛星短信
  • ?字節跳動千人芯片團隊架構調整,轉至新加坡子公司Picoheart引關注?
  • 蘋果加速布局中國市場!Apple Intelligence和新版Siri或年底至明年上線
  • OpenAI沖刺5000億估值,GPT-5遇冷:資本狂歡與技術瓶頸的碰撞
  • 華為云重組風暴:多部門整合,聚焦AI領域引發關注
  • 科大訊飛2026秋招啟動,畢業兩年內可投,多樣崗位等你來選!
本欄最新岳麓大會十二年:從“閉門論道”到“鏈上生長”,湖南數字生態如何崛起?岳麓大會十二年:從“閉門論道”到“鏈上生長”,湖南數字生態如何崛起?新學期新氣象!北京1400余所中小學全學段開設人工智能通識課新學期新氣象!北京1400余所中小學全學段開設人工智能通識課宇樹王興興福耀科大開講:AI時代機遇均等,新生當懷熱忱逐夢前行宇樹王興興福耀科大開講:AI時代機遇均等,新生當懷熱忱逐夢前行螞蟻開源2025外灘大會發布大模型全景圖,AI開發現三大趨勢:工具、路線與生態分化螞蟻開源2025外灘大會發布大模型全景圖,AI開發現三大趨勢:工具、路線與生態分化?對話京東方陳炎順:AI驅動產業升級,未來三年500億研發攜手伙伴共拓新局??對話京東方陳炎順:AI驅動產業升級,未來三年500億研發攜手伙伴共拓新局?OpenAI奧爾特曼坦言:ChatGPT問世后,模型細微調整牽動數億人思維行為致其難眠OpenAI奧爾特曼坦言:ChatGPT問世后,模型細微調整牽動數億人思維行為致其難眠

本文鏈接:http://m.www897cc.com/showinfo-45-27565-0.html新研究:人類讀指針鐘準確率近九成,頂尖AI模型準確率僅一成多

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 美國最大出版商CEO控訴谷歌:用單一爬蟲抓內容助力AI,卻讓出版商陷入困境

下一篇: ?OpenAI未來六年算力與研發投入或達3500億美元,2030年盈利穩定性存疑?

標簽:
  • 熱門焦點
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
一区二区三区在线免费视频| 久久精品国产亚洲aⅴ| 亚洲国产一区二区视频| 亚洲欧洲精品一区二区三区| 亚洲精品国产视频| 亚洲一区视频在线观看视频| 性欧美长视频| 另类酷文…触手系列精品集v1小说| 欧美成人免费视频| 国产精品国产三级国产专播品爱网 | 国产精品高清一区二区三区| 欧美日韩国产在线播放网站| 国产精品专区h在线观看| 黄色精品网站| 一区二区欧美激情| 久久国产福利国产秒拍| 免费成人在线观看视频| 欧美午夜在线一二页| 国自产拍偷拍福利精品免费一| 亚洲欧洲日韩女同| 午夜一区不卡| 欧美福利精品| 国产欧亚日韩视频| 亚洲人午夜精品| 欧美一区二区私人影院日本| 欧美不卡在线| 国产麻豆精品视频| 99re66热这里只有精品4| 欧美一区二区在线观看| 欧美精品在线一区二区| 国产一区二区三区在线观看免费视频| 亚洲激情在线视频| 欧美一区二区三区四区在线观看地址| 欧美国产日本高清在线| 国产亚洲精品久久久久久| 99精品欧美一区| 久久亚洲图片| 国产精品自在线| 日韩视频久久| 久久香蕉国产线看观看网| 国产精品久久久久aaaa九色| 亚洲福利视频免费观看| 欧美一区二区在线视频| 欧美日韩精品一本二本三本| 在线不卡中文字幕| 午夜一区二区三区在线观看| 欧美日韩大片| 亚洲国产毛片完整版| 久久gogo国模裸体人体| 国产精品久久91| 亚洲免费av观看| 麻豆成人小视频| 国产一区清纯| 香蕉久久国产| 欧美亚洲第一页| 日韩视频中文| 欧美电影免费观看大全| 一区二区三区在线观看欧美| 欧美亚洲综合在线| 国产精品青草久久久久福利99| 亚洲精品乱码| 久久这里有精品视频| 国产亚洲欧洲| 欧美一级午夜免费电影| 国产精品高潮呻吟久久av无限| 亚洲精品免费观看| 欧美成人精品一区二区三区| 精品成人免费| 久久久久久九九九九| 国产亚洲精品高潮| 欧美影院久久久| 国产精品美女在线| 亚洲视频精选| 欧美视频在线观看视频极品| 日韩香蕉视频| 欧美日韩精品高清| 夜夜躁日日躁狠狠久久88av| 欧美日韩成人在线观看| 亚洲精品在线一区二区| 欧美精品日韩一本| 日韩一级免费| 欧美日韩国产免费观看| 日韩亚洲欧美一区| 欧美日韩国产美女| 在线亚洲免费视频| 国产精品扒开腿爽爽爽视频 | 1024精品一区二区三区| 久久婷婷激情| 亚洲电影激情视频网站| 巨乳诱惑日韩免费av| 亚洲风情在线资源站| 欧美成人激情视频| 亚洲精品偷拍| 欧美日韩一区二区三| 宅男66日本亚洲欧美视频| 国产精品99免费看 | 一区二区三区 在线观看视| 欧美日韩一区二区在线观看视频| 一区二区精品在线| 国产精品久久久久毛片软件 | 亚洲精品一区二区在线| 欧美日韩免费看| 亚洲一区二区在线播放| 国产欧美一区二区三区国产幕精品| 新片速递亚洲合集欧美合集 | 亚洲一区二区精品视频| 国产毛片精品国产一区二区三区| 欧美一区免费| 伊人久久大香线| 欧美不卡在线| 中文av一区特黄| 国产欧美一区二区三区沐欲| 久久婷婷激情| 亚洲精品久久久一区二区三区| 欧美日韩系列| 性色av一区二区三区在线观看| 国内视频一区| 欧美福利视频在线| 亚洲视频在线一区| 国产午夜精品在线| 欧美高清视频一区二区| 亚洲一区国产| 激情久久综合| 欧美日韩一区二区免费视频| 欧美亚洲一区二区在线| 亚洲电影天堂av| 欧美特黄一级大片| 久久国产99| 亚洲精品一品区二品区三品区| 国产精品国产三级国产aⅴ入口| 欧美在线观看视频在线| 91久久国产综合久久91精品网站| 欧美性猛交xxxx乱大交蜜桃| 久久精品视频亚洲| 日韩午夜三级在线| 国产一区二区日韩| 欧美日韩高清区| 久久成人一区二区| 亚洲精品三级| 国产欧美va欧美不卡在线| 嫩草成人www欧美| 亚洲综合色婷婷| 亚洲国产一区二区三区高清| 国产精品青草久久久久福利99| 久久在线91| 亚洲一区免费观看| 亚洲激情视频网站| 国产视频一区在线观看| 欧美乱大交xxxxx| 久久精品一区中文字幕| 亚洲最快最全在线视频| 久久精品72免费观看| 亚洲国产欧美久久| 国产精品免费一区二区三区在线观看 | 亚洲一区二区三区视频| 亚洲第一精品在线| 国产精品丝袜xxxxxxx| 欧美成人免费网站| 欧美专区福利在线| 亚洲视频狠狠| 亚洲精品视频二区| 狠狠综合久久| 国产精品中文在线| 欧美日韩精品系列| 欧美成人午夜影院| 欧美专区第一页| 亚洲欧美日韩另类精品一区二区三区 | 国产一二精品视频| 国产精品国产三级国产a| 欧美成人有码| 久久久天天操| 欧美怡红院视频| 亚洲综合色视频| 亚洲裸体在线观看| 亚洲东热激情| 黄色国产精品一区二区三区| 国产精品视频你懂的| 欧美三级网址| 欧美人成网站| 欧美黄色一区| 欧美99久久| 老司机午夜免费精品视频| 久久精品盗摄| 亚洲欧美日韩一区在线| 亚洲视频在线观看三级| 99ri日韩精品视频| 亚洲精品欧美精品| 亚洲欧洲日韩女同| 亚洲高清在线精品| 精品粉嫩aⅴ一区二区三区四区| 国产欧美一区二区色老头| 国产精品人人做人人爽人人添| 欧美三级电影网| 欧美日韩一区在线播放| 欧美日韩精品一区二区三区四区| 欧美国产免费| 欧美激情一区二区三区四区| 免费av成人在线| 欧美www在线| 欧美成人一区二区三区在线观看| 麻豆国产精品一区二区三区| 美脚丝袜一区二区三区在线观看| 久久嫩草精品久久久久| 久久青草欧美一区二区三区|