美國加州大學(xué)圣地亞哥分校近日發(fā)布了一項研究成果,首次提供了“人工智能系統(tǒng)能夠通過標(biāo)準(zhǔn)三方圖靈測試的實證證據(jù)”。
圖靈測試由英國數(shù)學(xué)家阿蘭?圖靈于1950年提出,被稱為“模仿游戲”。測試中,提問者需通過文本交流區(qū)分對方是機(jī)器還是人類。如果提問者無法準(zhǔn)確辨別,那么該機(jī)器可能被認(rèn)為具備類似人類的智能。在三方圖靈測試中,提問者需與一名人類和一臺機(jī)器對話,并判斷哪一方是人類。
研究測試了三款A(yù)I模型,包括OpenAI的GPT-4.5、Meta的Llama 3.1 405B,以及OpenAI的GPT-4o。實驗中,人類參與者通過分屏界面與一名人類和一臺AI系統(tǒng)進(jìn)行五分鐘的對話,結(jié)束后需判斷哪一方是人類。
研究人員在兩種模式下評估了這些AI模型的表現(xiàn):基礎(chǔ)指令(NO-PERSONA)模式和增強(qiáng)型PERSONA模式。后者引導(dǎo)AI模擬特定的人類行為特征。結(jié)果顯示,在PERSONA模式下,GPT-4.5的勝率高達(dá)73%,表明提問者常將其誤認(rèn)為是人類;Llama 3.1-405B的勝率約為56%;而在NO-PERSONA模式下,GPT-4o的勝率僅為21%。
對話內(nèi)容主要圍繞日常閑聊展開,其中61%的互動涉及日常生活和個人細(xì)節(jié),50%的互動則探討社會和情感層面,如觀點、情感、幽默感和個人經(jīng)歷。
研究報告指出:“如果提問者無法可靠地區(qū)分人類與機(jī)器,那么該機(jī)器即被認(rèn)為通過了圖靈測試。”基于這一標(biāo)準(zhǔn),GPT-4.5和Llama 3.1-405B在啟用PERSONA模式時均通過了測試。
研究人員認(rèn)為,這些AI系統(tǒng)在依賴簡短對話的經(jīng)濟(jì)角色中,有望補(bǔ)充甚至取代人類勞動力。此外,這些系統(tǒng)可能成為難以區(qū)分的替代品,適用于從在線陌生人對話到與朋友、同事乃至浪漫伴侶的交流等場景。
本文鏈接:http://m.www897cc.com/showinfo-27-140906-0.htmlAI系統(tǒng)通過圖靈測試:GPT-4.5勝率高達(dá)73%
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 法拉第未來發(fā)布FX系列前臉設(shè)計,計劃2025年底前投產(chǎn)
下一篇: 印度科技初創(chuàng)公司IPO熱潮將至,未來兩年或迎30家企業(yè)上市
標(biāo)簽: