亞馬遜近日震撼發(fā)布了Nova Act,這是一款旨在簡化網(wǎng)絡(luò)瀏覽與操作的通用人工智能代理。這款創(chuàng)新產(chǎn)品由亞馬遜在舊金山新建的AGI實驗室精心打造,不僅標志著亞馬遜在AI技術(shù)領(lǐng)域的又一重大突破,也預(yù)示著未來人機交互方式的深刻變革。
Nova Act的核心功能在于其能夠自主控制網(wǎng)絡(luò)瀏覽器,執(zhí)行一系列簡單卻實用的在線操作。為了賦能開發(fā)者,亞馬遜同步推出了Nova Act SDK,一個強大的工具包,讓開發(fā)者能夠基于Nova Act快速構(gòu)建并測試自己的AI代理原型。這一舉措無疑為AI技術(shù)的創(chuàng)新應(yīng)用開辟了廣闊空間。
值得注意的是,Nova Act還將作為即將面世的Alexa+升級版的關(guān)鍵組件,為亞馬遜廣受歡迎的語音助手增添生成式AI的強大能力。盡管目前提供的Nova Act版本被定位為“研究預(yù)覽版”,但其潛力已足以引起業(yè)界的廣泛關(guān)注。開發(fā)者可以通過訪問nova.amazon.com,獲取Nova Act工具包,并探索亞馬遜的各種Nova基礎(chǔ)模型。
在競爭激烈的AI市場中,Nova Act被視為亞馬遜對OpenAI的Operator和Anthropic的Computer Use等同類產(chǎn)品的有力回應(yīng)。這些科技巨頭普遍認為,能夠自主導(dǎo)航網(wǎng)絡(luò)、執(zhí)行任務(wù)的AI代理將極大提升現(xiàn)有AI聊天機器人的實用性和用戶體驗。
亞馬遜在AI代理技術(shù)領(lǐng)域的布局雖非最早,但憑借Alexa+的龐大用戶基礎(chǔ),其覆蓋范圍無疑是最廣泛的。Nova Act SDK的推出,使得開發(fā)者能夠整合多種工具,讓AI代理輕松實現(xiàn)網(wǎng)頁瀏覽、表單填寫、日歷管理等操作,進一步拓展了AI技術(shù)的應(yīng)用場景。
據(jù)亞馬遜透露,Nova Act在公司內(nèi)部的多項測試中表現(xiàn)優(yōu)異,特別是在衡量AI代理與屏幕文本交互能力的ScreenSpot Web Text測試中,Nova Act以94%的得分力壓OpenAI的CUA(88%)和Anthropic的Claude 3.7 Sonnet(90%)。然而,亞馬遜并未采用更常見的代理評估標準(如WebVoyager)對Nova Act進行基準測試,這在一定程度上引發(fā)了業(yè)界對其性能全面性的好奇與期待。
Nova Act的推出,是亞馬遜AGI實驗室的首款公開產(chǎn)品,該實驗室由前OpenAI研究員David Luan和Pieter Abbeel共同領(lǐng)導(dǎo)。兩位業(yè)界巨擘此前分別創(chuàng)立了Adept和Covariant等初創(chuàng)公司,去年被亞馬遜招致麾下,負責(zé)領(lǐng)導(dǎo)其AI代理項目。在Luan看來,AI代理是創(chuàng)建超級智能AI系統(tǒng)的關(guān)鍵一步,而Nova Act正是這一愿景的初步實現(xiàn)。
Luan表示,Nova Act SDK的設(shè)計初衷是確保AI代理能夠可靠地執(zhí)行簡短任務(wù),并為開發(fā)者提供精確控制代理工作流程的工具。他期望通過這一平臺,開發(fā)者能夠創(chuàng)建出更加可靠、實用的AI代理應(yīng)用程序,盡管這些應(yīng)用可能仍需要一定程度的人工干預(yù)。
隨著Nova Act的發(fā)布,亞馬遜正式加入了通用人工智能代理技術(shù)的競爭行列。這款產(chǎn)品的早期測試不僅讓人們得以窺見Alexa+的部分功能,更成為了亞馬遜AI努力能否取得成功的關(guān)鍵時刻。面對OpenAI、谷歌和Anthropic等競爭對手在AI代理技術(shù)上的挑戰(zhàn),亞馬遜能否破解可靠性難題,避免陷入同樣的困境,將是業(yè)界關(guān)注的焦點。
本文鏈接:http://m.www897cc.com/showinfo-21-140153-0.html亞馬遜發(fā)布Nova Act:AI代理能否革新網(wǎng)絡(luò)瀏覽器控制體驗?
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com