AI芯天下丨熱點丨OpenAI即將推出Agent模式,AI能力又進一步

時間:2025-07-23

來源:維科網(wǎng)

導(dǎo)語:2025年下半年伊始,始終致力于定義AI領(lǐng)域的OpenAI,正式推出了其Agent模式的解決方案。

  2025年下半年伊始,始終致力于定義AI領(lǐng)域的OpenAI,正式推出了其Agent模式的解決方案。

       這一方案使ChatGPT能在虛擬沙盒中調(diào)用文本瀏覽器、可視化瀏覽器和終端工具,自主完成多步驟復(fù)雜任務(wù),實現(xiàn)從信息檢索到在線購物等操作,開啟了從Chat到Agent的跨越。

       OpenAI自己的Agent模式亮相

       近日,薩姆·奧爾特曼與四位OpenAI研究員通過直播形式介紹了即將發(fā)布的Agent模式。

       觀其演示過程可發(fā)現(xiàn),該模式在用戶交互層面的直觀體驗,與數(shù)月前引發(fā)廣泛關(guān)注的Manus模式極為相似。

       當(dāng)用戶提出需求后,系統(tǒng)均會自動創(chuàng)建一個虛擬環(huán)境,并開始執(zhí)行任務(wù)。

       任務(wù)執(zhí)行期間,Agent會反復(fù)請求用戶確認(rèn)操作步驟,并允許用戶隨時手動接管進程。

        同時,用戶亦可在任務(wù)執(zhí)行過程中插入新的需求指令,實現(xiàn)實時交互。

       OpenAI首席執(zhí)行官山姆奧特曼表示,目睹ChatGPT智能體運用計算機執(zhí)行復(fù)雜任務(wù),使其真切感受到AGI的存在。計算機自主完成思考、規(guī)劃與執(zhí)行的過程,將產(chǎn)生顯著差異的體驗。

        所有操作均在ChatGPT Agent專屬虛擬計算機中完成,此舉可在調(diào)用多工具時完整保留任務(wù)上下文信息。

       該智能體可根據(jù)需求選擇文本瀏覽器或可視化瀏覽器訪問網(wǎng)頁,執(zhí)行文件下載操作,通過終端命令處理文件,并借助可視化瀏覽器審閱輸出結(jié)果。

       同時能夠動態(tài)調(diào)整任務(wù)策略,以實現(xiàn)高效、精準(zhǔn)的快速執(zhí)行。

       ChatGPTAgent專為迭代式、協(xié)同式工作流程設(shè)計,其交互性與靈活性遠超既往模型。

       任務(wù)執(zhí)行過程中,用戶可隨時中斷進程:進一步澄清指令以修正執(zhí)行方向,或直接變更任務(wù)目標(biāo)。智能體將基于新增信息繼續(xù)推進工作,且完整保留先前進度。

       同理,ChatGPT亦會在必要時主動要求用戶補充細節(jié),確保任務(wù)執(zhí)行不偏離既定目標(biāo)。

       若任務(wù)耗時超出預(yù)期或陷入停滯,用戶可選擇暫停進程、獲取進度摘要,或終止任務(wù)以提取現(xiàn)有成果。

       當(dāng)用戶安裝移動端ChatGPT應(yīng)用時,系統(tǒng)將在任務(wù)完成后推送通知。

       由Operator+Deep Research工具整合而成

       根據(jù)OpenAI的介紹,Agent模式可調(diào)用三種工具:文本瀏覽器、可視化瀏覽器及終端。模型具備自主選擇并切換這些工具的能力。

       此工具組合的設(shè)計頗具巧思:文本瀏覽器專司大量文本信息的瀏覽與檢索,可視化瀏覽器則負責(zé)在定位信息后執(zhí)行鍵鼠操作或讀取圖像信息。

       而終端工具,則用于運行代碼、生成包括演示文稿與電子表格在內(nèi)的文件,并調(diào)用特定的云端應(yīng)用程序接口。

       OpenAI此次推出的新型Agent模式,并非一項全新的技術(shù)創(chuàng)新,實則由該公司上半年發(fā)布的兩項工具——Operator與Deep Research整合而成。

       Operator原為僅向Pro用戶開放的瀏覽器Agent工具,具備分析圖形操作界面并執(zhí)行基礎(chǔ)操作的能力。

       Deep Research則是一款深度研究分析工具,可讀取大量網(wǎng)頁內(nèi)容并直接生成調(diào)研報告。

       OpenAI在分別推廣這兩項工具時發(fā)現(xiàn),許多用戶通過Operator提交的提示指令更趨近于DeepResearch的任務(wù)范疇,例如[規(guī)劃旅行行程并進行預(yù)訂];

       而Deep Research用戶強烈呼吁的[登錄網(wǎng)站、訪問受保護資源]功能,實為Operator已具備的能力。

       這兩個從不同維度推進的Agent項目最終實現(xiàn)整合,產(chǎn)生了顯著的協(xié)同效應(yīng)。

       既規(guī)避了單純依賴瀏覽器圖形界面處理文本材料的低效問題,又使得生成深度研究報告所需時長顯著縮短。

       實現(xiàn)了通用智能體能力的關(guān)鍵升級

       與過往的基礎(chǔ)大模型迭代不同,通用Agent能夠自主調(diào)用多種工具進行任務(wù)規(guī)劃,協(xié)助用戶完成復(fù)雜操作,包括自動查閱用戶日歷、生成可編輯的PPT文檔、運行代碼等。

       ChatGPT Agent可連接用戶的Gmail、GitHub等平臺獲取信息并解決問題,同時通過API接口訪問各類應(yīng)用程序。

       OpenAI采用模擬復(fù)雜現(xiàn)實任務(wù)的基準(zhǔn)測試對該模型進行評估。

       經(jīng)Agent技術(shù)增強后,AI智能水平實現(xiàn)大幅提升。

       基于ChatGPTAgent的模型在HLE基準(zhǔn)測試中獲得41.6%的評分,達到O3與O4-mini模型性能的近兩倍。

       在部構(gòu)建的復(fù)雜經(jīng)濟價值知識型任務(wù)評估體系中,ChatGPTAgent的產(chǎn)出質(zhì)量約半數(shù)情況下達到甚至超越人類水平,任務(wù)完成時間存在浮動區(qū)間,且顯著優(yōu)于o3與o4-mini模型。

       在SpreadsheetBench表格操作測試中,該智能體處理復(fù)雜電子表格的編輯、函數(shù)應(yīng)用及格式規(guī)范能力取得顯著突破,以45.5%的得分達到GPT4o性能的兩倍,首次逼近ExcelCopilot商業(yè)級解決方案水平。

       網(wǎng)頁操作領(lǐng)域,ChatGPT Agent在WebArena測試中成功執(zhí)行賬戶登錄、頁面跳轉(zhuǎn)、數(shù)據(jù)采集等現(xiàn)實任務(wù),其表現(xiàn)已接近人類平均水準(zhǔn)。

       信息檢索能力方面,該智能體于BrowseComp基準(zhǔn)測試中以68.9分創(chuàng)下當(dāng)前最高記錄。此項指標(biāo)直接決定其自主執(zhí)行任務(wù)時的可靠性水平。

       結(jié)尾:OpenAI的正式入場,或?qū)⒅厮蹵gent創(chuàng)業(yè)領(lǐng)域的整體敘事框架。數(shù)月前,Manus尚被譽為[國產(chǎn)Agent的希望]:其于業(yè)界尚未充分理解Agent概念之際,率先向市場展示了未來圖景,實證了AI執(zhí)行復(fù)雜任務(wù)的現(xiàn)實潛力。然今年7月初,Manus官網(wǎng)悄然關(guān)閉,中國大陸業(yè)務(wù)全面暫停,僅保留海外產(chǎn)品線——此舉促使外界重新審視Agent初創(chuàng)企業(yè)的真實生存狀態(tài)。數(shù)日前,朱嘯虎曾公開斷言:大模型將吞噬90%的Agent市場。毋庸置疑,此現(xiàn)象背后交織著監(jiān)管政策、合規(guī)要求與資本環(huán)境等多重復(fù)雜因素。但現(xiàn)在的問題又來到了,當(dāng)OpenAI親自下場,初創(chuàng)通用型Agent的機會已經(jīng)不多了。


AI
中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.connectcrack.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0