123,123,123

<i id="x3s8a"></i>

新聞頻道行業(yè)資訊企業(yè)動態(tài) 展會報道人物專訪產品新聞政策法規(guī) 技術前沿研究報告

傳動網 > 新聞頻道 > 行業(yè)資訊 > 資訊詳情

OpenAI即將推出Agent模式，AI能力又進一步

時間：2025-07-22

來源： OFweek 人工智能網

導語：2025年下半年伊始，始終致力于定義AI領域的OpenAI，正式推出了其Agent模式的解決方案。

　　這一方案使ChatGPT能在虛擬沙盒中調用文本瀏覽器、可視化瀏覽器和終端工具，自主完成多步驟復雜任務，實現從信息檢索到在線購物等操作，開啟了從Chat到Agent的跨越。

　　OpenAI自己的Agent模式亮相

　　近日，薩姆·奧爾特曼與四位OpenAI研究員通過直播形式介紹了即將發(fā)布的Agent模式。

　　觀其演示過程可發(fā)現，該模式在用戶交互層面的直觀體驗，與數月前引發(fā)廣泛關注的Manus模式極為相似。

　　當用戶提出需求后，系統(tǒng)均會自動創(chuàng)建一個虛擬環(huán)境，并開始執(zhí)行任務。

　　任務執(zhí)行期間，Agent會反復請求用戶確認操作步驟，并允許用戶隨時手動接管進程。

　　同時，用戶亦可在任務執(zhí)行過程中插入新的需求指令，實現實時交互。

　　OpenAI首席執(zhí)行官山姆奧特曼表示，目睹ChatGPT智能體運用計算機執(zhí)行復雜任務，使其真切感受到AGI的存在。計算機自主完成思考、規(guī)劃與執(zhí)行的過程，將產生顯著差異的體驗。

　　所有操作均在ChatGPT Agent專屬虛擬計算機中完成，此舉可在調用多工具時完整保留任務上下文信息。

　　該智能體可根據需求選擇文本瀏覽器或可視化瀏覽器訪問網頁，執(zhí)行文件下載操作，通過終端命令處理文件，并借助可視化瀏覽器審閱輸出結果。

　　同時能夠動態(tài)調整任務策略，以實現高效、精準的快速執(zhí)行。

　　ChatGPTAgent專為迭代式、協同式工作流程設計，其交互性與靈活性遠超既往模型。

　　任務執(zhí)行過程中，用戶可隨時中斷進程：進一步澄清指令以修正執(zhí)行方向，或直接變更任務目標。智能體將基于新增信息繼續(xù)推進工作，且完整保留先前進度。

　　同理，ChatGPT亦會在必要時主動要求用戶補充細節(jié)，確保任務執(zhí)行不偏離既定目標。

　　若任務耗時超出預期或陷入停滯，用戶可選擇暫停進程、獲取進度摘要，或終止任務以提取現有成果。

　　當用戶安裝移動端ChatGPT應用時，系統(tǒng)將在任務完成后推送通知。

　　由Operator+Deep Research工具整合而成

　　根據OpenAI的介紹，Agent模式可調用三種工具：文本瀏覽器、可視化瀏覽器及終端。模型具備自主選擇并切換這些工具的能力。

　　此工具組合的設計頗具巧思：文本瀏覽器專司大量文本信息的瀏覽與檢索，可視化瀏覽器則負責在定位信息后執(zhí)行鍵鼠操作或讀取圖像信息。

　　而終端工具，則用于運行代碼、生成包括演示文稿與電子表格在內的文件，并調用特定的云端應用程序接口。

　　OpenAI此次推出的新型Agent模式，并非一項全新的技術創(chuàng)新，實則由該公司上半年發(fā)布的兩項工具——Operator與Deep Research整合而成。

　　Operator原為僅向Pro用戶開放的瀏覽器Agent工具，具備分析圖形操作界面并執(zhí)行基礎操作的能力。

　　Deep Research則是一款深度研究分析工具，可讀取大量網頁內容并直接生成調研報告。

　　OpenAI在分別推廣這兩項工具時發(fā)現，許多用戶通過Operator提交的提示指令更趨近于DeepResearch的任務范疇，例如[規(guī)劃旅行行程并進行預訂];

　　而Deep Research用戶強烈呼吁的[登錄網站、訪問受保護資源]功能，實為Operator已具備的能力。

　　這兩個從不同維度推進的Agent項目最終實現整合，產生了顯著的協同效應。

　　既規(guī)避了單純依賴瀏覽器圖形界面處理文本材料的低效問題，又使得生成深度研究報告所需時長顯著縮短。

　　實現了通用智能體能力的關鍵升級

　　與過往的基礎大模型迭代不同，通用Agent能夠自主調用多種工具進行任務規(guī)劃，協助用戶完成復雜操作，包括自動查閱用戶日歷、生成可編輯的PPT文檔、運行代碼等。

　　ChatGPT Agent可連接用戶的Gmail、GitHub等平臺獲取信息并解決問題，同時通過API接口訪問各類應用程序。

　　OpenAI采用模擬復雜現實任務的基準測試對該模型進行評估。

　　經Agent技術增強后，AI智能水平實現大幅提升。

　　基于ChatGPTAgent的模型在HLE基準測試中獲得41.6%的評分，達到O3與O4-mini模型性能的近兩倍。

　　在部構建的復雜經濟價值知識型任務評估體系中，ChatGPTAgent的產出質量約半數情況下達到甚至超越人類水平，任務完成時間存在浮動區(qū)間，且顯著優(yōu)于o3與o4-mini模型。

　　在SpreadsheetBench表格操作測試中，該智能體處理復雜電子表格的編輯、函數應用及格式規(guī)范能力取得顯著突破，以45.5%的得分達到GPT4o性能的兩倍，首次逼近ExcelCopilot商業(yè)級解決方案水平。

　　網頁操作領域，ChatGPT Agent在WebArena測試中成功執(zhí)行賬戶登錄、頁面跳轉、數據采集等現實任務，其表現已接近人類平均水準。

　　信息檢索能力方面，該智能體于BrowseComp基準測試中以68.9分創(chuàng)下當前最高記錄。此項指標直接決定其自主執(zhí)行任務時的可靠性水平。

　　結尾：

　　OpenAI的正式入場，或將重塑Agent創(chuàng)業(yè)領域的整體敘事框架。

傳動網版權與免責聲明：

凡本網注明[來源：傳動網]的所有文字、圖片、音視和視頻文件，版權均為傳動網(www.connectcrack.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“傳動網”，違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件，均來自互聯網或業(yè)內投稿人士，版權屬于原版權人。轉載請保留稿件來源及作者，禁止擅自篡改，違者自負版權法律責任。

如涉及作品內容、版權等問題，請在作品發(fā)表之日起一周內與本網聯系，否則視為放棄相關權利。

新一代工業(yè)機器人解決方案推薦，助力中國制造業(yè)智能化轉型

隨著中國制造業(yè)的轉型和《中國制造2025》的全面實施，工業(yè)機器人行業(yè)得以快速發(fā)展。

返回新聞首頁

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊