123,123

新聞頻道行業(yè)資訊企業(yè)動態(tài) 展會報道人物專訪產(chǎn)品新聞政策法規(guī) 技術(shù)前沿研究報告

傳動網(wǎng) > 新聞頻道 > 行業(yè)資訊 > 資訊詳情

AI的終極形態(tài)：是萬能神諭，還是無數(shù)個“專用智能”？

時間：2025-10-23

來源：智能制造網(wǎng)

導語：當AI開始主動為我們點擊按鈕、調(diào)試代碼、甚至操作整個瀏覽器時，一場靜默的變革正在數(shù)字世界蔓延。這個十月，谷歌讓AI真正“看見”并操控電腦屏幕，豆包在編程領(lǐng)域化身不知疲倦的專家助手，Open AI試圖重塑我們上網(wǎng)的入口，而DeepSeek則選擇成為賦能行業(yè)的“鑄劍人”。從對話到執(zhí)行，從工具到伙伴，AI正在重新定義與我們共處的方式——這場從“應(yīng)答”到“行動”的轉(zhuǎn)變，正在重塑我們與技術(shù)的未來。

　　曾幾何時，我們與AI的交流，仿佛隔著一灣湖水——它在水外，我們在水里，通過文字進行著一場場問答。但不知你是否察覺，那層界面正在悄然消失。AI不再只是對話框后的智慧大腦，它開始“伸出手”，為我們點擊按鈕、撰寫郵件、甚至調(diào)試代碼。在2025年10月的這個節(jié)點，從OpenAI、谷歌到DeepSeek、豆包，一系列新動向似乎都在共同訴說一個主題：那個只會聊天的AI，正努力成為我們數(shù)字生活中更具能動性的伙伴。

　　智能體的“分身術(shù)”：向內(nèi)深耕，向外拓界

　　AI智能體的集體亮相，是本月最引人注目的趨勢。當我們仔細觀察，會發(fā)現(xiàn)不同的“玩家”選擇了截然不同的進化路徑，這恰恰反映了他們對未來AI形態(tài)的不同理解。

　　大洋彼岸的另一端，谷歌Gemini展現(xiàn)了“通用操作者”的野心。10月8日凌晨，谷歌DeepMind重磅發(fā)布了基于Gemini 2.5的計算機使用模型Gemini 2.5 Computer，將AI智能體的戰(zhàn)場聚焦于瀏覽器交互這一核心場景。這款模型憑借視覺理解與推理能力支持13種瀏覽器操作，能夠?qū)崟r“看到”用戶的電腦屏幕，并且能像人類一樣進行點擊、輸入、滾動等操作。無論是整理表格數(shù)據(jù)還是在線預定行程，用戶只需要發(fā)出語音指令，Gemini便能自主輕松應(yīng)對。

　　“這相當于給AI裝上了‘眼睛’和‘雙手’?！盇I交互設(shè)計師陳曦在接受相關(guān)采訪時表示，“過去AI處理網(wǎng)頁任務(wù)需要提前定義規(guī)則，而Gemini 2.5能自主理解視覺元素的語義，比如區(qū)分‘提交’和‘重置’按鈕，這種泛化能力是關(guān)鍵突破?！?/p>

　　這也將表明，谷歌此次發(fā)布的Gemini 2.5直接向Open AI的ChatGPT智能體和Anthropic的Claude計算機使用版本發(fā)起沖擊。

　　當國外的AI志在成為“全能助理”時，國內(nèi)的市場又在發(fā)生什么?答案在對于具體場景的深度挖掘。就在谷歌發(fā)布新功能的同期，字節(jié)跳動的豆包選擇了“垂直場景專家”的路徑。10月21日，字節(jié)跳動旗下豆包編程完成版本升級，正式引入Agent能力并同步推出創(chuàng)作與問答兩種交互模式，面向開發(fā)者提供自動化編程輔助服務(wù)。該能力不僅能理解復雜的代碼邏輯，還能自動規(guī)劃步驟，調(diào)用代碼解釋器、終端命令行等工具，一鍵完成代碼修復、運行和測試。在編程這個垂直領(lǐng)域，豆包正在努力成為一位不可或缺的專家助理。

　　從通用的電腦操作到專業(yè)的編程輔助，AI智能體正根據(jù)不同的場景需求，分化出多元化的“人格”與能力。然而，能力的分化僅僅是開始，更深層次的競爭在于對這些能力載體的爭奪——即AI究竟應(yīng)該存在于哪里?

　　奔跑的方向：占據(jù)入口，還是鑄就基石?

　　當AI成為“執(zhí)行者”，競爭便不再局限于模型本身，而是上升到了對整個生態(tài)位的爭奪。這場爭奪戰(zhàn)在產(chǎn)業(yè)鏈的上下游同時打響，形成了“涇渭分明”的兩種商業(yè)模式。

　　在“應(yīng)用層”，我們目睹了一場“平臺夢”的上演。Open AI的ChatGPT Atlas是這一戰(zhàn)略的典范。它不再甘于只做一個網(wǎng)站或APP，而是直接發(fā)布了一款AI瀏覽器。10月22日消息，Open AI推出了一款AI驅(qū)動的網(wǎng)絡(luò)瀏覽器，這款名為ChatGPT Atlas的工具正式發(fā)布。根據(jù)Open AI的說法，ChatGPT正式開始在蘋果macOS平臺“全球”可用，而Windows、IOS和Android版本的訪問權(quán)限則“即將到來”。

　　就在Open AI試圖“向上”包攬用戶入口的同時，另一股力量則選擇“向下”深耕，為整個行業(yè)提供基礎(chǔ)設(shè)施。在“工具層”，DeepSeek則扮演了“技術(shù)賦能者”的角色。近日，DeepSeek在GitHub上開源了其最新研究成果——DeepSeek-OCR模型。該款模型以其創(chuàng)新的“視覺記憶壓縮”技術(shù)，精準地命中了長文本、長視頻處理中的效率與成本痛點。其核心創(chuàng)新在于構(gòu)建“視覺token”體系，通過多分辨率壓縮技術(shù)，將文檔信息轉(zhuǎn)化為不同精度的圖像編碼：簡單PPT僅需64個視覺token即可完整呈現(xiàn)，而復雜學術(shù)圖表則自動切換至400個token的精細模式。實驗數(shù)據(jù)顯示，在文檔理解任務(wù)中，該模型使用100個視覺token的表現(xiàn)已超越256個文本token的GOT-OCR 2.0，壓縮20倍時仍能保持60%準確率。這項技術(shù)革新不僅引發(fā)了海外開發(fā)者熱議，更被業(yè)界評價為“重新定義AI記憶機制”的重要嘗試。

　　DeepSeek不像Open AI那樣直接面向消費者做產(chǎn)品，而是通過向開發(fā)者和企業(yè)提供這類強大的底層技術(shù)工具，來繁榮整個應(yīng)用生態(tài)，如同為AI“淘金熱”提供了最鋒利的“鏟子”。

　　這種在生態(tài)位上的分化，自然而然地引出了一個根本性的戰(zhàn)略抉擇：面對即將到來的智能體時代，什么樣的技術(shù)開放策略才能贏得未來?

　　源代碼之外：開放的花園與封閉的城堡

　　上述不同的生態(tài)位選擇，自然也決定了它們截然不同的開放策略，這構(gòu)成了競爭的第三個維度，也是一場關(guān)乎AI技術(shù)將以何種方式普及的哲學辯論。

　　DeepSeek堅定走在“開源”的道路上。其發(fā)布的OCR模型的代碼與權(quán)重均已開放，這不僅能迅速吸引全球開發(fā)者基于其技術(shù)進行創(chuàng)新，也旨在通過技術(shù)貢獻來確立行業(yè)的事實標準，從底層推動整個產(chǎn)業(yè)的進步。俗話說，眾人拾柴火焰高，這種策略的核心就在相信于此。通過構(gòu)建繁榮的開發(fā)阿哲生態(tài)來間接確立影響力。

　　與此形成鮮明對比的是，Open AI與谷歌則繼續(xù)其“閉源整合”策略。它們將先進的智能體能力牢牢封裝在自己的產(chǎn)品中。這種策略旨在構(gòu)建從模型、產(chǎn)品到用戶的完整閉環(huán)，通過提供最佳體驗來保持其核心競爭力和商業(yè)護城河。它們賭的是，無縫集成的用戶體驗，將比開放的技術(shù)本身更具吸引力。

　　2025年10月的AI“賽馬場”，已不再是單一維度的競速，而是清晰地勾勒出一幅立體競爭的圖景。在這里，我們看到了“通用智能”與“垂直深度”的路徑分化，目睹了“平臺入口”與底層工具的生態(tài)位爭奪，更見證了“開源共享”與“閉源整合”的戰(zhàn)略博弈。未來的勝負手，不再是單一的模型性能評分，而是“技術(shù)深度(如DeepSeek的創(chuàng)新算法)”、“生態(tài)廣度”(如Open AI的平臺野心)與“產(chǎn)業(yè)理解力”(如豆包的場景深耕)的三重較量。

　　AI的進化，或許將告別對“宏大敘事”的迷戀，轉(zhuǎn)而投身于一場“細微的革命”。它的終極形態(tài)，不是唯一的解答，而是由無數(shù)個“專用”的智能，在具體細微的角落，完成它們各自的使命。當“執(zhí)行”取代“對話”成為核心，我們與技術(shù)的關(guān)系，便從提問與解答，走向了無聲的共生與共同的進化。

傳動網(wǎng)版權(quán)與免責聲明：

凡本網(wǎng)注明[來源：傳動網(wǎng)]的所有文字、圖片、音視和視頻文件，版權(quán)均為傳動網(wǎng)(www.connectcrack.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“傳動網(wǎng)”，違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件，均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士，版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者，禁止擅自篡改，違者自負版權(quán)法律責任。

如涉及作品內(nèi)容、版權(quán)等問題，請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系，否則視為放棄相關(guān)權(quán)利。

未來將由“光”書寫：光纖成為人工智能經(jīng)濟的核心支柱

光纖正成為人工智能基礎(chǔ)設(shè)施不可或缺的支撐，其作用與電力和處理器同等關(guān)鍵。AI未來的發(fā)展將不僅由算法和代碼驅(qū)動，更將由光纖承載的數(shù)據(jù)流定義。

返回新聞首頁