隨著 AI 從回答問題邁向自主執行和創造,行業開始進入真正的 Agentic AI 落地元年。這不僅改變了應用形態,也正在重塑整個AI技術棧的底層邏輯。
與此同時,智能體體系結構的復雜度呈指數級增長,從任務規劃、工具調用到長期記憶,每一環節都對底層框架提出了更高要求。對此,PPIO 聯合創始人兼 CEO 姚欣表示:
能看到無論是 PC 時代,還是移動時代、云時代,操作系統才是最核心的中間層。
這意味著,未來的 AI 應用將從回答問題的工具轉向能夠直接完成任務的助手,而要承載這類能力,行業迫切需要一種新的基礎設施——Agent 時代的操作系統。
在近期量子位 MEET2026 智能未來大會上,姚欣圍繞智能體演進、Agent Infra 等關鍵詞分享了自己對AI底層基礎設施架構重塑的判斷:
今天的 Agent 會成為未來 AI 應用的主力,而 Agent Infra 會成為下一個AI時代的操作系統。
無論模型能力如何提升,無論應用形態如何演進,未來趨勢都指向同一個目標:在 AI 時代,通過新的Runtime體系,實現模型能力、工具能力與執行能力的高度融合。

以下為姚欣演講全文:
AI 從生成式邁向 Agent 時代
大家好,我今天分享的主題也是很多嘉賓講的新話題 Agentic AI——今年 AI 進入了到一個全新的時代。
過去一周,豆包手機橫空出世,它能夠自動幫你下單、比價、執行任務,這正是我們今年所看到的——從 Generative AI 向 Agent AI 的進步。
AI 以前更多只是做一些聊天、回答問題;而從年初的 Manus、Genspark,到現在的豆包手機,這些產品越來越清晰地展示出AI應用開始像智能體一樣自動化完成任務和進行創作。

今天提到智能體這個話題的時候,我發現行業內,特別國內很多人把它定位成工作流。
以前像扣子那樣的編排工具,只能算是最早期的智能體形態,并不是完全體。
今天真正的完全態智能體需要具備自主分析、自主決策以及自動化完成任務的能力,而執行與落地正是其中的關鍵環節。
同時,我們之前在很多 AI 工具中看到的 Deep Research 功能,雖然能幫助做搜索和處理,但我認為這仍然只是智能體的早期階段,真正的智能體需要全新的架構和全新的形態。
真正的智能體 需要從能力堆疊走向系統化結構
2023 年的時候,OpenAI 研究員 LilianWeng 也發了一篇很著名的論文,《LLM Powered Autonomous Agents》。
這篇文章里面揭示了真正的智能體有哪些核心的組件,包括四個核心的元素:Memory、Planning、Tools、Action。

在梳理每個核心組件的特點和特性時,發現了這樣一些類比:如果把智能體當作數字生命體,那么 Memory 有點像大腦的記憶功能,負責短期記憶、長期記憶,甚至需要具備遺忘能力;Planning 更像思考單元,能夠進行深度推理和深度分析。
Tools、Action 則更像我們的五官,能夠感知外部世界發生了什么,甚至像手和腳一樣去影響和改造外部世界。真正的智能體不僅是執行的機器,更重要的是具備從思考到執行再到分析的一整套綜合系統。
我們想一想,什么樣的系統是既能做資源的管理又能做記憶的管理,甚至調用大量的工具呢?
我認為今天的智能體的基礎設施更像以前的操作系統,這里我列舉了一下過去三四十年一系列操作系統的發展和誕生,能看到無論從 PC 時代到移動時代還是到云時代,操作系統才是最核心的中間層。

一方面,它要管理大量不同的異構資源,把計算資源、硬件資源,以及各類異構的記憶、存儲、傳輸能力整合起來。
另一方面,還需要把這些能力抽離并抽象成標準化的功能調用,暴露給上層應用,讓開發者可以輕松進行二次開發,而無需針對每一種硬件結構單獨開發。
無論是在 PC 時代、手機時代,還是云時代,操作系統始終扮演著這樣的角色。
Agent Infra:未來 AI 時代的新操作系統
我提出一個看法:今天我們做的 Agent Infra,本質上是在構建 AI 時代的操作系統。
傳統操作系統管理 CPU、內存、存儲等硬件資源,而 Agent Infra 管理的是模型能力、工具調用能力,以及任務和執行能力,在這個維度上完成資源管理、統一調度與抽象,讓上層開發者能夠更方便地進行應用構建。
在整個 Agent Infra 體系中,最核心的部分我們認為是 Runtime。
Runtime 解決的是“能不能跑起來”的問題,真正的智能體能否在各種環境下大規模、通用地適配并穩定運行,依賴的正是把不同能力進行綜合調度的 Runtime,這也是 Agent Infra 的核心所在。

PPIO 是一家 AI 云計算公司,我們從底層算力到 IaaS、PaaS、再到 MaaS,逐層構建了完整的 AI 云能力,為 Agent Infra 提供底座支撐。

自 2020 年算力出現短缺開始,我們整合大量數據中心閑置算力,構建分布式算力網絡。如今我們在中國已有 4000+ 算力節點、1300 多個能提供大量分布式算力的合作伙伴;2023 年從 CPU 擴展到 GPU;2024 年我們在全球六大洲三十多個地區和國家開始部署算力網絡能力,整合全球各地的算力資源,這是我們的第一層。
第二層是 GPU 推理云平臺。2023 年我們打造了第一代推理云平臺,實現異構算力的統一調度。2024 年推出分布式推理引擎,并托管近百個開源與社區模型,每天處理接近 2000 億 Token,為模型提供推理加速、降本和性能增強,是支撐開源模型落地的重要基礎。
基于前期積累,我們在今年 WAIC 發布了首個兼容 E2B 的 Agent沙箱,以 Runtime 為核心整合模型調用、短期/長期記憶和數據庫能力,幫助頭部 Agent 廠商規?;涞?,通過更安全、敏捷的沙箱體系降低錯誤率。
該沙箱是專為 Agent 執行任務設計的云端運行環境,為 Agent 賦予安全可靠、高效敏捷的“手和腳”,沙箱內支持動態調用 Browser use、Computer use、MCP、RAG、Search 等各種工具。

PPIO Agent沙箱基于 Firecracker MicroVM 構建,具備強安全隔離、毫秒級極速啟動、高并發創建三大特性,無需預部署,即啟即用,讓 Agent 的所有操作均處于“受限、可控”的狀態。
強安全隔離,讓不同 Agent 沙箱的環境可實現完全隔離,當多個任務并發執行時,每個任務都能在獨立環境中運行,從根源上避免數據泄漏和資源搶占沖突。
小于 200ms 的極速啟動時間,遠遠小于傳統虛擬機沙箱數分鐘甚至更長的時效,可瞬間創建沙箱環境、運行生成的代碼并展示預覽效果,大幅提升用戶的開發流暢度。
并且 PPIO Agent沙箱還支持同時快速啟動數千個沙箱實例的高并發創建能力,可充分滿足業務場景中的高并發需求,加快結果交付速度,保障用戶體驗。
沙箱上線以來,月度活躍數在持續增長,我們希望通過 Agent Infra 成為 AI 時代新的操作系統,幫助更多開發者成長與創業。