9 月 12 日,在 GOSIM2025 大會(huì)上,清華大學(xué)攜手中國(guó)軟件評(píng)測(cè)中心聯(lián)合發(fā)布了《2025 大模型服務(wù)性能排行榜》,PPIO 在 DeepSeek-R1-0528的吞吐測(cè)試中排名第一。
該榜單從延遲、吞吐、可靠性等關(guān)鍵指標(biāo)切入,由專業(yè)團(tuán)隊(duì)通過(guò)長(zhǎng)周期、高頻率、多時(shí)段的數(shù)據(jù)評(píng)測(cè),直觀呈現(xiàn)不同MaaS供應(yīng)商的服務(wù)表現(xiàn)。而且,平臺(tái)以匿名用戶身份對(duì) MaaS(Model as a Service)平臺(tái)開展產(chǎn)品端到端的性能測(cè)評(píng),從評(píng)測(cè)主體與流程上雙重保障了客觀公正性。
本次評(píng)測(cè)覆蓋多個(gè)代表性模型,包括 DeepSeek-R1-0528、DeepSeek-V3.1、Kimi-K2-Instruct 等。PPIO 在 20 余家 MaaS 供應(yīng)商中表現(xiàn)突出。
其中,在 DeepSeek-R1-0528 的吞吐測(cè)試中,PPIO 以 45.17 tokens/s 的成績(jī)位列第一。在 DeepSeek V3.1、Kimi-K2-Instruct 等模型測(cè)試中,PPIO 在吞吐與延遲性能上也取得了前五名的成績(jī)。

吞吐 (Throughput) 與延遲 (Latency) 與 是評(píng)測(cè)模型表現(xiàn)的兩個(gè)重要維度。吞吐(Throughput)衡量在單位時(shí)間內(nèi)可處理的 Token 數(shù)量,高吞吐代表平臺(tái)能支撐更多用戶同時(shí)使用,尤其適合大規(guī)模應(yīng)用場(chǎng)景;延遲(Latency)衡量用戶從輸入到獲得首個(gè)回復(fù)所需的時(shí)間,低延遲意味著更快的響應(yīng)速度,直接影響用戶體驗(yàn)。
PPIO 在這兩個(gè)維度都表現(xiàn)優(yōu)秀,不僅能提供流暢的實(shí)時(shí)交互,也能在高并發(fā)和大規(guī)模任務(wù)處理中保持穩(wěn)定。這意味著 PPIO 的算力調(diào)度、模型部署、系統(tǒng)優(yōu)化等推理優(yōu)化的核心技術(shù),已獲得行業(yè)的權(quán)威認(rèn)可。
作為國(guó)內(nèi)領(lǐng)先的獨(dú)立分布式云計(jì)算服務(wù)商,PPIO 將持續(xù)優(yōu)化 AI 基礎(chǔ)設(shè)施,致力于為人工智能、智能體、實(shí)時(shí)音視頻處理、具身智能等新一代場(chǎng)景,提供極致?性價(jià)?、超彈性、低延遲的?站式智算、模型及邊緣計(jì)算服務(wù)。