當前,全球范圍內創新型數據庫技術產品不斷涌現,市場格局劇烈變革,數據庫產業迎來快速爆發期。IDC發布的數據顯示,2022年全球數據庫市場規模有望突破400億美元。另據中國信通院測算,預計到2025年,中國數據庫市場總規模將達到688億元,市場年復合增長率為23.4%。
在數據庫市場越來越激烈的同質化競爭中,企業怎樣才能脫穎而出?矩陣起源(MatrixOrigin)創始人王龍表示,要想真正兌現市場潛力,企業的技術實力是決定性因素:“市場有多大,取決于我們在滿足這么大的市場需求的過程中,到底能夠做到多好。 ”
運行速度比同類產品快50%以上
2022年2月,矩陣起源剛剛發布了新一代超融合異構數據庫產品MatrixOne的0.2版本,面向公眾交出了自己的答卷。王龍的底氣從何而來?外界或可從這款產品的表現中一探究竟。
品牌官網發布的MatrixOne 0.2.0版本的性能測試報告顯示,根據在SSB測試集的測試結果,MatrixOne的性能在同等只PK計算引擎的能力維度下,表現已優于ClickHouse。此次測試環境由3臺16核32G內存的云主機搭建。在去除過濾、分區的前提下,只比較計算能力,在單表和多表測試查詢中,MatrixOne在每個查詢上的運行速度均快于Clickhouse,平均快50%以上。


切實有效的創新點之一,就是在計算引擎早期架構中即創新采用因子化拆解的工程實現提供自動化的計算下推,在多表復雜Join、分組聚合等核心算子實現上達到理論最優,在非主鍵join場景下超過其他所有的MPP數據庫計算引擎。在性能提升的同時,也從架構上簡化了查詢優化器的相關設計,在任意多表join上可以做到最壞情況下的理論最優解,避免了傳統優化器陷入局部次優解的局面。
另外一點是成功在向量化計算引擎內實現了高性能Hash表。為了避免Golang語言實現引起的開銷,Hash表在關鍵語句上引入了匯編來加速,并做到了并行無鎖執行,連同因子化加速技術一道確保了計算引擎在多核的伸縮性上領先同類。
從以上測試結果和計算加速方案來看,作為一款從零開始自主打造的國產數據庫,MatrixOne剛建設8個月就具備了和其他產品PK性能的積累,進化速度著實令人驚嘆。
更簡單、更靈活,持續打破數據邊界
目前,國際國內市場上數據庫種類繁多,企業或用戶想要為自己的應用系統和數據智能平臺選擇數據庫,光選型、測試就要花很多時間和人力;之后還要針對每個數據庫系統做開發、部署、運維;如果有新的需求變化或者是業務變化時,這個流程又得走一遍。這些涉及的軟硬件投入和人力投入都是巨大的,并且在大多數情況下是可以優化和避免的。
簡單地說,MatrixOne的目標就是把用戶選用數據智能系統的門檻降下來。MatrixOne將會包含支持分析、事務和流計算負載的能力,來滿足大部分應用場景的需求。這樣的多功能數據庫,第一可以在選型時治好用戶的選擇困難癥,并大大降低企業的運維和運營成本;第二,在遇到變化時,也能夠通過靈活‘變形’來最大可能的滿足用戶的需求,從而幫助企業提高業務敏捷性。
王龍表示:“在0.2的版本里,我們做到了數據實時插入可見且確保一致的情況下,也能夠滿足高性能的數據分析需求。當然,當更多這種看似矛盾的能力加進來的時候,工作的復雜度也會幾何級數地增加,但是我們也有信心。把復雜留給自己,把簡單和靈活留給用戶,這就是我們想要提供的價值。”
MatrixOne作為基礎軟件,從開始走的就是開源路線。通過一套簡單、松耦合的架構設計,以及大量示范和文檔,矩陣起源希望能夠打造一個具備極致創新空間的開源社區。目前,有不少愛好者加入了MatrixOne開源社區,一起參與討論和貢獻代碼。接下來,MatrixOne的前進道路還任重道遠,但其在SSB測試集和NYC Taxi測試集的亮眼性能表現,已令人對MatrixOne的未來充滿期待。