隨著第三代基因測序技術的引入,生物信息學的研究領域得以廣泛拓展,為深度挖掘基因信息提供了更多的可能性,同時,也帶來了海量的數據分析和處理任務。
北京希望組生物科技有限公司(下文簡稱希望組)在打造全新的三代測序項目交付平臺時,引用火山引擎 Bio-OS 解決方案,建立了基于 web 的生信數據分析平臺,不僅有效降低生信數據分析門檻,也使售后人力成本降低了40%,運維成本降低了30%。
希望組(Grandomics)是全球知名的三代測序技術拓展者,也是中國首家三代測序服務公司。多年來,一直專注于在三代測序平臺上進行技術開發與應用拓展,其自主開發了基因組變異分析系統、單細胞測序技術等多項三代測序軟件和技術,并構建了三代測序高性能計算集群,為客戶提供優質的第三代測序分析和存儲服務。
圖片來源:希望組(Grandomics)官網
第三代測序發展迅速,底層調度迎來挑戰
近年來,第三代測序技術迅速發展,為基因組研究提供了高分辨率的數據。希望組致力于打造一個三代測序項目交付平臺,通過可視化界面幫助用戶進行生信數據分析,降低難度、提高效率。然而,生信數據分析流程復雜,計算任務多且波動大,需要處理海量非結構化文件數據。因此,希望通過異構集群納管調度能力,實現資源復用,降低成本,提升集群擴容的便利性。
火山引擎Bio-OS,助力生信數據分析
生信數據分析平臺
在火山引擎 Bio-OS 解決方案的支持下,希望組成功構建了基于 web 的生信數據分析平臺。該平臺不僅能夠充分利用現有的本地計算資源進行生信計算,同時也方便其客戶通過 web 頁面提交自己所需的生信分析流程來獲取分析結果。該平臺擁有無縫集成彈性容器、海量實例快速秒級啟動、靈活應對計算高峰等特性。此外,這些特性的引入也有效地縮減了售后支持方面的人力成本。
生信數據分析平臺的三大優勢:
降本增效,資源利用:希望組引入 Bio-OS 方案,通過將本地的 SGE 集群納入私有集群的管理范圍,將舊有的計算資源轉化為有價值的資源,進一步提升計算效率,減少資源浪費,降低維護成本。
流程簡化,操作追溯:Bio-OS 通過在工作流中預置一系列分析步驟,希望組成功降低了生物信息學數據分析的門檻。實驗人員和醫生等非專業人士也能夠輕松地啟動復雜的數據分析流程,不需要深入了解技術細節。同時,通過 git 管理工作流的不同版本,確保了操作的可追溯性和回顧性。
容器集群,智能管理:在計算資源管理方面,火山引擎的 Bio-OS 方案引入了彈性容器,使系統能夠快速啟動和停止計算實例,以適應計算任務的變化。特別是在處理計算高峰時,依然能夠保證系統高效運行,不會因為負載增加而陷入延遲。
售后成本降低40%,運維成本降低30%
生信數據分析平臺,有效降低了生信數據分析的門檻,讓普通人員也可輕松開啟數據分析之旅。另外,Bio-OS 納管本地 SGE 集群的功能實現本地算力的充分利用,在提升集群管理效率的同時,降低了40%售后支持人力成本和30%運維成本。
目前,希望組在 Bio-OS 平臺集成的 notebook 工具基礎上,還開發了諸如花瓣圖、動態火山圖、單細胞基因表達降維圖、單細胞降維分群圖工具等。隨著技術的不斷演進,基因測序和 Bio-OS 的結合,將擴展我們對基因組含義和應用的理解,并創造出更多的發展機遇。
END
日前,火山引擎與基因會等六家生信領域企業,共同發布了《2023基因行業藍皮書》。未來,火山引擎將持續為科技研發提供支持,為生物信息領域的創新發展注入更多的動力。
更多詳細內容,請點擊閱讀原文,下載《2023基因行業藍皮書》。
閱讀原文鏈接:
https://www.volcengine.com/docs/6624/1109238