一場突如其來的新冠疫情,加速人們對基因檢測技術的利用。曾經(jīng)略顯陌生的“核酸檢測”因為疫情的倒逼,成為見諸媒體頻率最高的詞匯。核酸檢測以其快速和準確的優(yōu)勢,成為防控疫情的最佳利器?;驒z測技術也迎來快速發(fā)展的最佳契機。
外部政策上,2015年起,我國就已經(jīng)啟動精準醫(yī)療計劃,而基因測序就處于最核心的位置。這幾年隨著大數(shù)據(jù)技術的發(fā)展,生物醫(yī)藥領域在大數(shù)據(jù)的加持下,涌現(xiàn)出多種創(chuàng)新性應用場景,全方位加快藥物研發(fā)、完善罕見病診治閉環(huán),進一步推動精準預防和治療的實現(xiàn)。
從市場環(huán)境來看,近幾年,更多基因行業(yè)的研究機構(gòu)和企業(yè)在算力的提升上加大投入力度,著力于發(fā)展支撐基因測序發(fā)展的HPC(高性能計算解決方案)。一直以來,HPC都處于計算產(chǎn)業(yè)金字塔的塔尖位置,它能夠應對當下豐富場景下的多樣化計算需求,在基因制藥、航空航天、石油勘探等領域發(fā)揮越來越重要的作用。
多樣性計算塑造未來,基因產(chǎn)業(yè)在HPC的助力下,正乘勢而起。
按場景需求靈活調(diào)用算力,HPC助力基因檢測高效處理大數(shù)據(jù)
基因檢測隨著基因測序成本的降低被廣泛使用。但市場需求的增加也對基因檢測提出了更高的要求?;驒z測需要適應目標人群快速增長、檢測越來越復雜的現(xiàn)狀,提高對大數(shù)據(jù)的處理能力。
金域醫(yī)學生信總監(jiān)孫明明已在生物信息行業(yè)深耕13年,面對這樣的現(xiàn)狀,他深有感觸地說:“基因測序短時間內(nèi)就能夠產(chǎn)出PB級的海量數(shù)據(jù),因此只有通過更高性能的服務器與更快速的分析算法,才能滿足如此大量且多樣化的數(shù)據(jù)需求,讓數(shù)據(jù)價值得以更大程度的體現(xiàn)。“那究竟什么樣的HPC才適合臨床基因檢測呢?孫明明給出答案:“首先我們將檢測需求進行場景分類,然后根據(jù)相應場景選擇合適的HPC?!?/span>
·場景一:大量集中型送檢,此場景檢測數(shù)據(jù)量巨大,因此需要本地端有一個大規(guī)模的HPC來進行數(shù)據(jù)處理。這樣構(gòu)建的優(yōu)勢在于可以將HPC與大型測序儀進行一個穩(wěn)定的內(nèi)網(wǎng)連接,可以保證臨床數(shù)據(jù)處理的時效性和穩(wěn)定性;
·場景二:少量分散型送檢,針對一些小規(guī)模醫(yī)療機構(gòu),它們所產(chǎn)生的基因檢測數(shù)據(jù)量通常較小,構(gòu)建本地HPC成本太高。因此可采用云端HPC的部署方式,這樣既能滿足醫(yī)療機構(gòu)的檢測需求,同時能夠解決成本問題。
孫明明說:“將需求按照場景分類后,HPC的部署方式就明朗化了。但其中本地HPC因會受到部署場地及供貨周期的制約,如果遇到檢測量劇增的突發(fā)事件,無法做到實時動態(tài)的硬件資源擴展。如何解決?我們選擇了華為云提供的資源混合調(diào)度方案,通過它動態(tài)拓展的特性解決了這個問題。”他表示,采用了現(xiàn)在的整合方式后,本地HPC和云端HPC可以實現(xiàn)統(tǒng)一管理,只要設立一個統(tǒng)一的管理節(jié)點,就能同時管理線下和云端的計算資源,當本地HPC負載過高時,數(shù)據(jù)分析服務會自動推送到云端,有效解決了本地算力不足的困擾。
談及未來,孫明明表示:“目前,金域醫(yī)學的業(yè)務已經(jīng)覆蓋了整個產(chǎn)業(yè)鏈上中下游。希望未來能與合作伙伴共同努力,將大技術平臺、大服務網(wǎng)絡、大樣本、大數(shù)據(jù)庫聯(lián)合起來,構(gòu)建‘檢驗+’的生態(tài)圈,并通過這個生態(tài)圈加快大樣本、大數(shù)據(jù)、醫(yī)檢技術創(chuàng)新的發(fā)展和突破?!?/span>
滿足三代基因測序多樣性需求,華為云HPC高性能成首選
在基因測序中,測序的長讀長能有效提升基因組組裝的完整性。相對于二代測序,三代測序的長讀長優(yōu)勢,能夠幫助它突破二代測序短讀長技術在人類遺傳疾病研究、動植物基因組完成圖組裝等方面的瓶頸、提升其在疾病診斷、分子育種中提供決策依據(jù)的能力。(備注:讀長指的是測序反應所能測得序列的長度)
三代測序的單張芯片的測序數(shù)據(jù)量會達到100Gb以上,而希望組生產(chǎn)中心一年將會消耗近萬張測序芯片,算上衍生出的大于測序數(shù)據(jù)數(shù)倍的原始數(shù)據(jù),三代測序所產(chǎn)生的數(shù)據(jù)量會是海量的,其數(shù)據(jù)存儲與分析符合大數(shù)據(jù)的特征。武漢希望組COO劉雷博士介紹,在三代測序中,無論是PacBio測序儀還是Oxford Nanopore測序儀,所產(chǎn)生的數(shù)據(jù)包含了分析所用的fastq數(shù)據(jù),以及這些數(shù)據(jù)的原始格式bam,fast5等;而這些bam,fast5格式往往會是原始數(shù)據(jù)的5~10倍。因此處理這些龐大的數(shù)據(jù),對于算力的要求很高。那么究竟什么樣的HPC是三代測序的“理想型”呢?
劉雷博士認為,由于基因測序的數(shù)據(jù)與數(shù)據(jù)隱私安全息息相關,因此,符合要求的、理想的HPC首先應該是安全可控的,從而確保在復雜的環(huán)境中保障基因數(shù)據(jù)的安全;其次要具備良好的性價比,在性能滿足需求的同時盡可能節(jié)約成本。“我們希望對計算資源進行合理調(diào)配,利用公有云對大量非敏感業(yè)務進行快速交付和流程調(diào)優(yōu),少量敏感業(yè)務運行于本地以滿足企業(yè)對數(shù)據(jù)隱私保障的要求?;谏鲜隹紤],我們最終選擇了華為云提供的資源混合調(diào)度方案實現(xiàn)整個計算資源的整合。該解決方案的多面性為我們提供了更多選擇,非常好地滿足了我們對HPC的需求?!眲⒗自u論道。
逐漸完善的檢測技術和不斷降低的設備成本使基因測序被越來越多的人認可,其巨大的發(fā)展?jié)摿ξ阌怪靡?。劉雷表示,在堅持三代測序技術應用不斷迭代的同時,希望組將與合作伙伴攜手共建基于生態(tài)測序的高性能計算機群,為全世界的客戶提供優(yōu)質(zhì)的生態(tài)測序分析和存儲的服務。
華為云使能基因測序行業(yè),低成本適配云時代
毫無疑問,數(shù)據(jù)會隨著基因檢測能力的提升成爆發(fā)增長的態(tài)勢。檢測機構(gòu)對HPC的性能要求也會相應提高,對解決方案提供商的選擇也會越發(fā)謹慎和嚴苛。在當下,怎樣的HPC才能適配不斷發(fā)展的醫(yī)療健康產(chǎn)業(yè),什么樣的云廠商才會得到檢測行業(yè)的青睞?
華為云基因行業(yè)解決方案總監(jiān)嚴斌表示,理想的HPC不僅要滿足用戶對集群易用性和高性能的要求,還需考慮綜合性價比。華為云推出的資源混合調(diào)度方案,不僅可以一站式管理本地-公有云計算資源,還可管理x86虛擬機和鯤鵬虛擬機的混合資源池,從而為客戶提供更高性價比的HPC集群。同時,華為云還提供基因容器和醫(yī)療智能體等行業(yè)解決方案,從版本管理、狀態(tài)監(jiān)控、費用審核和資源消耗等多個維度對業(yè)務流程進行優(yōu)化指導,從而進一步提高整體方案的性價比。
“我們希望華為云作為行業(yè)的黑土地,提供更多的創(chuàng)新方案,使能基因測序行業(yè)在云時代高速、穩(wěn)定和智能地發(fā)展前行。”嚴斌如是說。
基因檢測行業(yè)正處于高速發(fā)展的黃金期。算力是決定其能走多遠的關鍵性因素。當下,HPC也在和基因檢測行業(yè)一起接受市場和用戶的考驗,在多樣化場景中不斷迭代和進化。經(jīng)此一役,HPC和基因檢測也將進入一個新的發(fā)展階段。