突破傳統(tǒng)開發(fā)模式,亞馬遜云科技助力中科院加速推動合成生物學

來源:亞馬遜云科技
作者:亞馬遜云科技
時間:2023-02-13
1393
當數(shù)字技術成為整個社會運行的底座,生物科學也能借力云計算,從諸多繁瑣重復的工作中解放出來,專注于生物設計與創(chuàng)新,來看看亞馬遜云科技如何與TIBCAS合作,推動合成生物學的發(fā)展。

當數(shù)字技術成為整個社會運行的底座

生物科學也能借力云計算

從諸多繁瑣重復的工作中解放出來

專注于生物設計與創(chuàng)新

來看看亞馬遜云科技如何與TIBCAS合作

推動合成生物學的發(fā)展

中國科學院天津工業(yè)生物技術研究所(TIBCAS)是一家從事工業(yè)生物技術研發(fā)的科研機構(gòu),由中國科學院和天津市人民政府共建。2019年,由TIBCAS牽頭建設的國家合成生物技術創(chuàng)新中心正式啟動建設,生物設計中心是其重要的平臺實驗室之一。從創(chuàng)立之初,生物設計中心就在探索一種不同于傳統(tǒng)實驗室的研發(fā)新模式,以數(shù)據(jù)和算法為核心,通過構(gòu)建生物技術和信息技術相結(jié)合(BT+IT)的技術體系,在未來將菌種設計構(gòu)建的主要工作交由計算機完成。

自2019年TIBCAS就開始和亞馬遜云科技共同探索,如何通過云計算助力TIBCAS在菌種計算設計和業(yè)務關聯(lián)數(shù)據(jù)存儲檢索方面的創(chuàng)新。借助亞馬遜云科技豐富的Serverless服務和圖數(shù)據(jù)庫Amazon Neptune技術,TIBCAS構(gòu)建了高通量編輯序列設計云平臺AutoESD和完整的大腸桿菌調(diào)控知識圖譜ERMer,大幅提升一線研究人員的研發(fā)效率。

1 明確核心需求,選擇合作伙伴

640.jpg

“圍繞細胞工廠設計創(chuàng)制的核心任務,生物設計中心主要有兩大方面的工作,其一是研發(fā)計算機輔助生物設計工具;其二是開發(fā)核心數(shù)據(jù)庫”TIBCAS項目研究員廖小平介紹說。

在合成生物學實驗過程中,一個重要的步驟就是編輯序列設計,關系到最終目標細胞工廠是否能夠成功構(gòu)建。目前的編輯序列設計仍然依靠人工或“半自動化”的模式:人工設計高度依賴研究者自身的經(jīng)驗,因其主觀性和偏好性會導致結(jié)果千差萬別;而“半自動化”設計,雖由計算機輔助,但因為單一工具往往只能覆蓋遺傳操作的部分環(huán)節(jié),研究過程必須協(xié)同使用多款軟件,既增加了學習成本,又由于彼此間的數(shù)據(jù)交換標準不一致,導致出錯的風險。

如今,大規(guī)模合成生物制造平臺——生物鑄造廠(BioFoundry)高速發(fā)展,使高通量的遺傳操作成為可能,相關實驗流程也越來越模塊化、標準化,人工或“半自動化”模式很難實現(xiàn)高通量、自動化的微生物構(gòu)建,影響開發(fā)效率。

而對于“開發(fā)核心數(shù)據(jù)庫”的需求,廖小平解釋到:“細胞中的代謝調(diào)控非常復雜,不同類型的調(diào)控數(shù)據(jù)通常散落在各個不同的數(shù)據(jù)庫,很難對這些調(diào)控關系實現(xiàn)全局性認識,只有重新設計一個存儲和分析高連接數(shù)據(jù)的新框架,將這些不同類型的代謝調(diào)控相互作用匯集在一起,并提供方便的交互方式,才能方便生物學家挖掘和理解生物體內(nèi)的復雜調(diào)控關系。”

TIBCAS之所以選擇與亞馬遜云科技合作,一是亞馬遜云科技針對科研領域提供了具有行業(yè)深度的解決方案,在云服務上能夠滿足不同業(yè)務場景的需求,并具備典型的成功案例,同時,亞馬遜云科技有豐富工業(yè)生物行業(yè)經(jīng)驗,能夠理解TIBCAS行業(yè)應用場景,并提供有深度的指導意見;二是亞馬遜云科技Serverless技術成熟,多項創(chuàng)新托管服務極大簡化了行業(yè)應用創(chuàng)新難度;三是亞馬遜云科技專業(yè)服務團隊提供全生命周期技術支持,能加速項目落地;四是通過亞馬遜云科技創(chuàng)新研究資助計劃,可以對TIBCAS科研項目提供支持。

2 亞馬遜云科技的多項服務

助力TIBCAS實現(xiàn)行業(yè)應用創(chuàng)新

·基于Serverless架構(gòu)開發(fā)AutoESD云平臺,實現(xiàn)自動化和高通量的編輯序列設計

Serverless服務輕量化且易于使用,與生物工程真實的業(yè)務場景結(jié)合,能更便捷地實現(xiàn)復雜的工作流編排和異常處理,提供輕量化且足夠彈性的算力需求,能夠進行模塊化封裝和復用的組件等需求。為此,TIBCAS通過對遺傳操作技術的模塊化解構(gòu)與標準化處理,結(jié)合亞馬遜云科技提供的Serverless服務,實現(xiàn)了全流程、自動化和高通量的編輯序列設計,開發(fā)出云平臺AutoESD。該平臺支持多種基于篩選標記的同源重組技術變種,理論上支持所有基因組序列已知的微生物,并可以在單批次任務中處理針對不同目標序列(CDS或基因間區(qū)域)的多種類型的遺傳操作(敲除、插入和替換)。

640 (4).png

廖小平介紹說:“基于云上的無服務器架構(gòu)模式,我們構(gòu)建了第一個適用所有操作類型、任何基因組位點和跨物種的精確、自動化和高通量編輯序列設計的云平臺AutoESD,大大降低了一線科研人員使用工具的門檻,為將來實現(xiàn)快速高效的‘設計—構(gòu)建—測試—學習’合成生物學工程循環(huán)奠定了基礎?!?/p>

此外,TIBCAS開發(fā)的IMODB、BioTools等工具也采用同樣的底層架構(gòu),由Amazon Simple Storage Service(Amazon S3)和Amazon DynamoDB分別為靜態(tài)資源和動態(tài)資源的存儲提供支持,Amazon API Gateway實現(xiàn)API接口,后端通過Amazon Lambda和Amazon Batch來承載不同算力需求的任務,Amazon Step Functions能夠幫助工程師更好的管理序列設計工作流,以及處理工作流中復雜的任務依賴關系。在部署上,基礎架構(gòu)部分都通過CDK完成基礎架構(gòu)代碼化,能夠?qū)崿F(xiàn)自動化部署和版本管理,在業(yè)務層面如頁面前端、后端復雜計算過程,通過CI/CD實現(xiàn)自動化集成和部署。

·借助Amazon Neptune設計ERMer,探索完整的大腸桿菌調(diào)控知識圖譜

在“開發(fā)核心數(shù)據(jù)庫”時,TIBCAS聯(lián)合亞馬遜云科技針對微生物領域真實業(yè)務場景需求,基于Amazon Neptune圖數(shù)據(jù)庫、無服務器架構(gòu)和圖形可視化引擎,設計出一款存儲和分析高連接數(shù)據(jù)的新框架,實現(xiàn)了有效的交互式檢索和可視化,該框架具有很好的通用性和擴展性,可以非常方便地延伸到生物學多個應用領域和物種的研究中。利用該框架,TIBCAS開發(fā)了目前第一個基于圖數(shù)據(jù)庫的大腸桿菌調(diào)控知識圖譜ERMer。ERMer實現(xiàn)了多種復雜調(diào)控級聯(lián)或模式的快速檢索和可視化,讓科研人員能夠以交互式、無需編程的方法探索完整的大腸桿菌調(diào)控圖譜。

640 (1).jpg

TIBCAS基于亞馬遜云科技的系統(tǒng)架構(gòu)示意圖

“Amazon Neptune是我們知識的載體,能夠高效存儲和檢索高度復雜關聯(lián)的數(shù)據(jù),在業(yè)務場景應用中相比傳統(tǒng)數(shù)據(jù)庫提升了數(shù)百倍的性能,”廖小平表示,“同時,Amazon Neptune也是我們實現(xiàn)圖譜核心能力的載體,能夠?qū)⒌湫?、復雜的生物學問題轉(zhuǎn)化為圖論問題,科研人員只需要輸入所關注的途徑名稱,即可獲得所有調(diào)控代謝物的可視化結(jié)果,提升了科研工作效率?!?/p>

為了進一步發(fā)揮知識圖譜的價值,TIBCAS還采用了Amazon Neptune ML來訓練模型,通過使用圖譜神經(jīng)網(wǎng)絡技術,實現(xiàn)了轉(zhuǎn)錄因子預測和轉(zhuǎn)錄因子靶點預測等功能。

3 獲得的收益

TIBCAS通過亞馬遜云科技提供的多項創(chuàng)新托管服務,尤其是Serverless服務和架構(gòu)優(yōu)化,在流量峰值、訪問穩(wěn)定、成本優(yōu)化和運維簡化等方面都取得了令人滿意的成效,極大地簡化了行業(yè)應用創(chuàng)新與發(fā)展的難度,加速了通過數(shù)字化能力對合成生物學的推動。

·無服務器架構(gòu)實現(xiàn)強大高通量性能

通過采用無服務器架構(gòu)模式,AutoESD云平臺具有非常強大的高通量性能,可以同時支撐幾百個終端用戶,每個用戶可以提交幾千個編輯目標設計需求,并且僅需幾分鐘時間便可得到反饋結(jié)果,即使面對研究成果發(fā)布或迭代時,TIBCAS也可從容應對流量峰值。

·簡化運維,讓研究人員專注于業(yè)務代碼和創(chuàng)新

系統(tǒng)依托Serverless技術實現(xiàn)原生高可用、高性能,且基于CDK對基礎設施進行代碼化后,能夠?qū)崿F(xiàn)基礎設施的自動化部署與更新,同時保證生產(chǎn)與測試環(huán)境的一致性,降低人工運維壓力,且開發(fā)實踐時間大幅縮短,僅為之前的四分之一,大幅提升了研發(fā)效率。

·成本節(jié)約,資源精準匹配業(yè)務

無需硬件成本投入,即能保證業(yè)務在被請求時可以及時獲得響應,且大部分服務都能夠按秒甚至毫秒計費,成本投入能夠更精細地匹配到業(yè)務,相比傳統(tǒng)方案TCO降低了50%,實現(xiàn)更細粒度的按需付費。

未來,TIBCAS希望基于亞馬遜云科技先進的服務技術和能力,進一步助力研究所在合成生物領域的科研探索,如進一步通過AI、量子計算等服務開展科研創(chuàng)新等。此外,也期望依托于亞馬遜云科技的全球科研領域輻射能力,提升TIBCAS國際影響力,為世界各國的合成生物學科研工作者提供最優(yōu)質(zhì)的服務。

4 關于TIBCAS

中國科學院天津工業(yè)生物技術研究所(以下簡稱TIBCAS)成立于2012年,是由中國科學院和天津市人民政府共建、從事生物技術創(chuàng)新推動工業(yè)領域生態(tài)發(fā)展的科研機構(gòu)。TIBCAS圍繞綠色低碳和經(jīng)濟社會可持續(xù)發(fā)展的重大需求,面向國民經(jīng)濟主戰(zhàn)場和工業(yè)生物科技前沿,以生物設計為核心,開展工業(yè)生物技術戰(zhàn)略性、前瞻性的基礎與應用基礎研究,集聚工業(yè)生物科技力量,創(chuàng)新生物產(chǎn)業(yè)關鍵核心技術與重大顛覆性技術,構(gòu)建工業(yè)經(jīng)濟發(fā)展的生態(tài)路線,服務我國綠色生物經(jīng)濟與社會經(jīng)濟可持續(xù)的發(fā)展。截至目前,TIBCAS已經(jīng)承擔了各類科研項目約700項,在生物醫(yī)藥、化工產(chǎn)業(yè)、紡織、發(fā)酵等領域為28個省市的幾百家企業(yè)提供服務。

TIBCAS在與亞馬遜云科技的合作中,重點使用了這些產(chǎn)品:Amazon S3、Amazon Lambda、Amazon Neptune、Amazon Batch、Amazon DynamoDB和Amazon API Gateway。同時,也離不開如下的重點領域科研支持:亞馬遜云科技科研支持計劃(Amazon Cloud Credit for Research)、亞馬遜云科技杰出研發(fā)獎(Amazon Research Awards)、亞馬遜云科技科學頻道(Amazon Sciences)。未來,雙方也會繼續(xù)努力在合成生物領域達成更堅實更深入的合作。

立即登錄,閱讀全文
原文鏈接:點擊前往 >
文章來源:亞馬遜云科技
版權(quán)說明:本文內(nèi)容來自于亞馬遜云科技,本站不擁有所有權(quán),不承擔相關法律責任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務商推薦
更多
個人VIP