国产精品―色哟呦,2019国产精品自在线拍国产不卡,99久久久,日韩高清福利,欧美r片在线,看全色黄大色大片女人爽吗,91麻豆国产语对白在线观看

產(chǎn)品分類導(dǎo)航
CPHI制藥在線 資訊 NSR | CGCompass:基于圖結(jié)構(gòu)與知識驅(qū)動的單細胞基礎(chǔ)大模型

NSR | CGCompass:基于圖結(jié)構(gòu)與知識驅(qū)動的單細胞基礎(chǔ)大模型

來源:新藥創(chuàng)始人
  2025-07-04
近年來,單細胞組學(xué)技術(shù)的快速發(fā)展為描繪細胞的復(fù)雜狀態(tài)提供了前所未有的海量數(shù)據(jù),深刻推動生命科學(xué)研究進入精細解析基因調(diào)控機制的新階段。

       近年來,單細胞組學(xué)技術(shù)的快速發(fā)展為描繪細胞的復(fù)雜狀態(tài)提供了前所未有的海量數(shù)據(jù),深刻推動生命科學(xué)研究進入精細解析基因調(diào)控機制的新階段。與此同時,深度學(xué)習(xí)和大規(guī)模預(yù)訓(xùn)練基礎(chǔ)模型(Foundation Models)在自然語言處理和計算機視覺領(lǐng)域的成功,為生命科學(xué)提供了強有力的技術(shù)支持。

       近期,中國科學(xué)院多學(xué)科交叉研究團隊"指南針聯(lián)盟"(Xcompass Consortium)開發(fā)了Cell-GraphCompass(CGCompass)。該模型創(chuàng)新性地采用了圖神經(jīng)網(wǎng)絡(luò)融入豐富生物學(xué)知識并基于5000萬人類單細胞數(shù)據(jù)集訓(xùn)練從而構(gòu)建了新型人類單細胞基礎(chǔ)模型。CGCompass采用圖結(jié)構(gòu)算法建模單個細胞,將基因視為圖中的節(jié)點,基因之間的相互關(guān)系作為圖的邊,通過圖神經(jīng)網(wǎng)絡(luò)深入挖掘基因間的復(fù)雜聯(lián)系及其在細胞中的動態(tài)表達特征。該模型利用數(shù)千萬高質(zhì)量單細胞轉(zhuǎn)錄組數(shù)據(jù)進行大規(guī)模預(yù)訓(xùn)練,不僅提升了對基因調(diào)控機制的理解能力,還為細胞類型鑒定、基因擾動預(yù)測等多種生命科學(xué)任務(wù)提供了強大技術(shù)支持,為構(gòu)建更加全面仿真的人類AI虛擬細胞邁出了重要一步。

中國科學(xué)院多學(xué)科交叉研究團隊“指南針聯(lián)盟”(Xcompass Consortium)開發(fā)了Cell-GraphCompass(CGCompass)。

       CGCompass模型架構(gòu):圖神經(jīng)網(wǎng)絡(luò)驅(qū)動的知識融合

       CGCompass基于單細胞RNA測序數(shù)據(jù)構(gòu)建細胞的圖結(jié)構(gòu),將細胞和基因分別視作圖中的節(jié)點,利用圖神經(jīng)網(wǎng)絡(luò)(GNN)結(jié)合基因表達信息、調(diào)控網(wǎng)絡(luò)、基因共表達關(guān)系、基因位置關(guān)系以及文獻挖掘的生物先驗知識,形成多層嵌入表達。預(yù)訓(xùn)練采用自監(jiān)督學(xué)習(xí)策略,隨機遮蔽基因表達信息,促使模型在豐富細胞背景下準確恢復(fù)掩碼表達值,捕獲復(fù)雜的基因間長程動態(tài)關(guān)系。該模型能夠生成高維且生物學(xué)意義深厚的基因和細胞表征,為下游多樣化任務(wù)提供堅實基礎(chǔ)。

CGCompass模型架構(gòu)

       CGCompass模型架構(gòu)

       優(yōu)異的聚類和細胞類型注釋表現(xiàn)

       依托細胞圖結(jié)構(gòu),CGCompass在多批次、多平臺的單細胞數(shù)據(jù)上實現(xiàn)了出色的批次效應(yīng)消除。通過無監(jiān)督聚類,模型成功區(qū)分出多種細胞類型,充分展現(xiàn)了其對生物信號的深刻感知能力。在細胞類型注釋任務(wù)中,CGCompass基于reference集對query集進行了高精度預(yù)測。盡管兩者存在顯著的數(shù)據(jù)分布差異,CGCompass憑借大規(guī)模預(yù)訓(xùn)練與深度融合的生物學(xué)先驗,有效規(guī)避了對reference集的過擬合,展現(xiàn)出強大的泛化與遷移能力,注釋準確率持續(xù)領(lǐng)先。

CGCompass的聚類(左)和注釋(右)結(jié)果

CGCompass的聚類(左)和注釋(右)結(jié)果

       CGCompass的聚類(左)和注釋(右)結(jié)果

       強大的Zero-shot能力,支持多樣化應(yīng)用場景

       預(yù)訓(xùn)練基礎(chǔ)模型具備直接遷移到新任務(wù)的能力,CGCompass的zero-shot推理表現(xiàn)尤為突出。在不同實驗室、物種、疾病狀態(tài)下,模型均能生成高質(zhì)量細胞和基因嵌入,顯著提升多種生物學(xué)任務(wù)的執(zhí)行效率。無須額外標注數(shù)據(jù),即可為新數(shù)據(jù)提供細胞類型注釋、基因功能識別等支持,極大降低了生命科學(xué)研究中數(shù)據(jù)標注的門檻。

CGCompass的zero-shot測試結(jié)果

CGCompass的zero-shot測試結(jié)果

CGCompass的zero-shot測試結(jié)果

       CGCompass的zero-shot測試結(jié)果

       細胞基因擾動模擬,推動基因調(diào)控機制解析

       CGCompass在基因擾動響應(yīng)預(yù)測中表現(xiàn)優(yōu)異。通過在單細胞基因擾動(Perturb-seq)數(shù)據(jù)上微調(diào)預(yù)訓(xùn)練模型,CGCompass能準確新的擾動條件下基因表達的變化。與現(xiàn)有先進模型相比,CGCompass在單基因及雙基因擾動的表達預(yù)測均有明顯提升,且能區(qū)分基因表達的上調(diào)、下調(diào)及不變狀態(tài)。此能力不僅助力基因調(diào)控網(wǎng)絡(luò)的推斷,還可用于藥物作用機制分析和精準治療靶點篩選。

CGCompass模擬單細胞基因擾動響應(yīng)

       CGCompass模擬單細胞基因擾動響應(yīng)

       拓展至體細胞基因敲除預(yù)測,實現(xiàn)多尺度生物學(xué)建模

       在單細胞擾動實驗的基礎(chǔ)上,CGCompass進一步拓展至體(bulk)細胞的基因敲除預(yù)測任務(wù)。體細胞測序數(shù)據(jù)反映的是細胞的局部群體行為,具有顯著的數(shù)據(jù)分布不平衡特征:多數(shù)基因在敲除前后表達量變化不大,容易導(dǎo)致深度學(xué)習(xí)模型"偷懶"--將所有基因預(yù)測為不變,從而獲得看似較高的準確率。為解決這一挑戰(zhàn),CGCompass引入兩階段遷移學(xué)習(xí)策略:模型首先在大規(guī)模單細胞數(shù)據(jù)上完成預(yù)訓(xùn)練,再在體細胞數(shù)據(jù)上進行二次預(yù)訓(xùn)練,最后在基因敲除數(shù)據(jù)上進行精調(diào)。該策略有效增強了模型對表達變化的敏感性,實現(xiàn)了對基因上調(diào)、下調(diào)及不變狀態(tài)的精準分類。相較傳統(tǒng)方法,CGCompass不僅保持整體預(yù)測準確率,更顯著提升了對差異表達基因的識別能力,展現(xiàn)出強大的泛化性能和在真實應(yīng)用中的巨大潛力。

CGCompass預(yù)測bulk層面的基因敲除結(jié)果

       CGCompass預(yù)測bulk層面的基因敲除結(jié)果

       展望未來:多組學(xué)融合與精準生命科學(xué)新時代

       CGCompass標志著圖神經(jīng)網(wǎng)絡(luò)與生命科學(xué)大數(shù)據(jù)融合的新突破,未來團隊計劃進一步整合ATAC-seq、蛋白質(zhì)組學(xué)及表觀遺傳數(shù)據(jù),打造更全面的多組學(xué)基礎(chǔ)模型。同時,將探索先進生命科學(xué)文本大模型及半監(jiān)督、長尾學(xué)習(xí)方法,進一步提升模型對稀缺數(shù)據(jù)和復(fù)雜生物現(xiàn)象的適應(yīng)力。CGCompass有望助力細胞命運重編程、腫瘤精準治療、類器官培養(yǎng)等前沿領(lǐng)域,開啟智能生命科學(xué)研究新時代。

       關(guān)于團隊

       CGCompass模型由中國科學(xué)院大學(xué)前沿交叉科學(xué)學(xué)院、中國科學(xué)院動物研究所李鑫團隊聯(lián)合中國科學(xué)院計算機網(wǎng)絡(luò)信息中心、科大訊飛等多學(xué)科團隊共同研發(fā),該團隊致力于構(gòu)建數(shù)智驅(qū)動的生命科學(xué)研究新范式,深度解析生命本質(zhì)規(guī)律。中國科學(xué)院動物所李鑫研究員、馮桂海研究員,計算機網(wǎng)絡(luò)信息中心周園春研究員、孟珍研究員、科大訊飛陳凌輝為論文共同通訊作者,房晨、崔文韜、胡智龍為共同第一作者。

相關(guān)文章

合作咨詢

   肖女士    021-33392297    Kelly.Xiao@imsinoexpo.com

2006-2025 上海博華國際展覽有限公司版權(quán)所有(保留一切權(quán)利) 滬ICP備05034851號-57