首頁|新聞|快訊|醫(yī)訊|資訊|頭條|健康|科技|旅游|經(jīng)濟|娛樂|投資|文化|書畫

生成式AI快速預(yù)測三維基因組結(jié)構(gòu)

時間:2025-02-11 09:55:52   來源:科技日報

  美國麻省理工學(xué)院化學(xué)家們利用生成式人工智能(AI)技術(shù),開發(fā)出一種可快速預(yù)測三維基因組結(jié)構(gòu)的新模型。新模型能在幾分鐘內(nèi)預(yù)測出數(shù)千種結(jié)構(gòu),速度遠超現(xiàn)有的實驗分析方法。研究成果發(fā)表于最新一期《科學(xué)進展》雜志。

  人體每個細胞都含有相同的遺傳序列,但每個細胞只表達其中一部分基因。這種細胞特異性的基因表達模式確保了不同類型細胞之間的差異,而這些表達模式部分取決于遺傳物質(zhì)的三維結(jié)構(gòu)。

  新模型名為ChromoGen,旨在從底層DNA序列出發(fā),預(yù)測三維基因組結(jié)構(gòu)。它包括兩個組成部分,第一部分是一個深度學(xué)習(xí)模型,能夠“讀取”基因組,分析編碼在DNA序列和染色質(zhì)可訪問性數(shù)據(jù)中的信息;第二部分是一個生成式AI模型,經(jīng)過訓(xùn)練后能夠預(yù)測出物理上準確的染色質(zhì)構(gòu)象。

  訓(xùn)練該模型所用的數(shù)據(jù)集包括超過1100萬個染色質(zhì)構(gòu)象,這些數(shù)據(jù)來源于對16個人類B淋巴細胞系單細胞進行的實驗。

  ChromoGen模型能有效地捕捉序列—結(jié)構(gòu)關(guān)系,為每段DNA序列生成多種可能的結(jié)構(gòu)。這是因為DNA是一種非常無序的分子,同一個DNA序列可以產(chǎn)生許多不同的構(gòu)象。這種方法不僅大大加速了三維基因組結(jié)構(gòu)的預(yù)測過程,也為深入研究基因組的三維組織如何影響細胞的基因表達模式和功能提供了有力工具。

  這一突破性技術(shù)有望幫助科學(xué)家更快地理解基因調(diào)控機制,促進疾病治療和生物技術(shù)領(lǐng)域的進步。

(責(zé)任編輯:華康)

熱點聚焦

最新閱讀

熱門排行