4月17日上午,全球首個億量級草藥基因編碼天然多樣性成分庫(Gene-encoded Natural Diverse Components Repository, GNDC)在四川省成都市舉行的第三屆“千種本草基因組計劃”會議上發(fā)布。
全球首個億量級草藥基因編碼天然多樣性成分庫發(fā)布儀式。人民網(wǎng)記者 劉海天攝
據(jù)悉,GNDC基于全球八大權(quán)威藥典收錄的1037個藥用物種的核基因組、細(xì)胞器基因組等多維數(shù)據(jù),通過自主開發(fā)的基因組遍歷算法結(jié)合轉(zhuǎn)錄組、小RNA測序、肽質(zhì)譜等多組學(xué)技術(shù)實現(xiàn)了對天然多樣性成分的挖掘與驗證,并創(chuàng)新性整合自然語言處理、對抗生成網(wǎng)絡(luò)、圖卷積網(wǎng)絡(luò)等人工智能算法實現(xiàn)成分的識別、分類與功能注釋。GNDC收錄了超過2.34億個基因直接或間接編碼的天然多樣性成分,包括232萬個次生代謝產(chǎn)物、22977萬條多肽、238萬個小RNA和26萬個碳水化合物。GNDC實現(xiàn)了基因組信息、成分信息與功能信息的整合,彌補(bǔ)了現(xiàn)有天然產(chǎn)物數(shù)據(jù)庫在數(shù)據(jù)類型與功能解析方面的不足。作為目前全球規(guī)模最大的藥用天然成分庫,GNDC將為藥物發(fā)現(xiàn)提供廣闊的“化學(xué)空間”,加速“大數(shù)據(jù)驅(qū)動”模式下的藥物發(fā)現(xiàn)進(jìn)程。
中醫(yī)藥人工智能聯(lián)合實驗室揭牌儀式。人民網(wǎng)記者 劉海天攝
據(jù)介紹,GNDC由成都中醫(yī)藥大學(xué)本草基因組學(xué)團(tuán)隊聯(lián)合現(xiàn)代中醫(yī)藥海河實驗室、中國醫(yī)學(xué)科學(xué)院藥用植物研究所、東北林業(yè)大學(xué)、湖北時珍實驗室等單位共同完成。
項目總負(fù)責(zé)人中國工程院院士、成都中醫(yī)藥大學(xué)首席教授陳士林指出:“GNDC實現(xiàn)了基因組數(shù)據(jù)與人工智能算法的深度融合,標(biāo)志著天然成分研究進(jìn)入智能化和精準(zhǔn)化的新階段。通過創(chuàng)新性整合多組學(xué)技術(shù)與人工智能方法,GNDC在天然多樣性成分的識別、分類與功能注釋方面展現(xiàn)出了突破性優(yōu)勢,將成為驅(qū)動天然藥物研發(fā)范式變革、加速中藥現(xiàn)代化進(jìn)程的核心技術(shù)支撐。”(記者劉海天)