◎沈 涵 本報記者 王 春
編者按 人工智能正在重塑科學(xué)研究范式。從加速新藥研發(fā)到破解宇宙奧秘,從模擬氣候變化到揭示基因密碼,AI在提高科研效率、拓展研究邊界方面展現(xiàn)出巨大潛力。今起,本報推出解碼“AI+科研”系列報道,介紹AI在醫(yī)藥、數(shù)學(xué)、材料、化學(xué)、天文等領(lǐng)域的應(yīng)用成果,探討AI賦能科研高質(zhì)量發(fā)展的前景。
篩選所有基因中的潛在靶點(diǎn),從中發(fā)現(xiàn)帕金森病全新治療靶點(diǎn)并篩選出候選藥物;提前15年預(yù)測阿爾茨海默病發(fā)病風(fēng)險,診斷精準(zhǔn)性超過98.7%……近年來,復(fù)旦大學(xué)在醫(yī)學(xué)領(lǐng)域取得系列突破。這些突破背后,都離不開云上科研智算平臺CFFF提供的AI算力支持。該平臺由復(fù)旦大學(xué)、阿里云等共同打造,以公共云模式提供超千卡并行智能計算,支持千億參數(shù)的大模型訓(xùn)練,具有大規(guī)模、高能級的特點(diǎn)。
當(dāng)前,AI已從一個研究領(lǐng)域變成一類賦能技術(shù)。多位專家近日在接受科技日報記者采訪時表示,在醫(yī)藥健康領(lǐng)域,AI已應(yīng)用于靶點(diǎn)發(fā)現(xiàn)、藥物設(shè)計及臨床試驗(yàn)等方面,顯著提升了科研效率,同時“數(shù)據(jù)孤島”等挑戰(zhàn)也不容忽視。
改變藥物研發(fā)模式
AI技術(shù)正在改變靶點(diǎn)發(fā)現(xiàn)模式。在傳統(tǒng)的假設(shè)驅(qū)動研究模式下,研究者根據(jù)現(xiàn)有理論體系,推測某一蛋白在致病蛋白傳播過程中發(fā)揮重要作用,再設(shè)計實(shí)驗(yàn)進(jìn)行證實(shí)。這種模式不僅耗時耗力,更極易忽略現(xiàn)有理論體系外的諸多可能性。
在AI技術(shù)加持下,數(shù)據(jù)驅(qū)動的研究模式成為可能。這是一種不帶預(yù)設(shè)的研究思路,在所有基因中篩選潛在靶點(diǎn),再進(jìn)行體內(nèi)外基礎(chǔ)實(shí)驗(yàn)加以驗(yàn)證,可大幅提升數(shù)據(jù)分析規(guī)模和研究效率。
“我們利用大模型技術(shù)對超過100萬個樣本進(jìn)行了大規(guī)模全基因組關(guān)聯(lián)分析,發(fā)現(xiàn)FAM171A2基因的5個位點(diǎn)突變與帕金森病風(fēng)險顯著相關(guān)?!睆?fù)旦大學(xué)附屬華山醫(yī)院教授郁金泰告訴記者,病理性α-突觸核蛋白是帕金森病的關(guān)鍵致病蛋白,此前從未有人研究過FAM171A2這種神經(jīng)元細(xì)胞膜蛋白在α-突觸核蛋白傳播過程中的作用。
AI在化合物篩選環(huán)節(jié)的作用同樣顯著。
在傳統(tǒng)研究模式下,針對高創(chuàng)新性靶點(diǎn)的藥物開發(fā)需經(jīng)歷反復(fù)試錯:研究者需從數(shù)以萬計的分子中篩選出兼具活性與選擇性、耐藥性良好、吸收代謝特性優(yōu)異且安全性達(dá)標(biāo)的分子。符合這些要求的藥物分子,才能進(jìn)入臨床階段。這種高度依賴專家個人經(jīng)驗(yàn)與創(chuàng)造力的方式往往會消耗大量時間,帶來高昂人力、物力成本。而AI蛋白結(jié)構(gòu)預(yù)測和虛擬篩選技術(shù)能快速預(yù)測哪些分子最有可能成為有效藥物。在一些案例中,AI甚至可以在48小時內(nèi)篩選1億個化合物。
在CFFF平臺助力下,郁金泰團(tuán)隊(duì)得以在所有基因中精準(zhǔn)篩選潛在靶點(diǎn),又從7000余種小分子化合物中快速找到一種可有效抑制FAM171A2蛋白和病理性α-突觸核蛋白結(jié)合的小分子?!斑@一原本需要數(shù)十年才能完成的工作,我們僅用了5年。”郁金泰說。
CFFF平臺也支持了團(tuán)隊(duì)的另一項(xiàng)研究。團(tuán)隊(duì)利用AI技術(shù)從6361種腦脊液蛋白中篩選出4種與阿爾茨海默病高度關(guān)聯(lián)的蛋白。根據(jù)這些新的診斷生物標(biāo)志物開展聯(lián)合診斷,可提前15年預(yù)測阿爾茨海默病發(fā)病風(fēng)險,且精度超過98.7%。據(jù)悉,基于該成果研發(fā)的阿爾茨海默病早篩早診檢測試劑將于今年底在各大醫(yī)院和體檢中心上線。
提升臨床試驗(yàn)效率
藥物在上市前,需經(jīng)歷臨床試驗(yàn),并通過藥品監(jiān)管部門的嚴(yán)格審批?!斑M(jìn)入臨床階段后,AI篩選的藥物與傳統(tǒng)藥物一樣沒有捷徑?!庇⑽悄芸萍迹ㄉ虾#┯邢薰荆ㄒ韵潞喎Q“英矽智能”)聯(lián)合首席執(zhí)行官任峰說。
但這并不意味著進(jìn)入臨床階段后,AI毫無作用。相反,這一階段迫切需要AI介入。
傳統(tǒng)臨床試驗(yàn)在受試者招募、篩選、數(shù)據(jù)采集和質(zhì)控等方面效率低下,這些問題導(dǎo)致經(jīng)濟(jì)和時間成本高,失敗風(fēng)險大。而AI可以優(yōu)化患者招募標(biāo)準(zhǔn),預(yù)測試驗(yàn)結(jié)果,模擬臨床試驗(yàn),為突破傳統(tǒng)臨床試驗(yàn)瓶頸提供新的思路和方法。
今年6月,某慢性阻塞性肺病長效霧化支氣管擴(kuò)張劑上市申請獲批。在其Ⅲ期臨床試驗(yàn)的患者招募環(huán)節(jié),醫(yī)渡科技有限公司打造的患者招募智能體大顯身手,使入組速率提升超30%,且質(zhì)量維度嚴(yán)格控制在90%以上?!霸撝悄荏w的準(zhǔn)確率較傳統(tǒng)模式提高3倍以上?!痹摴旧茖W(xué)事業(yè)部智能臨床試驗(yàn)負(fù)責(zé)人郝原說。
一些企業(yè)積極探索將AI技術(shù)用于臨床試驗(yàn)結(jié)果預(yù)測。英矽智能利用自主研發(fā)的AI臨床試驗(yàn)預(yù)測引擎“inClinico”,已準(zhǔn)確預(yù)測了多項(xiàng)臨床試驗(yàn)Ⅱ期至Ⅲ期的轉(zhuǎn)化結(jié)果。
在臨床數(shù)據(jù)管理環(huán)節(jié),AI同樣潛力巨大。上海耀乘健康科技有限公司的AuroraPrime平臺能將臨床研究報告初稿的生成時間減少90%,總體節(jié)省45%的時間。
AI還可以優(yōu)化臨床試驗(yàn)方案。溫州醫(yī)科大學(xué)李校堃院士團(tuán)隊(duì)利用AI優(yōu)化生長因子類藥物臨床試驗(yàn)方案,成功縮短了轉(zhuǎn)化周期。
AI帶來的變革已滲透到臨床試驗(yàn)各個環(huán)節(jié)。根據(jù)調(diào)研機(jī)構(gòu)Precedence Research的數(shù)據(jù),2025年全球AI臨床試驗(yàn)市場規(guī)模將達(dá)到26億美元,2034年預(yù)計超過223.6億美元。
業(yè)內(nèi)人士認(rèn)為,AI臨床試驗(yàn)市場正處于爆發(fā)式增長前夕,技術(shù)革新將極大提升行業(yè)運(yùn)行效率。同時,值得注意的是,監(jiān)管框架的滯后性與數(shù)據(jù)隱私保護(hù)、技術(shù)濫用等倫理風(fēng)險是制約行業(yè)健康發(fā)展的關(guān)鍵瓶頸,亟需構(gòu)建適應(yīng)性監(jiān)管體系與倫理治理框架。
面臨“數(shù)據(jù)孤島”挑戰(zhàn)
在大數(shù)據(jù)與大知識融合的時代,算力成為重要的科研生產(chǎn)力。隨著算力水平不斷提升,科研效率也大幅上升。
復(fù)旦大學(xué)類腦智能科學(xué)與技術(shù)研究院研究員程煒對算力的躍遷感觸頗深?!?011—2012年,我們買了幾臺機(jī)器,處理100人的影像數(shù)據(jù)已很難,一臺小服務(wù)器跑了好幾天?!彼f,如今,CFFF平臺提供了更充足算力,可以實(shí)現(xiàn)多任務(wù)同時計算。依托該平臺,他有信心建立更大的數(shù)據(jù)庫來推動研究。
程煒說,隨著AI時代對算力需求的增長,以及對數(shù)據(jù)安全和隱私保護(hù)的重視,很多高校都在建立或強(qiáng)化自己的計算平臺?!坝绕涫窃谏婕懊舾信R床數(shù)據(jù)的研究中,自己擁有計算平臺必不可少?!彼f。
但從另一個角度來說,這也會加劇數(shù)據(jù)壁壘問題。數(shù)據(jù)資源的碎片化現(xiàn)象,將制約“AI+醫(yī)藥”的技術(shù)潛能釋放?!叭绻枰狝I發(fā)揮更大作用,就要創(chuàng)造更多標(biāo)準(zhǔn)化數(shù)據(jù)?!本┲撬幖夹g(shù)(上海)有限公司聯(lián)合創(chuàng)始人、首席執(zhí)行官馬健說,未來5到10年,希望行業(yè)在高質(zhì)量數(shù)據(jù)生成方面投入更多精力。
“AI藥企普遍使用公開數(shù)據(jù)以發(fā)展算法技術(shù),現(xiàn)在數(shù)據(jù)量尚夠,但隨著行業(yè)進(jìn)步,企業(yè)對算法精度的要求會越來越高,未來必然形成大量標(biāo)準(zhǔn)化數(shù)據(jù)缺口。”任峰說,英矽智能常年保持一支20—40人的數(shù)據(jù)挖掘團(tuán)隊(duì),每天保持相關(guān)數(shù)據(jù)更新,但行業(yè)內(nèi)“數(shù)據(jù)孤島”問題不容忽視。
多位受訪者認(rèn)為,在“AI+醫(yī)藥”領(lǐng)域,更深層挑戰(zhàn)在于信任機(jī)制,以及AI工具與臨床工作流的融合程度。當(dāng)前,制藥企業(yè)與AI開發(fā)者正通過構(gòu)建跨機(jī)構(gòu)數(shù)據(jù)協(xié)作機(jī)制、開發(fā)可解釋性AI模型及建立標(biāo)準(zhǔn)化驗(yàn)證與部署框架,積極推動行業(yè)開放合作。未來仍需通過進(jìn)一步提升AI決策系統(tǒng)的透明度、制定符合臨床研究規(guī)范的透明化披露標(biāo)準(zhǔn)等方式,提升臨床醫(yī)生與監(jiān)管機(jī)構(gòu)的信任。