人工智能不僅僅在改變?nèi)藗兊纳罘绞?,也在改變科學(xué)家做研究的方式。
近日,北京大學(xué)人民醫(yī)院在其官網(wǎng)宣布,該院研究團(tuán)隊(duì)利用人工智能方法協(xié)助確定中國(guó)及美國(guó)初步診斷糖尿病人群的糖尿病分型,為糖尿病的精準(zhǔn)治療提供了理論依據(jù)。
人工智能學(xué)會(huì)下圍棋、沖咖啡、打乒乓球就已賺足人氣,干嘛要做協(xié)助確定糖尿病分型這種深?yuàn)W的事情呢?因?yàn)?,科學(xué)家需要它們。
正在成為得力助手
人工智能感興趣的深?yuàn)W領(lǐng)域,不光是協(xié)助醫(yī)學(xué)專家確定糖尿病分型。
DeepMind公司之前公布的“阿爾法折疊”人工智能系統(tǒng),就引起不少關(guān)注。與“阿爾法狗”不同,“阿爾法折疊”的特長(zhǎng)是通過基因序列來預(yù)測(cè)蛋白質(zhì)的3D結(jié)構(gòu)。
這可絕非易事。因?yàn)镈NA信息只告訴科學(xué)家蛋白質(zhì)的基礎(chǔ)構(gòu)成即氨基酸殘基的序列。氨基酸殘基會(huì)形成長(zhǎng)長(zhǎng)的鏈狀結(jié)構(gòu),預(yù)測(cè)這些鏈狀結(jié)構(gòu)如何折疊成蛋白質(zhì)成了生物學(xué)領(lǐng)域的大難題——蛋白質(zhì)折疊問題。
偏偏預(yù)測(cè)蛋白質(zhì)折疊對(duì)科學(xué)家而言非常有用:不但有助于理解蛋白質(zhì)形狀在人體中扮演的角色,還有助于診療與蛋白質(zhì)錯(cuò)誤折疊有關(guān)的疾病,如阿爾茲海默癥、帕金森綜合征等。
傳統(tǒng)做法是靠大量實(shí)驗(yàn)來確定蛋白質(zhì)結(jié)構(gòu)。DeepMind公司的解決之道是,對(duì)深度神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,使“阿爾法折疊”能夠根據(jù)基因序列數(shù)據(jù)來預(yù)測(cè)蛋白質(zhì)的物理特征,包括蛋白質(zhì)內(nèi)部?jī)蓚€(gè)氨基酸之間的距離,以及連接氨基酸化學(xué)鍵的角度。最終實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè)蛋白質(zhì)3D結(jié)構(gòu)。
與北京大學(xué)人民醫(yī)院的科研團(tuán)隊(duì)一樣,不少科研人員開始把人工智能當(dāng)做得力助手。
北科院北京市計(jì)算中心副研究員裴智勇告訴科技日?qǐng)?bào)記者,他已經(jīng)與一些醫(yī)院合作,運(yùn)用人工智能算法進(jìn)行了幾項(xiàng)醫(yī)學(xué)領(lǐng)域的研究。
其中一項(xiàng)研究是判斷腎病病人是糖尿病腎病還是非糖尿病腎病。因?yàn)槎唠m然都是腎病,但致病機(jī)制不同,治療方法也不同。傳統(tǒng)的判斷方法是做腎穿刺,但這種方法比較痛苦,成本也高。裴智勇介紹,他們希望通過憑借一些醫(yī)學(xué)檢查指標(biāo)來直接判斷。
“我們構(gòu)建了一個(gè)機(jī)器學(xué)習(xí)模型,運(yùn)用人工智能算法對(duì)病人的幾十種檢查指標(biāo)進(jìn)行大數(shù)據(jù)分析,來預(yù)測(cè)是糖尿病腎病還是非糖尿病腎病?!迸嶂怯陆榻B,在此基礎(chǔ)上,他們又篩選出關(guān)鍵指標(biāo),最后實(shí)現(xiàn)僅憑借8個(gè)檢查指標(biāo)就達(dá)到95%的預(yù)測(cè)準(zhǔn)確率。
努力擁抱人工智能
其他領(lǐng)域的科研人員也在努力擁抱人工智能。
南京大學(xué)現(xiàn)代工程與應(yīng)用科學(xué)學(xué)院教授李濤正嘗試將深度學(xué)習(xí)算法應(yīng)用在超構(gòu)光子技術(shù)領(lǐng)域。
“超構(gòu)光子技術(shù)是通過每一個(gè)納米結(jié)構(gòu)單元對(duì)光的調(diào)制來實(shí)現(xiàn)特定的光學(xué)功能。”李濤介紹,以往在設(shè)計(jì)納米結(jié)構(gòu)時(shí),需要人工設(shè)計(jì)一系列復(fù)雜的參數(shù)。
李濤現(xiàn)在嘗試,將已知的一套參數(shù)輸入到深度學(xué)習(xí)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,使其學(xué)習(xí)參數(shù)的規(guī)律,然后不斷調(diào)試,最終通過深度學(xué)習(xí)網(wǎng)絡(luò)來設(shè)計(jì)更多的參數(shù)。
在李濤看來,當(dāng)前基于納米結(jié)構(gòu)設(shè)計(jì)的超構(gòu)材料光子學(xué)提供了調(diào)控光場(chǎng)的強(qiáng)大手段,它正逐漸從物理演示走向技術(shù)應(yīng)用。而對(duì)于實(shí)用化的光學(xué)器件,需要滿足諸如工作效率、工作帶寬、成像分辨率、像差和色差等一系列性能參數(shù)要求,且不同使用場(chǎng)景對(duì)相關(guān)參數(shù)有不同要求。人工智能算法能大大提高設(shè)計(jì)效率,在多參數(shù)空間的優(yōu)化上具有巨大的優(yōu)勢(shì)。
“人工智能算法的引入將對(duì)超構(gòu)光子技術(shù)發(fā)展,乃至變革光學(xué)技術(shù)的開發(fā),如無標(biāo)記超分辨成像、無透鏡成像等起到不可估量的推動(dòng)作用?!崩顫f。
南京大學(xué)化學(xué)化工學(xué)院副教授李承輝前不久看到一篇科研論文,介紹如何用人工智能算法來推薦分子的合成路線,這給了他不少啟發(fā)。他正在考慮如何用人工智能幫助他做化學(xué)研究。
李承輝告訴科技日?qǐng)?bào)記者,他最近發(fā)現(xiàn)一種新的分子內(nèi)成環(huán)反應(yīng),希望了解這種反應(yīng)是否在其他分子內(nèi)也存在?!耙獧z測(cè)這種化學(xué)反應(yīng)是否具有普適性,需要用不同分子做大量實(shí)驗(yàn)才行?!崩畛休x說,假如能利用人工智能縮小目標(biāo)范圍,將大大減少他的工作量。
在知道精確結(jié)果的前提下,可以通過輸入關(guān)鍵字在化學(xué)數(shù)據(jù)庫去搜索相關(guān)分子。問題在于,眼下并不知道精確結(jié)果。只知道滿足這種化學(xué)反應(yīng)的大致條件,比如分子具有某種特殊的功能團(tuán)等。因此李承輝期待將人工智能算法引入化學(xué)數(shù)據(jù)庫中:只告訴化學(xué)數(shù)據(jù)庫這種分子的大致特征,讓數(shù)據(jù)庫去智能搜索、篩選匹配的分子,縮小目標(biāo)范圍。
幫助科學(xué)家在大數(shù)據(jù)中“采礦”
不過,目前來看,像“阿爾法折疊”這樣針對(duì)特定科研領(lǐng)域的人工智能應(yīng)用鳳毛麟角。普通科學(xué)家要想得心應(yīng)手地用上人工智能這個(gè)工具,還是有一定門檻。
人工智能開源算法,是李濤實(shí)現(xiàn)想法的途徑。他和學(xué)生已經(jīng)找到一種開源算法,但這種算法對(duì)超構(gòu)光子技術(shù)研究而言并非最優(yōu),因此需要不斷調(diào)試參數(shù)才行。
李承輝則打算找人工智能領(lǐng)域的專業(yè)人士聊一聊,學(xué)習(xí)一下怎么將人工智能算法應(yīng)用到自己的研究當(dāng)中。
裴智勇則幸運(yùn)得多。他的研究領(lǐng)域是生物信息學(xué),是將計(jì)算機(jī)技術(shù)應(yīng)用于生物學(xué)領(lǐng)域的交叉學(xué)科,因此裴智勇對(duì)人工智能算法的關(guān)注比較早。在具體應(yīng)用中,開源的人工智能算法如支持向量機(jī)(SVM)和隨機(jī)森林等為他提供了不少幫助。
“這些算法本身是開源的,我們只需要根據(jù)自己的研究去修改其中的關(guān)鍵參數(shù)。也就是說,參數(shù)訓(xùn)練是我們團(tuán)隊(duì)自己來做?!迸嶂怯抡f。
至于人工智能在科研領(lǐng)域的應(yīng)用前景,不少人非??春谩?/p>
寒武紀(jì)公司總裁陳天石在接受科技日?qǐng)?bào)記者采訪時(shí)說,人工智能的本質(zhì)是提供求解問題的方法,比如在非常大的選擇空間當(dāng)中做出最優(yōu)選擇。這是科學(xué)研究經(jīng)常會(huì)遇到的問題,而人工智能恰恰可以幫助科研人員更快更好地解決此類問題。
“未來的人工智能可能會(huì)替代科學(xué)家的部分思考過程。”李承輝說,比如在化學(xué)領(lǐng)域,人工智能可以基于大數(shù)據(jù)幫助科研人員分析化學(xué)材料的性質(zhì)、特征,向科研人員提供多種合成路徑作為參考,并推薦低廉合成某種化合物的最優(yōu)路徑等等。
裴智勇的判斷是,人工智能算法在科研領(lǐng)域的應(yīng)用會(huì)形成一個(gè)產(chǎn)業(yè)。以基因領(lǐng)域?yàn)槔?,未來的基因組數(shù)據(jù)積累和增長(zhǎng)速度越來越快,靠人工去處理、計(jì)算海量數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的。這就需要人工智能算法幫助科研人員在大數(shù)據(jù)中“采礦”,催生有價(jià)值的發(fā)現(xiàn)。
“人工智能技術(shù)迅速更新迭代,僅靠科研人員自己摸索開源算法是不夠的。”裴智勇認(rèn)為,今后可能會(huì)出現(xiàn)不同科研領(lǐng)域的團(tuán)隊(duì)與人工智能領(lǐng)域的團(tuán)隊(duì)合作,前者實(shí)現(xiàn)業(yè)務(wù)層工作,后者實(shí)現(xiàn)技術(shù)層工作。同時(shí),科研領(lǐng)域可能會(huì)涌現(xiàn)出更多“阿爾法折疊”這樣的人工智能應(yīng)用。(記者劉園園)