人類(lèi)文明在短短數(shù)百年時(shí)間里,取得了前所未有的巨大發(fā)展。無(wú)論是逆天改命的基因編輯技術(shù),還是變革社會(huì)上上下下的人工智能技術(shù),都讓我們一度相信:人類(lèi)可以改變世界,人類(lèi)可以創(chuàng)造任何想要的未來(lái)。
但是,2020年一場(chǎng)突如其來(lái)的新冠疫情,不僅給全世界帶來(lái)了巨大沖擊和破壞,也讓我們意識(shí)到,原來(lái)在大自然的未知力量面前,人類(lèi)有多渺小和脆弱。我們不禁要問(wèn),人類(lèi)科技究竟能否改變世界?AI時(shí)代人類(lèi)如何更強(qiáng)大?下一次大流行病我們能否輕松應(yīng)對(duì)?
以下來(lái)自北京大學(xué)人民醫(yī)院檢驗(yàn)科主任、教授、博導(dǎo), 北京大學(xué)醫(yī)學(xué)部檢驗(yàn)學(xué)系主任王輝;清華大學(xué)計(jì)算機(jī)系副主任、教授、杰青、IEEE fellow唐杰;西北大學(xué)醫(yī)學(xué)院院長(zhǎng)、主任醫(yī)師、博導(dǎo)趙鋼;西安交通大學(xué)電信學(xué)部自動(dòng)化學(xué)院教授葉凱等學(xué)術(shù)界專(zhuān)家,一起探討“AI是否可以引領(lǐng)傳染病診療的新范式?”并展望未來(lái)AI在生物、醫(yī)學(xué)領(lǐng)域的應(yīng)用,展望未來(lái)的技術(shù)趨勢(shì)。
一、生物學(xué)如何改變世界?
就像在《槍炮、病菌和鋼鐵》一書(shū)中所述,微生物又一次改變或者至少調(diào)整了人類(lèi)社會(huì)前進(jìn)的軌跡。那么,既然微生物在人類(lèi)健康和社會(huì)發(fā)展中這么重要,它們與人類(lèi)相關(guān)的作用,最直接的比如傳染病、細(xì)菌耐藥性,還有食品發(fā)酵,新能源生產(chǎn),這些作用能否通過(guò)AI進(jìn)行深入挖掘和預(yù)測(cè)?
夏涵首先介紹了基于計(jì)算機(jī)技術(shù)起家的大名鼎鼎的福泰制藥(Vertex)。作為豪門(mén)林立的制藥界的現(xiàn)象級(jí)黑馬,福泰制藥以“基于結(jié)構(gòu)設(shè)計(jì)藥物”為核心理念,成立僅32年,就從3個(gè)人的小團(tuán)隊(duì)迅速崛起為市值超過(guò)600億美元、位列世界藥企前30強(qiáng)的巨頭,在制藥界獨(dú)領(lǐng)風(fēng)騷。
而就在最近,AI醫(yī)藥研發(fā)平臺(tái)星藥科技(Galixir,下稱“星藥”)宣布完成最新兩輪數(shù)千萬(wàn)美金融資。
夏涵表示,所謂“AI制藥”,就是基于計(jì)算化學(xué)、藥物化學(xué)、結(jié)構(gòu)生物學(xué),可以在藥物靶點(diǎn)發(fā)現(xiàn)、候選化合物的生成、化合物結(jié)構(gòu)優(yōu)化、成藥性及毒性預(yù)測(cè)、專(zhuān)利分析等一系列方向利用深度學(xué)習(xí)模型進(jìn)行嘗試,提高制藥業(yè)的新藥研發(fā)效率。而經(jīng)過(guò)這次疫情,人類(lèi)命運(yùn)共同體已經(jīng)進(jìn)入了所謂“后新冠時(shí)代”。
AlphaFold預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu)與展示的蛋白質(zhì)結(jié)構(gòu)
二、AlphaFold是什么?價(jià)值何在?
近日,谷歌AI團(tuán)隊(duì)DeepMind所研究的 AlphaFold 算法在生物學(xué)領(lǐng)域取得了重要突破:通過(guò)蛋白質(zhì)的氨基酸序列高精度地確定其3D結(jié)構(gòu)。
AlphaFold不是簡(jiǎn)單的暴力美學(xué),而是代表了大數(shù)據(jù)走向真正應(yīng)用的趨勢(shì)。唐杰認(rèn)為,大數(shù)據(jù)及相關(guān)研究向各個(gè)學(xué)科滲透是一個(gè)大趨勢(shì),10年前做大數(shù)據(jù)分析可能更多的是做簡(jiǎn)單的統(tǒng)計(jì)分析,而AlphaFold是一個(gè)將大數(shù)據(jù)應(yīng)用于簡(jiǎn)單分析到深入分析甚至預(yù)測(cè)的轉(zhuǎn)折點(diǎn),展示了計(jì)算機(jī)幫助人類(lèi)探索未知世界的發(fā)展趨勢(shì)。沿著這條路走下去,我們可以嘗試驗(yàn)證各種可能性,朝著預(yù)測(cè)的方向做,尋找靶點(diǎn)等一些問(wèn)題也許會(huì)得到解決。計(jì)算機(jī)算法的發(fā)展速度非??欤珹lphaFold驗(yàn)證了計(jì)算機(jī)和AI能幫到人類(lèi),相信后期很多計(jì)算機(jī)學(xué)家會(huì)沖上來(lái)把計(jì)算復(fù)雜度大大降低,讓計(jì)算速度成百上千倍地提升,到時(shí)候這類(lèi)東西就能真正幫到大家。
葉凱認(rèn)為,AlphaFold是一個(gè)突破性的進(jìn)展,它有很強(qiáng)的預(yù)測(cè)能力。在生物醫(yī)學(xué)領(lǐng)域,研究人員一直試圖從生物醫(yī)學(xué)大數(shù)據(jù)里面理解過(guò)去,但其實(shí)更重要的是要計(jì)算未來(lái),即怎么從已有數(shù)據(jù)里能夠找到規(guī)律,然后用這些學(xué)到的東西去計(jì)算未來(lái)會(huì)發(fā)生什么事情?,F(xiàn)在的AI方法是從大數(shù)據(jù)開(kāi)始,從開(kāi)始直接跳到最后的表型,跳過(guò)了中間的很多步驟,缺乏一些機(jī)理方面的理解。目前的AlphaFold類(lèi)型的AI能做到的是從開(kāi)始直接預(yù)測(cè)到結(jié)果,但沒(méi)有辦法解釋其中的生物學(xué)機(jī)理。
王輝認(rèn)為AI確實(shí)可以幫助新藥研發(fā)。抗生素耐藥已經(jīng)成為一個(gè)全球關(guān)注的熱點(diǎn)問(wèn)題,新研發(fā)的抗生素管線越來(lái)越少,研發(fā)出的新藥能夠長(zhǎng)時(shí)間不耐藥的可能性越來(lái)越小 (也有例外情況,如萬(wàn)古霉素這樣的抗生素到現(xiàn)在還沒(méi)有產(chǎn)生耐藥菌)。在這種背景下,首先,現(xiàn)在很多文獻(xiàn)在討論有沒(méi)有其他類(lèi)藥物能夠抵抗現(xiàn)存的耐藥機(jī)制,其次,由于測(cè)序技術(shù)的發(fā)展,現(xiàn)在很多研究通過(guò)基因組、轉(zhuǎn)錄組的數(shù)據(jù)預(yù)測(cè)耐藥表型、毒力表型。但無(wú)論是耐藥還是藥物研發(fā),王輝認(rèn)為都需要基礎(chǔ)研究要很強(qiáng)才行。在醫(yī)療AI領(lǐng)域,并不是數(shù)據(jù)量越大越好,數(shù)據(jù)的可用性很重要,所以,在設(shè)計(jì)時(shí)候要思考到底需要哪些數(shù)據(jù),這些數(shù)據(jù)對(duì)預(yù)測(cè)有什么作用等。舉例來(lái)說(shuō),我們需要知道哪些基因跟耐藥機(jī)制有關(guān),哪些機(jī)制在發(fā)揮作用,是不是多個(gè)機(jī)制在發(fā)揮作用,各個(gè)機(jī)制的權(quán)重如何,才可以精準(zhǔn)預(yù)測(cè)耐藥性。只有我們的認(rèn)知程度到這個(gè)階段時(shí),才可以把不同因素通過(guò)AI結(jié)合起來(lái),才能很好地去預(yù)測(cè)。某些菌的耐藥是比較好預(yù)測(cè)的,比如結(jié)核分枝桿菌大多數(shù)是靠突變的而耐藥的,突變可以很容易通過(guò)基因組SNP檢測(cè)。但革蘭陰性桿菌(大腸桿菌、肺炎克雷伯菌)相對(duì)困難。
AI發(fā)源于神經(jīng)科學(xué)的研究,今天常說(shuō)的“黑箱”用腦科學(xué)是可以進(jìn)行某種詮釋的,現(xiàn)在越來(lái)越逼近這個(gè)方向。趙鋼首先對(duì)AI的發(fā)展與神經(jīng)科學(xué)的關(guān)系進(jìn)行了闡釋?zhuān)⒚鞔_表示AI與基因?qū)?huì)引領(lǐng)傳染病的發(fā)現(xiàn)與診療。就神經(jīng)內(nèi)科而言,神經(jīng)內(nèi)科類(lèi)疾病的診斷是從經(jīng)驗(yàn)醫(yī)學(xué)開(kāi)始的,依靠臨床病人的表現(xiàn)、體征,結(jié)合解剖學(xué)及癥狀學(xué)的知識(shí)來(lái)診斷,但經(jīng)驗(yàn)醫(yī)學(xué)并不精確,因此,開(kāi)始借助影像醫(yī)學(xué)(CT、磁共振)的幫助。為了克服影像醫(yī)學(xué)的局限性,又開(kāi)始依靠檢驗(yàn)醫(yī)學(xué)提供的巨大幫助。各類(lèi)技術(shù)手段使得診斷的準(zhǔn)確率得到了大幅提升,醫(yī)生和病人都獲得了巨大的收益。從原來(lái)的經(jīng)驗(yàn)醫(yī)學(xué)走到了影像醫(yī)學(xué),再到檢驗(yàn)醫(yī)學(xué),再往后走應(yīng)該就是智能醫(yī)學(xué)了。智能醫(yī)學(xué)最后肯定會(huì)把疾病的診斷符合率在現(xiàn)有基礎(chǔ)上再次提升。趙鋼負(fù)責(zé)的腦膜炎的輔助診斷決策系統(tǒng)已經(jīng)把診斷符合率提高到80%,而之前200多位醫(yī)生分幾個(gè)批的平均診斷符合率僅在40%以上。未來(lái)如果讓AI的輔助診斷決策+精準(zhǔn)的檢驗(yàn)醫(yī)學(xué)+NGS,診斷符合率還會(huì)提高。這就是未來(lái)智能醫(yī)學(xué)的發(fā)展方向。
三、“望聞問(wèn)切”在AI時(shí)代將會(huì)重生?
近年來(lái),AI在藥物設(shè)計(jì)、診斷方面已經(jīng)有長(zhǎng)足進(jìn)步,在基因序列分析、自然語(yǔ)言處理、圖像處理、3D構(gòu)象等方向都在引領(lǐng)新的創(chuàng)新點(diǎn)。AI可以通過(guò)讀胸片(望),通過(guò)聽(tīng)咳嗽的聲音(聞),通過(guò)基因測(cè)序(切)來(lái)輔助醫(yī)療的診斷,難道這就是古中醫(yī)的“望聞問(wèn)切”在AI時(shí)代的重生嗎?
對(duì)此,葉凱首先指出事物的觀測(cè)結(jié)果、表征、表象是內(nèi)在本質(zhì)的反映。透過(guò)現(xiàn)象(身體特征)看到本質(zhì)(健康狀況、可能存在的疾病)是我們與生俱來(lái)的、進(jìn)化出來(lái)的一項(xiàng)能力。古代的醫(yī)生也許能夠通過(guò)這種外在與內(nèi)在的相關(guān)性對(duì)一些疾病進(jìn)行相應(yīng)的診斷,但由于交通不便、信息傳播困難的原因,知識(shí)不能普及。在AI與大數(shù)據(jù)的時(shí)代,測(cè)量手段非常先進(jìn),我們可以從多個(gè)維度對(duì)病人、疾病、潛在的致病原因進(jìn)行很好的刻畫(huà)。這時(shí)候可以用AI的方法,跳過(guò)中間的機(jī)理、因果相關(guān)性等些規(guī)則,發(fā)現(xiàn)表征與疾病的相關(guān)性。就抗生素耐藥性而言,葉凱首先從進(jìn)化角度認(rèn)為耐藥性一定會(huì)發(fā)生,我們應(yīng)該思考如果用AI發(fā)現(xiàn)耐藥性與各因素的聯(lián)系,把藥物對(duì)細(xì)菌或病毒的效果預(yù)測(cè)出來(lái)。這要求基礎(chǔ)科研工作者掌握藥物起效的機(jī)理,要求AI工作者把現(xiàn)象與機(jī)理融合在一起,一起把這個(gè)耐藥性問(wèn)題解決。單獨(dú)依靠一個(gè)方面,可能沒(méi)有辦法做的更快、更有效率。
針對(duì)葉凱的觀點(diǎn),唐杰表示AI診斷在未來(lái)是很有前景的方向,并列舉了自己與協(xié)和醫(yī)院合作,通過(guò)計(jì)算機(jī)診斷胸片中腫瘤塊是惡性還是良性,已經(jīng)能做到85%左右的精度,基本達(dá)到醫(yī)生的診斷水平。根據(jù)人臉識(shí)別的發(fā)展速度,唐杰認(rèn)為AI診斷最終將會(huì)進(jìn)入尋常人的生活。再往后看,AI診斷需要大量的數(shù)據(jù)來(lái)定義模型,對(duì)醫(yī)學(xué)來(lái)講這是挺難的,對(duì)此,我們是否可以思考能否用個(gè)人助手這樣一個(gè)東西,讓AI跟人共存,目前,智能手表、智能手環(huán)已經(jīng)開(kāi)始收集了血氧含量、心跳、運(yùn)動(dòng)量、睡眠時(shí)間等數(shù)據(jù),如果每個(gè)人上傳自己日常生活中的聲音、影像學(xué)結(jié)果等資料,也許就可以解決數(shù)據(jù)缺乏問(wèn)題,數(shù)據(jù)的融合+AI算法,也許不僅能幫助普通人,也會(huì)輔助醫(yī)生的診斷。
趙鋼認(rèn)為AI時(shí)代的望聞問(wèn)切其實(shí)包含兩個(gè)層面的問(wèn)題:(1)AI能干什么;(2)AI是不是能夠像中醫(yī)一樣診斷疾病。并指出這種方法其實(shí)是有問(wèn)題的:無(wú)論是中醫(yī)的望聞問(wèn)切,還是西醫(yī)的“視觸叩聽(tīng)”,診斷都是癥狀,并沒(méi)有診斷疾病,而我們現(xiàn)在需要的是診斷疾病。例如,發(fā)燒是癥狀,而疾病可能是感冒、肺炎、闌尾炎、膽囊炎,不同疾病的治療方法完全不一樣。因此,AI不是古代望聞問(wèn)切的癥狀學(xué)的診斷,我們現(xiàn)在需要的是病因?qū)W的診斷。把病因?qū)W搞清是一個(gè)巨大的進(jìn)步。
王輝認(rèn)為僅僅用“望聞問(wèn)切”四個(gè)字來(lái)總結(jié)現(xiàn)有數(shù)據(jù)收集方法是欠妥的。望聞問(wèn)切都只是表征方法,而現(xiàn)代檢驗(yàn)醫(yī)學(xué)會(huì)產(chǎn)生大量的指標(biāo)數(shù)據(jù),這樣大量的數(shù)據(jù)才能支撐疾病的診斷和治療。未來(lái)需要檢驗(yàn)醫(yī)學(xué)、影像學(xué)等很多類(lèi)的數(shù)據(jù)才能夠支撐AI在診斷、預(yù)防、公共衛(wèi)生事件預(yù)警等方面的應(yīng)用。所有的預(yù)測(cè)都要是基于我們對(duì)病因?qū)W、病理學(xué)、治療學(xué)等學(xué)科的知識(shí)的了解和認(rèn)知才可以實(shí)現(xiàn)。AI與醫(yī)療的結(jié)合是一個(gè)不斷更新不斷發(fā)展的過(guò)程。
四、AI如何助力海量醫(yī)療數(shù)據(jù)的挖掘
從X-Ray到冷凍電鏡再到基因測(cè)序,生物數(shù)據(jù)出現(xiàn)了爆炸性增長(zhǎng),如下圖所示。從目前的研究進(jìn)展來(lái)看,我們了解了堿基、基因、基因上下文、基因通路、基因組等各類(lèi)信息,從某種角度來(lái)看,它們之間的關(guān)系和NLP中的字母表、單詞、詞組、語(yǔ)句、文章存在著某種相似性。在這種情況下,能否使用NLP的相關(guān)技術(shù)推動(dòng)基因分析、研究的進(jìn)展?
從自然語(yǔ)言的角度來(lái)說(shuō),唐杰認(rèn)為NLP共有三個(gè)層次:(1)人類(lèi)看語(yǔ)言首先是了解,即把一個(gè)篇章分解成段落、句子、主謂賓結(jié)構(gòu)、詞組等。對(duì)應(yīng)到基因?qū)W,也許可以用同樣的方法看到基因測(cè)序結(jié)果以后理解它到底是什么東西。(2)NLP做了很多事情,如有意義的信息抽取,在生物信息學(xué)中是不是也可以這樣,抽取某些結(jié)構(gòu)對(duì)應(yīng)的功能、特征,把這些抽出來(lái)以后進(jìn)行預(yù)測(cè)。(3)NLP之前都在研究是什么、為什么?以及哪些最重要?但現(xiàn)在預(yù)訓(xùn)練模型把全世界所有的文章都都放到一個(gè)機(jī)器里面去,做預(yù)訓(xùn)練,模型變成了一個(gè)黑盒子,我們不知道內(nèi)部的具體關(guān)系,但可以用它生成一句話甚至相關(guān)的單詞,未來(lái)在生物工程里面也許在也會(huì)面臨這樣的一個(gè)問(wèn)題。是不是可以把人的所有的基因測(cè)序信息放到一臺(tái)大機(jī)器里面,產(chǎn)生可以告訴我們什么樣的一個(gè)基因結(jié)構(gòu)是更好、更健康的存在。
葉凱老師從基因組的角度進(jìn)行了分析。一方面,基因組里面字符串非常長(zhǎng),現(xiàn)在對(duì)它的理解是:所有跟生命相關(guān)的這些程序性的控制,整個(gè)生命周期所有的信息實(shí)際上是編碼在基因組里面。這些信息都是一維的序列,不過(guò),這些信息雖然編碼在基因組序列里面,但是它發(fā)揮作用的規(guī)則并不完全在基因組序列里面,還有一些其他的規(guī)則會(huì)起作用,因?yàn)槿魏我粋€(gè)基因都和特定的外界的生存環(huán)境密切相關(guān),基因在不同的階段會(huì)和相應(yīng)的一些環(huán)境進(jìn)行互作。整體來(lái)說(shuō),一維信息的確存在,的確是編碼在基因組的業(yè)務(wù)信息里面,但里面還是有二維的結(jié)構(gòu)。染色體實(shí)際上是有三維結(jié)構(gòu),但是它被折疊了,折疊之后一些地方會(huì)像固體一樣,其他地方會(huì)像液體一樣,這里面實(shí)際上有很多是物理在里面起作用了,這是非常奇妙的。AI可以學(xué)到一些基本的單元,但是具體怎么樣互作,整個(gè)體系怎么內(nèi)部互助以及和環(huán)境互作,以及在不同時(shí)間段里面哪些地方打開(kāi)/關(guān)閉這種程序性的運(yùn)作的話,現(xiàn)在NLP還不夠,還需要開(kāi)發(fā)出更加復(fù)雜的一些體系。整個(gè)基因組的線性結(jié)構(gòu)的話超出了當(dāng)前AI的水平,很多東西我們還不知道。
另外一方面,如果能把一維的序列學(xué)清楚,是不是能夠人工設(shè)計(jì)一些系統(tǒng)?當(dāng)前的合成生物學(xué)、綠色生物制造等相關(guān)的一些國(guó)內(nèi)國(guó)外的一些專(zhuān)家其實(shí)已經(jīng)在這么做了,我們打亂一些簡(jiǎn)單酵母的染色體里面的編碼基因,把它重新編寫(xiě)成一個(gè)完全群新的基因組,試著能夠讓酵母能夠生長(zhǎng)發(fā)育、完成它的生命周期,實(shí)際上是非常了不起的一件事情。但目前合成生物學(xué)只能對(duì)比較結(jié)構(gòu)簡(jiǎn)單的一些生物進(jìn)行這種基因組的從頭寫(xiě),但對(duì)一些結(jié)構(gòu)復(fù)雜的生物里面的元件之間的相互作用、如何精密地調(diào)控還缺乏認(rèn)識(shí),我們甚至還不知道人的基因組里面大量的序列的作用。染色體里面非編碼的這些序列到底怎么發(fā)揮作用、我們?cè)鯓涌刂扑鼘?shí)際上還是非常有挑戰(zhàn)性的,需要前沿的生物技術(shù)和AI同時(shí)進(jìn)行推進(jìn)。
王輝認(rèn)為生物體是一個(gè)非常復(fù)雜的系統(tǒng),并不僅僅通過(guò)基因組來(lái)決定,還有很多基因組之外的轉(zhuǎn)錄組、蛋白質(zhì)組、翻譯組的在起作用。類(lèi)比于癌癥診斷來(lái)說(shuō),人和人之間的差異非常多,重要的是很難區(qū)分哪些突變是多態(tài)性(比如因?yàn)槿朔N、所處地區(qū)等很多因素導(dǎo)致突變的情況不同)、哪些是致病突變,這就導(dǎo)致我們不能很快確定基因與疾病的關(guān)系;類(lèi)似的,微生物在抗生素壓力下也在不斷進(jìn)行進(jìn)化,會(huì)有自身的突變、外來(lái)DNA物質(zhì)獲取,拷貝數(shù)增加、RNA表達(dá)水平差異、蛋白翻譯水平差異等等,這些生物體各個(gè)層面的復(fù)雜變化都可能是耐藥表型的決定因素。 趙鋼提到基因組的改變和人類(lèi)疾病之間的關(guān)系目前還遠(yuǎn)遠(yuǎn)沒(méi)有認(rèn)識(shí)到的?,F(xiàn)在最大的問(wèn)題是這兩個(gè)數(shù)據(jù)是分割的,臨床的數(shù)據(jù)在醫(yī)院里頭,基因的數(shù)據(jù)在各類(lèi)的檢測(cè)公司那里,二者沒(méi)有對(duì)接。接下來(lái)我們要把基因組檢測(cè)的數(shù)據(jù)和臨床的數(shù)據(jù)對(duì)接起來(lái),之后,很多問(wèn)題就可以找到答案了。
針對(duì)各位專(zhuān)家的觀點(diǎn),唐杰提到自然語(yǔ)言處理中也有打散、重組的過(guò)程,在認(rèn)知科學(xué)中這是試錯(cuò)與探索,其實(shí)人類(lèi)很多新知識(shí)就是來(lái)自試錯(cuò)與探索。比如一句話的字詞重新組合以后可以表達(dá)新的意思,如果新的組合更準(zhǔn)確,人們可能就會(huì)使用新的話;但是如果新的組合會(huì)引發(fā)爭(zhēng)議甚至批評(píng),講話者可能就不這么說(shuō)了。基因可能也有類(lèi)似的情況,如果復(fù)制一份并打散、重組以后,新的組合更有效,也會(huì)被保留下來(lái)。
五、AI能否預(yù)防耐藥性灰犀牛,避免傳染疾病的爆發(fā)?
2020年的疫情改變了全世界,在患者治療過(guò)程中,現(xiàn)有的檢測(cè)其實(shí)不滿足醫(yī)生的快速的需求,這樣就導(dǎo)致了醫(yī)生不得已只能用更強(qiáng)力的藥物,而這會(huì)產(chǎn)生一定的副作用。在這樣的背景下,AI能否幫助發(fā)現(xiàn)或者預(yù)警這種新的傳染病源,預(yù)防耐藥灰犀牛的產(chǎn)生?
“預(yù)測(cè)很困難,預(yù)警有希望?!睂?duì)于在目前的這種體系下,未來(lái)10年我們能夠在傳染性疾病里面能夠做哪些工作,王輝認(rèn)為:我們對(duì)于感染性疾病的病原學(xué)的認(rèn)知是有限的,尤其是病毒感染的診斷更加困難,不明原因發(fā)熱就是一個(gè)例子。就預(yù)警來(lái)說(shuō),預(yù)警體系需要出現(xiàn)某樣癥候群或者某種數(shù)據(jù)積累到一定程度,這需要足夠的數(shù)據(jù)量,需要流行病學(xué)、微生物學(xué)、病毒學(xué)、傳染病學(xué)等很多數(shù)據(jù)的積累。對(duì)于感染性疾病來(lái)說(shuō),要解決的也是最困難的其實(shí)是病原學(xué)的診斷。另一個(gè)問(wèn)題就是一定要快速檢測(cè),只有最快的檢測(cè)才能隔離預(yù)防感染性疾病。而AI技術(shù)能不能幫助我們更往前推進(jìn),更早發(fā)現(xiàn)傳染趨勢(shì)、發(fā)現(xiàn)源頭,這是需要臨床醫(yī)學(xué)專(zhuān)家跟AI的專(zhuān)家們、計(jì)算生物學(xué)專(zhuān)家們、大數(shù)據(jù)專(zhuān)家們一起合作,共同攻關(guān)的。
此外,對(duì)耐藥性的預(yù)測(cè),國(guó)際上也已經(jīng)有幾個(gè)團(tuán)隊(duì)在研究,芝加哥大學(xué)在幾年前就開(kāi)始在做,也陸續(xù)出了一些數(shù)據(jù),國(guó)內(nèi)相對(duì)來(lái)說(shuō)起步比較晚。臨床最關(guān)心的問(wèn)題是,對(duì)于某一類(lèi)的菌,對(duì)于臨床最關(guān)心最常用的幾種藥,能不能通過(guò)AI技術(shù)預(yù)測(cè)表型?我們要有心理準(zhǔn)備,耐藥預(yù)測(cè)很困難。目前很多抗生素的靶點(diǎn)不清楚,就是這個(gè)藥物作用在微生物里面,它到底通過(guò)幾條通路抑制細(xì)菌的繁殖?這是困難、挑戰(zhàn),但是還是得做,各個(gè)領(lǐng)域人才,交叉融合、互相推動(dòng)。 順著王輝的思路,唐杰認(rèn)為計(jì)算機(jī)也許可以幫上忙,計(jì)算機(jī)在未來(lái)通過(guò)大量的數(shù)據(jù)和算法,也許可以用模型覆蓋更大范圍的感染情況,然后根據(jù)病人的一些參數(shù)快速識(shí)別出最有可能的感染源,以及預(yù)測(cè)病人有沒(méi)有可能發(fā)展為危重病例。深度學(xué)習(xí)近幾年發(fā)展很快,但是因?yàn)樗牟糠謨?nèi)容還是黑盒,所以部分醫(yī)學(xué)研究者反對(duì)使用它,但其實(shí)弄清楚機(jī)理、明白為什么和使用它并不沖突,二者是可以同步的,在弄清楚原理的過(guò)程中,數(shù)據(jù)也在積累,這時(shí)候如果把門(mén)診的數(shù)據(jù)和測(cè)試的數(shù)據(jù)打通,也許可以通過(guò)這個(gè)超大的數(shù)據(jù)集訓(xùn)練出一個(gè)模型。
趙鋼首先梳理了問(wèn)題,認(rèn)為預(yù)測(cè)包括三個(gè)部分:(1)原有疾病的預(yù)測(cè);(3)新疾病的預(yù)測(cè);(3)耐藥的預(yù)測(cè)。并重點(diǎn)分析了原有疾病的預(yù)測(cè)。原有疾病的預(yù)測(cè)包含兩部分內(nèi)容:一是診斷的預(yù)測(cè),在傳統(tǒng)或是基因檢測(cè)的病原學(xué)的依據(jù)還沒(méi)有出來(lái)之前,如果能夠預(yù)測(cè)一下診斷結(jié)果,這是非常有意義的;另一個(gè)是轉(zhuǎn)歸,從臨床醫(yī)生的角度來(lái)講,疾病診斷的預(yù)測(cè)是非常重要的。因?yàn)樵谠\斷不明確的時(shí)候,只能根據(jù)經(jīng)驗(yàn)全面用藥,如果碰上了,就把病治好了;如果碰不上的話,可能就治療失敗了。目前在這方面已經(jīng)出現(xiàn)了非常好的模型,如沃森的目標(biāo)疾病是腫瘤的預(yù)測(cè)、治療轉(zhuǎn)歸的預(yù)測(cè),能告訴醫(yī)生哪個(gè)治療方案最好。
在這次新冠的爆發(fā)以后,我們很多地方是使用人工進(jìn)行收集信息,然后上報(bào)。葉凱認(rèn)為,信息學(xué)里面有很多類(lèi)似的東西,如輿情分析、異常點(diǎn)的檢測(cè)等,可以參考這類(lèi)系統(tǒng)、結(jié)合軟硬件建設(shè)一個(gè)在線的檢測(cè)體系。這其中有幾個(gè)關(guān)鍵點(diǎn):(1)數(shù)據(jù)的收集、聯(lián)網(wǎng)匯報(bào)與匯總;(2)計(jì)算機(jī)通過(guò)在線學(xué)習(xí)以把全國(guó)的這些信息進(jìn)行實(shí)時(shí)的監(jiān)控,在沒(méi)有任何特殊的感染源爆發(fā)的時(shí)候,可以每時(shí)每刻都在收集數(shù)據(jù),這樣,一旦出現(xiàn)新類(lèi)型的疾病時(shí),我們肯定會(huì)看到一些異常的現(xiàn)象,把特殊毒株識(shí)別出來(lái),對(duì)它進(jìn)行相應(yīng)的一些鑒定,對(duì)于耐藥的基因也是可以用同樣的道理給它識(shí)別出來(lái)。如果把宏基因組、聯(lián)網(wǎng)的體系、在線學(xué)習(xí)的方法結(jié)合在一起,我們是能夠?qū)崿F(xiàn)目的的。
六、細(xì)菌、真菌耐藥性能否通過(guò)現(xiàn)有數(shù)據(jù)和AI模型進(jìn)行預(yù)測(cè)?
已有的結(jié)果顯示,很多細(xì)菌均可以通過(guò)基因型預(yù)測(cè)其表型。而最新的nature communication論文的作者也提出一個(gè)觀點(diǎn):現(xiàn)有的預(yù)測(cè)不夠好的主要原因可能是由于表型的記錄不夠細(xì)致。在此背景下,細(xì)菌、真菌的耐藥性能否通過(guò)現(xiàn)有數(shù)據(jù)和AI模型進(jìn)行預(yù)測(cè)?
如果通過(guò)現(xiàn)在測(cè)序的一些技術(shù)拿到了基因組的數(shù)據(jù),對(duì)某些特定的藥物、菌種是能夠做到很好的預(yù)測(cè)的,但它是有一定的局限性的,王輝覺(jué)得對(duì)那些水平基因轉(zhuǎn)移比較少的那些菌預(yù)測(cè)準(zhǔn)確度會(huì)高一些,但對(duì)于革蘭陰性菌陰來(lái)講要差一點(diǎn),因?yàn)楦锾m陰性菌耐藥機(jī)制更復(fù)雜。此外,預(yù)測(cè)會(huì)涉及非常多的技術(shù),針對(duì)不同的菌群,策略應(yīng)該是不同的。另外,對(duì)于疾病發(fā)展風(fēng)險(xiǎn)預(yù)測(cè),比如是否發(fā)展為膿毒癥,也有應(yīng)用價(jià)值。
“AI還處在一個(gè)初步階段,離通用人工智能、強(qiáng)人工智能還有很長(zhǎng)的距離。但是整個(gè) AI開(kāi)始朝通用人工智能和強(qiáng)人工智能在發(fā)展?!碧平苷J(rèn)為解決耐藥性預(yù)測(cè)問(wèn)題需要雙輪驅(qū)動(dòng):一是數(shù)據(jù)驅(qū)動(dòng),一是知識(shí)驅(qū)動(dòng)。一方面,醫(yī)學(xué)領(lǐng)的數(shù)據(jù)還沒(méi)有打通,所以,除了剛才提到的依靠人機(jī)共生從生活中獲取數(shù)據(jù),未來(lái)如果能夠打通醫(yī)療的數(shù)據(jù),也許可以依靠預(yù)訓(xùn)練生成一些模型,幫助醫(yī)生和患者診斷、治療。另一方面,現(xiàn)在的AI還沒(méi)有真正走到一個(gè)能夠把世界上所有的文本讀完、讀懂了以后比人還聰明,因此需要依靠醫(yī)學(xué)專(zhuān)家把醫(yī)學(xué)相關(guān)的知識(shí)建成一個(gè)超大規(guī)模的知識(shí)庫(kù),把這些知識(shí)連起來(lái)就可以做推理。這是一個(gè)非常有前景的方向。
對(duì)于細(xì)菌的耐藥性涉及抗藥的機(jī)理,葉凱認(rèn)為我們還沒(méi)有完全弄清楚有的藥物為什么發(fā)揮作用,細(xì)菌或病毒產(chǎn)生相應(yīng)的變異之后為什么會(huì)耐藥。如果我們有足夠多的相應(yīng)的數(shù)據(jù)(包括不同物種、不同細(xì)菌、不同真菌、不同病毒的耐藥性等的數(shù)據(jù))的話,那么,也許會(huì)發(fā)現(xiàn)耐藥的分子基因里面存在共通性,這時(shí),我們只要能在DNA水平測(cè)量下來(lái),同時(shí)測(cè)量其對(duì)不同藥物的抗耐藥性的一些屬性,那么,依靠這樣一個(gè)多時(shí)間點(diǎn)、多菌株的數(shù)據(jù)的話,我們也許就能夠進(jìn)行耐藥性的預(yù)測(cè)。
在弱人工智能時(shí)代,趙鋼認(rèn)為應(yīng)該分為兩個(gè)層面,一個(gè)層面是我們還在知識(shí)驅(qū)動(dòng)的層面,還沒(méi)有到這個(gè)數(shù)據(jù)驅(qū)動(dòng)。因?yàn)閿?shù)據(jù)驅(qū)動(dòng)需要大數(shù)據(jù),但現(xiàn)在醫(yī)學(xué)領(lǐng)域真的是沒(méi)有大數(shù)據(jù),只有小數(shù)據(jù)。針對(duì)耐藥基因的問(wèn)題,我們現(xiàn)在連知識(shí)驅(qū)動(dòng)都還達(dá)不到,因?yàn)閮H僅知道少數(shù)幾個(gè)細(xì)菌、少數(shù)幾個(gè)位點(diǎn),絕大部分并不知道,我們還得慢慢從知識(shí)積累的階段開(kāi)始,然后逐漸進(jìn)入知識(shí)驅(qū)動(dòng)的層面。等到醫(yī)學(xué)大數(shù)據(jù)時(shí)代到來(lái)的時(shí)候,我們才能達(dá)到數(shù)據(jù)驅(qū)動(dòng),我們才能真正做好。
七、AI診療的未來(lái)
對(duì)于AI診療的未來(lái),王輝提到,不管是疾病的預(yù)測(cè)、耐藥菌的預(yù)測(cè)還是疾病的診斷和治療方面,是可以有突破的,但我們也必須承認(rèn)我們的知識(shí)的水平是在一個(gè)不斷循環(huán)往復(fù)的過(guò)程里面,永遠(yuǎn)有新的我們不知道的東西,我們不知道的永遠(yuǎn)比我們知道的要多。把更多的AI專(zhuān)家加入醫(yī)學(xué)團(tuán)隊(duì)里面對(duì)疾病的預(yù)防、診斷、治療能夠起到一個(gè)推動(dòng)作用。醫(yī)療能力和AI能力都有一個(gè)由弱變強(qiáng)的過(guò)程,技術(shù)在不斷進(jìn)步,在未來(lái)5年10年醫(yī)療AI肯定會(huì)迎來(lái)一個(gè)很好的時(shí)代。
隨著人機(jī)共生時(shí)代的到來(lái),唐杰非常看好個(gè)性化診療的前景,因?yàn)樗且粋€(gè)很好的AI+醫(yī)療的場(chǎng)景,個(gè)性化診療可以真正把AI在醫(yī)療場(chǎng)景中發(fā)揮作用。除了把醫(yī)療數(shù)據(jù)導(dǎo)入AI中,更重要的是場(chǎng)景落地。
趙鋼希望更多的AI專(zhuān)家能夠加入醫(yī)學(xué)研究的行列,給我們醫(yī)學(xué)插上智能的翅膀。
葉凱認(rèn)為AI和生物醫(yī)學(xué)是跨學(xué)科的合作,面對(duì)著很多困難,如不同學(xué)科術(shù)語(yǔ)溝通困難等,但越是不同學(xué)科的人在一起,往往越能夠在思維上進(jìn)行碰撞,可能觀點(diǎn)不一樣、想法不一樣,但越是這種距離越遠(yuǎn)的這些學(xué)科碰在一起的時(shí)候,火花也越大。
AI現(xiàn)在已經(jīng)展現(xiàn)出很強(qiáng)大的功能,在蛋白質(zhì)折疊以及相關(guān)的一些領(lǐng)域里面已經(jīng)非常厲害,取得了超越了其他的這種計(jì)算方法及人工計(jì)算方法的這種成就,但是它實(shí)際上還是只能夠計(jì)算一些強(qiáng)的關(guān)聯(lián)規(guī)則,能夠進(jìn)行一些分類(lèi),但對(duì)因果關(guān)系、時(shí)序關(guān)系等還需要一些更好的一些挖掘,同時(shí)要把黑盒里面的東西理解出來(lái)。希望AI和生物醫(yī)學(xué)能夠手牽著手,把一些關(guān)鍵的生物學(xué)問(wèn)題把它給解決好,能夠推動(dòng)人工智能的一些技術(shù)繼續(xù)在往前走。
作為產(chǎn)業(yè)界的代表,夏涵認(rèn)為醫(yī)學(xué)插上智慧的翅膀需要很多試錯(cuò),產(chǎn)業(yè)界應(yīng)該給試錯(cuò)提供機(jī)會(huì)和支持。
文章來(lái)源于AI TIME 論道 ,作者AI Timer-田志遠(yuǎn)
(轉(zhuǎn)載)