人工智能已經(jīng)在藥物設(shè)計(jì)與開發(fā)方面,得到了廣泛的重視。嘗試應(yīng)用人工智能促進(jìn)藥物發(fā)現(xiàn)的初創(chuàng)公司,如同雨后春筍一般不斷涌現(xiàn),目前活躍在藥物發(fā)現(xiàn)領(lǐng)域的公司至少超過(guò)350家。其中包括早期階段的公司、初創(chuàng)公司以及較成熟的公司和IPO階段的公司。最近這一領(lǐng)域出現(xiàn)了一波突破,人工智能系統(tǒng)幫助快速發(fā)現(xiàn)和開發(fā)一流的小分子,并且這些小分子都進(jìn)入了臨床研究,以Insilico Medicine,Exscientia,BenevolentAI,Recursion Pharmaceuticals,Deep Genomics等公司作為代表。
值得注意的是,大多數(shù)人工智能驅(qū)動(dòng)的初創(chuàng)公司都專注于小分子藥物的發(fā)現(xiàn),而不是生物制劑,這一點(diǎn)其實(shí)并不令人感到意外。從歷史上看,即使是非人工智能計(jì)算方法(化學(xué)信息學(xué))也主要用于小分子治療,因?yàn)樗鼈兊姆肿咏Y(jié)構(gòu)和相互作用模式要簡(jiǎn)單得多。
人工智能在小分子藥物發(fā)現(xiàn)中具有一些獨(dú)特的優(yōu)勢(shì),這些優(yōu)勢(shì)使得它成為這一領(lǐng)域的有力工具:
01
化學(xué)信息可用性
小分子藥物的發(fā)現(xiàn)通常涉及大量的化學(xué)信息,包括分子結(jié)構(gòu)、藥物活性和毒性等。這些信息以數(shù)字形式存在,易于被計(jì)算機(jī)處理和分析。相比之下,生物制劑(如蛋白質(zhì)藥物)的發(fā)現(xiàn)和設(shè)計(jì)可能涉及更為復(fù)雜的生物學(xué)信息,難以用數(shù)字表示,因此處理起來(lái)更為復(fù)雜。
02
大規(guī)模虛擬篩選
小分子藥物的發(fā)現(xiàn)可以通過(guò)大規(guī)模的虛擬篩選來(lái)加速,這正是人工智能的一個(gè)強(qiáng)大優(yōu)勢(shì)。AI可以處理龐大的化學(xué)數(shù)據(jù)庫(kù),預(yù)測(cè)分子的藥效、毒性和其他關(guān)鍵特性,從而更高效地篩選出潛在的候選化合物。生物制劑的發(fā)現(xiàn)通常涉及更少的分子,且虛擬篩選的規(guī)模相對(duì)較小。
03
化學(xué)空間探索
人工智能能夠有效地探索和理解化學(xué)空間,推動(dòng)新化合物的設(shè)計(jì)和創(chuàng)新。在小分子藥物的領(lǐng)域,通過(guò)學(xué)習(xí)大量的已知藥物和相關(guān)化合物的數(shù)據(jù),AI可以幫助挖掘新的化學(xué)結(jié)構(gòu),從而促進(jìn)新藥物的開發(fā)。相比之下,生物制劑的設(shè)計(jì)通常更依賴于生物學(xué)信息。
04
高通透性和生物利用度的優(yōu)化
小分子藥物需要具有良好的口服吸收特性,這涉及到化合物的物理化學(xué)性質(zhì)。AI在優(yōu)化小分子藥物的通透性和生物利用度方面有一定優(yōu)勢(shì),因?yàn)檫@些特性可以通過(guò)大量的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行建模和預(yù)測(cè)。
這些優(yōu)勢(shì)使得人工智能在小分子藥物發(fā)現(xiàn)中能夠更迅速、精準(zhǔn)地篩選和設(shè)計(jì)化合物,加速新藥物的發(fā)現(xiàn)和開發(fā)過(guò)程。
與之相對(duì)應(yīng)的是,生物制劑在利用人工智能進(jìn)行藥物發(fā)現(xiàn)的過(guò)程中,相對(duì)于小分子藥物,可能具有以下不利因素:
01
復(fù)雜性和多樣性
生物制劑通常是大型復(fù)雜的蛋白質(zhì)、抗體或其他大分子,其結(jié)構(gòu)和功能更加復(fù)雜多樣。處理這種復(fù)雜性數(shù)據(jù)需要更高級(jí)的模型和算法,而當(dāng)前的AI技術(shù)在處理大規(guī)模多樣性的生物制劑數(shù)據(jù)時(shí),可能面臨一些挑戰(zhàn)。
02
數(shù)據(jù)可用性
生物制劑的研發(fā),涉及到數(shù)據(jù)庫(kù)在不同生物系統(tǒng)中的復(fù)雜相互作用。盡管生物制劑的數(shù)據(jù)逐漸增多,但相較于小分子藥物,可用于訓(xùn)練AI模型的大規(guī)模生物制劑數(shù)據(jù)仍然有限,限制了模型的學(xué)習(xí)和預(yù)測(cè)能力。
03
定制性和個(gè)性化
生物制劑通常具有較高的定制性和個(gè)性化,因?yàn)樗鼈兪歉鶕?jù)具體疾病或患者需求設(shè)計(jì)的。這增加了預(yù)測(cè)和設(shè)計(jì)的難度,因?yàn)槊糠N生物制劑可能具有不同的結(jié)構(gòu)、功能和相互作用模式。
04
生物學(xué)多樣性
生物制劑往往通過(guò)與人體的生物系統(tǒng)相互作用來(lái)實(shí)現(xiàn)治療效果,而人體的生物學(xué)多樣性和復(fù)雜性,使得生物制劑的研發(fā)更為具有挑戰(zhàn)性。AI模型需要更好地考慮這些多樣性,以實(shí)現(xiàn)更準(zhǔn)確地預(yù)測(cè)生物制劑在不同個(gè)體中的效果。
人工智能在藥物分子發(fā)現(xiàn)的過(guò)程中,得到了非常廣泛的應(yīng)用,僅次于疾病建模和靶標(biāo)發(fā)現(xiàn)。人工智能驅(qū)動(dòng)的藥物設(shè)計(jì),主要分為三大類:從頭藥物設(shè)計(jì)、現(xiàn)有數(shù)據(jù)庫(kù)的虛擬篩選、藥物再利用。
圖1. AI藥物分子發(fā)現(xiàn)的三大類別
01
從頭藥物設(shè)計(jì)
從頭藥物設(shè)計(jì)(de novo drug design)主要是通過(guò)深度學(xué)習(xí)模型實(shí)現(xiàn)的,例如生成對(duì)抗神經(jīng)網(wǎng)絡(luò)(GAN,generative adversarial neural networks,是一類深度學(xué)習(xí)模型,由生成器和判別器組成。GAN的訓(xùn)練過(guò)程是一個(gè)博弈,通過(guò)對(duì)抗的方式不斷提升生成器和判別器的性能)。生成式人工智能平臺(tái)的一些例子,包括Insilico Medicine的Chemistry42軟件、Iktos的Makya和Ro5的De Novo Platform。還包括 Recursion Pharmaceuticals、Deep Cure、Standigm等。
簡(jiǎn)單地說(shuō),de novo drug design是一種通過(guò)計(jì)算機(jī)輔助的方法,來(lái)設(shè)計(jì)全新的藥物分子。人工智能在de novo藥物設(shè)計(jì)中扮演著關(guān)鍵的角色,可以通過(guò)以下步驟進(jìn)行:
數(shù)據(jù)收集:首先,系統(tǒng)需要大量的生物化學(xué)和藥理學(xué)數(shù)據(jù),包括已知藥物的結(jié)構(gòu)、活性、毒性等信息。這些數(shù)據(jù)用于訓(xùn)練機(jī)器學(xué)習(xí)模型。
特征提?。涸谟?xùn)練模型之前,需要從收集的數(shù)據(jù)中提取特征,這些特征可能包括分子的結(jié)構(gòu)、電荷分布、溶解度等。這一步驟的目的是將化學(xué)信息轉(zhuǎn)化為計(jì)算機(jī)能夠理解的數(shù)字形式。
機(jī)器學(xué)習(xí)模型訓(xùn)練:采用各種機(jī)器學(xué)習(xí)算法,例如深度學(xué)習(xí)或基于規(guī)則的方法,訓(xùn)練模型以理解藥物分子的結(jié)構(gòu)和活性之間的關(guān)系。這使得模型能夠從已知數(shù)據(jù)中學(xué)到一般的規(guī)律。
生成新分子:一旦模型訓(xùn)練完成,它就可以用于生成新的、未見(jiàn)過(guò)的分子結(jié)構(gòu)。這可以通過(guò)從隨機(jī)的分子結(jié)構(gòu)開始,然后通過(guò)模型的生成能力不斷優(yōu)化,直到達(dá)到滿足特定目標(biāo)的藥物分子。
評(píng)估和篩選:生成的分子結(jié)構(gòu)需要經(jīng)過(guò)評(píng)估,以確保其具有潛在的藥用價(jià)值。這可能涉及對(duì)生物活性、毒性、生物可用性等方面的預(yù)測(cè)。
優(yōu)化和合成規(guī)劃:生成的分子通常需要進(jìn)行進(jìn)一步的優(yōu)化,以提高其在實(shí)驗(yàn)中的合成可行性和生物活性。AI還可以提供合成規(guī)劃,幫助確定實(shí)驗(yàn)室中如何制備這些新分子。
整個(gè)過(guò)程是一個(gè)迭代的循環(huán),通過(guò)不斷優(yōu)化模型并嘗試新的分子設(shè)計(jì),最終目標(biāo)是找到具有良好生物活性和臨床潛力的新藥物分子。這種方法能夠加速藥物發(fā)現(xiàn)的過(guò)程,尤其是在探索大量的潛在分子結(jié)構(gòu)時(shí),AI的高效性體現(xiàn)得尤為明顯。
02
虛擬篩選
應(yīng)用人工智能進(jìn)行藥物分子發(fā)現(xiàn)的第二個(gè)途徑是超大規(guī)模虛擬篩選,篩選數(shù)十億個(gè)分子以找到成功的目標(biāo)。2022年8月,賽諾菲與Atomwise合作進(jìn)行了一項(xiàng)價(jià)值可能高達(dá)12億美元的藥物設(shè)計(jì)交易。賽諾菲預(yù)付2000萬(wàn)美元,重點(diǎn)是利用Atomwise的 AtomNet平臺(tái),來(lái)研究賽諾菲選擇的多達(dá)5個(gè)藥物靶點(diǎn)的小分子。公告稱,基于卷積神經(jīng)網(wǎng)絡(luò)的AtomNet擅長(zhǎng)基于結(jié)構(gòu)的藥物設(shè)計(jì),能夠“通過(guò)人工智能快速搜索 Atomwise超過(guò)3萬(wàn)億種可合成化合物”。
虛擬篩選是一種利用計(jì)算機(jī)模型和算法對(duì)潛在藥物分子進(jìn)行預(yù)測(cè)和評(píng)估的方法,以便從大量的化合物庫(kù)中,篩選出具有潛在生物活性的候選分子。這種篩選過(guò)程是通過(guò)在計(jì)算機(jī)中進(jìn)行模擬和預(yù)測(cè),而不是在實(shí)驗(yàn)室中進(jìn)行物理實(shí)驗(yàn)來(lái)完成的,因此稱之為"虛擬"篩選。
虛擬篩選的主要目標(biāo)是在藥物發(fā)現(xiàn)的早期階段,從數(shù)百萬(wàn)到數(shù)千萬(wàn)個(gè)潛在的藥物候選分子中,鑒定出可能對(duì)特定疾病目標(biāo)具有生物活性的分子。這有助于加速藥物研發(fā)過(guò)程,減少實(shí)驗(yàn)室實(shí)驗(yàn)的時(shí)間和成本。在虛擬篩選中,人工智能的應(yīng)用主要通過(guò)構(gòu)建預(yù)測(cè)模型來(lái)實(shí)現(xiàn):
數(shù)據(jù)預(yù)處理:進(jìn)行數(shù)據(jù)清洗、去噪聲和標(biāo)準(zhǔn)化。這確保了模型訓(xùn)練所使用的數(shù)據(jù)是準(zhǔn)確且一致的,提高了模型的性能。
分子表征:將分子結(jié)構(gòu)轉(zhuǎn)換為計(jì)算機(jī)可處理的特征表示形式。這可以通過(guò)分子描述符(molecular descriptors)、分子指紋(molecular fingerprints)、圖神經(jīng)網(wǎng)絡(luò)(graph neural networks)等方法來(lái)實(shí)現(xiàn)。合適的分子表征對(duì)于模型性能至關(guān)重要。
模型選擇:選擇適當(dāng)?shù)臋C(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型。常用的模型包括支持向量機(jī)、隨機(jī)森林、深度神經(jīng)網(wǎng)絡(luò)等。選擇的模型應(yīng)根據(jù)任務(wù)的性質(zhì)和數(shù)據(jù)的特點(diǎn)來(lái)進(jìn)行。
模型訓(xùn)練:使用已知生物活性的化合物數(shù)據(jù)集對(duì)選定的模型進(jìn)行訓(xùn)練。這樣,模型能夠?qū)W習(xí)藥物分子的結(jié)構(gòu)與生物活性之間的關(guān)系。
模型評(píng)估:利用驗(yàn)證集進(jìn)行模型的評(píng)估,以檢驗(yàn)其對(duì)未見(jiàn)過(guò)數(shù)據(jù)的泛化能力。評(píng)估指標(biāo)可能包括準(zhǔn)確性、靈敏度、特異度等。
虛擬篩選:使用訓(xùn)練好的模型對(duì)潛在的藥物分子進(jìn)行預(yù)測(cè)。這可以是從公共數(shù)據(jù)庫(kù)中獲取的已知分子,也可以是通過(guò)計(jì)算或合成生成的新分子。模型會(huì)為每個(gè)分子提供一個(gè)生物活性的預(yù)測(cè)值,根據(jù)這些預(yù)測(cè)值進(jìn)行排序。
分子優(yōu)化:對(duì)于在虛擬篩選中排名較高的分子,可能需要進(jìn)一步的化學(xué)優(yōu)化。這可以通過(guò)調(diào)整分子結(jié)構(gòu)以提高生物活性、改善藥代動(dòng)力學(xué)性質(zhì)等來(lái)實(shí)現(xiàn)。
實(shí)驗(yàn)驗(yàn)證:虛擬篩選的結(jié)果需要在實(shí)驗(yàn)室中進(jìn)行驗(yàn)證。實(shí)驗(yàn)驗(yàn)證有助于確認(rèn)虛擬篩選的準(zhǔn)確性,并驗(yàn)證潛在藥物分子的生物活性和其他關(guān)鍵性質(zhì)。
03
藥物再利用
最后,許多公司正在使用藥物再利用(Drug Repurposing)策略,來(lái)進(jìn)行人工智能藥物發(fā)現(xiàn)。此類公司包括Healx、BenevolentAI、BioXcel Therapeutics。他們主要使用自然語(yǔ)言處理 (NLP) 模型和機(jī)器學(xué)習(xí),通過(guò)分析大量非結(jié)構(gòu)化文本數(shù)據(jù)(研究文章和專利、電子健康記錄以及其他類型數(shù)據(jù)),來(lái)構(gòu)建和搜索可以實(shí)現(xiàn)再利用的藥物群體。
數(shù)據(jù)整合與挖掘:AI可以整合和挖掘大量的生物醫(yī)學(xué)數(shù)據(jù),包括基因組學(xué)、蛋白質(zhì)組學(xué)、藥物相互作用等信息。這有助于發(fā)現(xiàn)已有藥物在新的治療領(lǐng)域可能具有活性的跡象。
網(wǎng)絡(luò)分析:利用網(wǎng)絡(luò)分析技術(shù),AI可以建立藥物、蛋白質(zhì)和疾病之間的關(guān)聯(lián)網(wǎng)絡(luò)。通過(guò)分析這些網(wǎng)絡(luò),可以識(shí)別潛在的藥物再利用機(jī)會(huì),例如,發(fā)現(xiàn)與目標(biāo)疾病相關(guān)的已有藥物或化合物。
藥物相似性和特征學(xué)習(xí):AI可以利用藥物相似性和特征學(xué)習(xí)方法,分析已有藥物與新治療目標(biāo)之間的相似性。這有助于預(yù)測(cè)已有藥物是否對(duì)新的治療目標(biāo)具有潛在活性。
機(jī)器學(xué)習(xí)預(yù)測(cè):采用機(jī)器學(xué)習(xí)算法,AI可以根據(jù)已有藥物的生物活性和藥理學(xué)特性,建立預(yù)測(cè)模型,預(yù)測(cè)這些藥物在新的治療領(lǐng)域中的效果。這種方法有助于高效地篩選候選藥物。
文本挖掘和知識(shí)圖譜:AI技術(shù)可以通過(guò)文本挖掘和知識(shí)圖譜構(gòu)建,自動(dòng)化地從文獻(xiàn)、專利和臨床試驗(yàn)數(shù)據(jù)庫(kù)中,提取有關(guān)藥物的信息。這有助于發(fā)現(xiàn)藥物的新的治療用途和關(guān)聯(lián)。
細(xì)胞和基因組學(xué)數(shù)據(jù)分析:利用細(xì)胞和基因組學(xué)數(shù)據(jù),AI可以識(shí)別已有藥物對(duì)細(xì)胞或基因表達(dá)的影響,從而發(fā)現(xiàn)其可能的治療機(jī)制,并推斷其在新治療目標(biāo)上的潛在效果。
例如,美國(guó)臨床階段生物技術(shù)公司Lantern Pharma,就是這樣一家專注于利用先進(jìn)的基因組學(xué)、機(jī)器學(xué)習(xí)和人工智能來(lái)創(chuàng)新癌癥藥物開發(fā)流程的企業(yè)。該公司的人工智能平臺(tái)——RADR??目前包含超過(guò)250億個(gè)數(shù)據(jù)點(diǎn),并使用大數(shù)據(jù)分析和機(jī)器學(xué)習(xí),來(lái)快速發(fā)現(xiàn)與藥物反應(yīng)相關(guān)的生物學(xué)基因組特征,然后識(shí)別相關(guān)癌癥患者亞組,使其從Lantern的候選藥物中受益。Lantern及其合作者還使用RADR??來(lái)開發(fā)和定位新藥以及藥物再利用。
04
AI在小分子藥研中應(yīng)用展望
根據(jù)BiopharmaTrend網(wǎng)站收集的數(shù)據(jù),下圖顯示了319家藥物發(fā)現(xiàn)初創(chuàng)公司對(duì)于人工智能的應(yīng)用情況。將近一半的公司(49%,156 家初創(chuàng)公司)專注于小分子藥物的發(fā)現(xiàn),而只有20%(64家初創(chuàng)公司)參與發(fā)現(xiàn)和開發(fā)生物藥物(抗體、疫苗等)。
圖2. 醫(yī)藥人工智能初創(chuàng)公司的業(yè)務(wù)分布圖,來(lái)源:BiopharmaTrend
人工智能在小分子藥物發(fā)現(xiàn)領(lǐng)域具有光明的前景,盡管目前尚沒(méi)有通過(guò)人工智能實(shí)現(xiàn)小分子藥物上市的成就,但這只是時(shí)間的問(wèn)題。
人工智能最大的優(yōu)勢(shì)也許是極大縮短藥物設(shè)計(jì)的周期。傳統(tǒng)的藥物發(fā)現(xiàn)過(guò)程非常耗時(shí)且昂貴,而人工智能能夠加速整個(gè)過(guò)程。通過(guò)高效的虛擬篩選、分子設(shè)計(jì)和優(yōu)化,人工智能可以在更短的時(shí)間內(nèi)生成和評(píng)估大量的藥物候選分子。根據(jù)Nature Review Drug Discovery的報(bào)告,研究者發(fā)現(xiàn)多個(gè)人工智能項(xiàng)目在不到四年的時(shí)間內(nèi)完成了整個(gè)發(fā)現(xiàn)和臨床前的過(guò)程,而通常這個(gè)研發(fā)過(guò)程需要五至六年的時(shí)間。
人工智能可以根據(jù)已有的生物學(xué)和藥理學(xué)知識(shí),設(shè)計(jì)具有目標(biāo)生物活性和更好生物可用性的分子。這包括生成新的分子結(jié)構(gòu)、優(yōu)化藥物性質(zhì)等。AI還可以分析復(fù)雜的生物學(xué)網(wǎng)絡(luò),預(yù)測(cè)不同藥物的相互作用,從而幫助發(fā)現(xiàn)更有效的藥物組合療法。這對(duì)于治療復(fù)雜疾病和抗藥性的問(wèn)題尤為重要。通過(guò)分析大規(guī)模的生物學(xué)和臨床數(shù)據(jù),人工智能可以幫助患者實(shí)現(xiàn)個(gè)性化藥物治療。根據(jù)患者的遺傳信息、生物標(biāo)志物和疾病特征,定制藥物治療方案,提高治療的效果。人工智能模型可以預(yù)測(cè)藥物的潛在毒性和不良反應(yīng),從而幫助在早期階段識(shí)別潛在的安全性問(wèn)題,減少候選藥物的流失。與結(jié)構(gòu)生物學(xué)數(shù)據(jù)的結(jié)合,可以令人工智能更準(zhǔn)確地預(yù)測(cè)小分子與蛋白質(zhì)的相互作用,從而指導(dǎo)藥物設(shè)計(jì)的方向。而在新的藥物靶點(diǎn)識(shí)別方面,人工智能在分析大規(guī)模生物學(xué)數(shù)據(jù)的過(guò)程中,可以通過(guò)新靶點(diǎn)的識(shí)別,為藥物發(fā)現(xiàn)提供更多的選擇。
這些前景表明,人工智能在小分子藥物發(fā)現(xiàn)領(lǐng)域的應(yīng)用有望在未來(lái)取得更多的突破,為新藥物的發(fā)現(xiàn)和開發(fā)提供更強(qiáng)大、高效的工具。
合作咨詢
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com