
「行業圖譜系列」是Betvictor中文版國家金融研究院資本市場與公司金融研究中心基于科技成果轉化研究的一項子課題,聚焦于科技成果這一核心要素,從技術鍊視角切入展開的研究項目。通過行業圖譜的研究,既為科技成果轉化提供了專業性知識體系支撐,也有助于指導城鎮産業化發展布局、推動産業鍊融通創新、引導創業投資基金對“硬科技”的積極性及鼓勵金融支持創新體系的建設。本報告為行業圖譜的第一個系列——生物醫藥領域:人工智能在藥物發現與研發中的應用。
藥物發現和研發是制藥企業和化學科學家的重要研究領域。人工智能和機器學習技術使制藥領域實現了現代化。機器學習和深度學習算法已被應用于多肽合成、虛拟篩選、毒性預測、藥物監測和釋放、藥效團建模、定量構效關系、藥物重定位、多藥理和生理活性等藥物發現過程。
新藥研發存在周期長、費用高和成功率低等特點,人工智能作為藥物研發領域的一個熱點方向,已被應用到藥物研發的各個階段。本研究從人工智能在藥物發現與研發中的應用出發,剖析人工智能在藥物發現與研發中的應用技術和方法流程,并探讨該領域下國内外的市場競争情況和最新研究成果。
人工智能在藥物發現與研發中的應用
人工智能(Artificial Intelligence,AI),指的是計算機系統從輸入或過去的數據中學習的能力。根據《人工智能:現代方法》中的讨論,人工智能有七種分類(圖1-1)。

圖1-1 人工智能的分類
如圖1-2所示,在新藥研發中,第一步也是最重要的一步是确定與疾病病理生理學有關的适當靶點(如基因、蛋白質),然後找到可以幹擾這些靶點的藥物或類藥物分子。人工智能的發展可以幫助提取這些大型生物醫學數據集中存在的有用特征、模式和結構。在确定和驗證了合适的靶點之後,下一步是尋找合适的藥物或類藥物分子,這些分子可以與靶點相互作用并引起所需的反應。在大數據時代,通過支配海量的大型化學數據庫,協助尋找針對特定靶點的完美藥物。

圖1-2 大數據在藥物設計和發現中的應用
人工智能在藥物發現與研發中的應用技術和方法流程
在新藥研發過程中,常遇到的瓶頸問題有:①尋找合适的、具有生物活性的藥物分子;②藥物分子難以通過第二階段臨床試驗和其他監管批準。利用基于人工智能的工具和技術,提升藥物研發的效率,解決上述所面臨的藥物研發問題。為此,下面将詳細介紹人工智能在藥物發現與研發中的應用技術和方法流程,如圖2-1所示。

圖2-1 人工智能在藥物發現與研發中的應用
肽合成與小分子設計
多肽是一種由大約2至50個氨基酸組成的生物活性小鍊,由于它們具有跨越細胞屏障的能力并可以到達所需的靶點,因此越來越多地被用于治療。深度學習于肽合成與小分子設計的應用概念圖如圖2-2所示。

圖2-2 人工智能在肽合成與小分子設計的應用
分子通路的鑒定與多重藥理學
人工智能和最大似然算法在藥物發現和開發中的重要成果之一是預測和估計疾病網絡、藥物—藥物相互作用和藥物—靶點關系的總體拓撲和動力學。如圖2-3所示,數據庫如DisGeNET、STRTCH、STRING分别被用于确定基因—疾病關聯、藥物—靶标關聯和分子途徑。

圖2-3 人工智能在分子通路的鑒定與多重藥理學的應用
蛋白質折疊和蛋白質相互作用的預測
分析蛋白質—蛋白質相互作用(Protein-Protein Interaction, PPI)對于藥物開發和發現至關重要,如圖2-4所示。比如使用貝葉斯網絡(Bayesian Network,BN)預測PPI,其本質是利用基因共表達、基因本體(Gene Ontology ,GO)和其他生物過程相似性,集成數據集産生精确的PPI網絡。

圖2-4 人工智能在蛋白質折疊和蛋白質相互作用的預測
基于結構和基于配體的虛拟篩選
在藥物設計和藥物發現中,虛拟篩選(Virtual Screening,VS)是CADD的重要方法之一,是從化合物庫中篩選出有前景的治療化合物的有效方法(如圖2-5所示),以針對目标篩選具有所需活性的化合物。

圖2-5 人工智能在藥物虛拟篩選的應用
藥物重定位
在新藥研發中,先導化合物的篩選是至關重要的,人工智能在識别新的和潛在的先導化合物方面發揮着巨大的作用。在化學空間中有大約1.06億個化學結構,他們來自不同的研究,如基因組研究、臨床和臨床前研究、體内分析和微陣列分析。利用機器學習模型,根據活性位點、結構和靶結合能力可以篩選出這些化學結構。
定量構效關系建模與藥物再利用
在藥物設計和開發中,研究化學結構和理化性質與生物活性之間的關系是至關重要的。定量構效關系(Quantitative Structure-Activity Relationship,QSAR)建模是一種計算方法,通過它可以在化學結構和生物活性之間建立定量的數學模型,并針對其他疾病情況進行重新定位(如圖2-6所示)。

圖2-6 人工智能在定量構效關系建模與藥物再利用的應用
化合物的作用方式和毒性預測
藥物毒性是指化學分子由于化合物的作用方式或新陳代謝方式而對生物體産生的不利影響。如圖2-7所示,人工智能可以預測藥物分子與靶點結合和未結合時的效應,以及體内安全性分析。

圖2-7 人工智能在化合物的作用方式和毒性預測的應用
理化性質和生物活性的預測
衆所周知,每一種化合物都與溶解度、分配系數、電離度、滲透系數等物理化學性質有關,這可能會阻礙化合物的藥代動力學特性和藥物靶向結合效率。因此,在設計新的藥物分子時,必須考慮化合物的物理化學性質。為此,已經開發了不同的基于人工智能的工具來預測這些性質(如圖2-8所示),包括分子指紋、SMILES格式、庫侖矩陣(Coulomb matrices)和勢能測量,這些都用于深度神經網絡(Deep Neural Networks,DNN)訓練階段。

圖2-8 人工智能在理化性質和生物活性的預測的應用
藥物劑量和給藥效果的識别
給病人任何不适當劑量的藥物都可能導緻不良和緻命的副作用,多年來,确定能夠以最小毒副作用達到預期效果的藥物的最佳劑量一直是一個挑戰。随着人工智能的出現,許多研究人員正在借助ML和DL算法來确定合适的藥物劑量,如圖2-9所示。

圖2-9 人工智能在藥物劑量和給藥效果的識别應用
生物活性物質預測與藥物釋放監測
最近研究已經開發了多種在線工具來分析藥物釋放,以及選定的生物活性化合物作為載體的可行性,其概念圖如圖2-10所示。利用人工智能研究人員可以确定用于與疾病相關的特定靶點的生物活性化合物。

圖2-10 人工智能在生物活性物質預測與藥物釋放監測的應用
病毒疫苗的制備及抗體檢測
由于數據量巨大,并且需要自動抽象特征學習,人工智能在疫苗發現領域有着重大貢獻(圖2-11)。COVID-19冠狀病毒疾病疫苗的深度學習和機器學習模型主要集中在人工神經網絡、梯度提升決策樹和深度神經網絡等預測算法模型中。

圖2-11 人工智能在病毒疫苗的制備及抗體檢測的應用
人工智能在制藥行業開發新藥中的應用
最近對藥物開發人工智能的大量投資意味着這些初創公司擁有開發技術的人力和資源。與醫療成像領域的人工智能相比,總投資已經增長了四倍多,盡管兩個行業的初創企業數量相當。圖3-1顯示了基于人工智能的新藥研發所需要的條件及關鍵性技術競争點。
人工智能成為國際競争的新焦點。針對基于人工智能的新藥研發,企業必須把人工智能發展放在企業戰略層面系統布局,打造競争新優勢、開拓市場新空間。

圖3-1 基于人工智能的新藥研發所需要的條件及關鍵性技術競争點
①數據質量:構建有效且可解釋的藥物發現模型的方法之一是使用與藥物相關的實體來構建神經網絡模型。
②算法設計:大多數研究中使用的低水平窮舉對接算法在尋找具有局部最小值的受體—配體相互作用時遇到困難,導緻高度的親和力可變性。因此,對接算法的選擇、算法結構的設計和評價标準的設置都需要系統地改進。
③臨床試驗:藥物或疫苗開發與臨床應用的計算工作之間的轉化差距是計算生物學和醫學領域的一個主要且被廣泛認可的瓶頸。許多預測的藥物和疫苗尚未進入臨床試驗。
④硬件設施:目前,雲端和邊緣設備在各種人工智能應用中通常是配合工作的,随着邊緣設備能力不斷增強,越來越多的計算工作負載将在邊緣設備上執行。新型人工智能芯片主要包括神經形态芯片、近内存計算芯片等,目前仍處于探索研發階段。
國際頂級醫療公司在人工智能新藥研發的最新研究成果
全球已上市的制藥企業見下表3-1,重點關注美國、德國、英國和中國。
表3-1 全球已上市或進入臨床的人工智能制藥企業

國外相關技術早在2000年左右即開始進行院校的科技成果轉化。相對而言,我國該領域的研發跟随國際,在新冠疫情之後研究團隊開始增加,并注重成果轉化的同步進行。基于中國國内院校學者的調研及文獻報道,國内學者的研究重點同樣集中在遞送系統上,如表3-2所示:
表3-2 AI制藥中國學者定位

作者
朱雅姝 Betvictor中文版國家金融研究院資本市場與公司金融研究中心高級研究專員
安 礫 Betvictor中文版副教授、Betvictor中文版國家金融研究院資本市場與公司金融研究中心副主任
郵箱 rccmcf@pbcsf.tsinghua.edu.cn
感謝資本市場與公司金融研究中心的實習生許喜遠(Betvictor中文版醫學院2022級博士生)對本報告的助研工作。
點擊“閱讀原文”獲取報告全文