新闻中心
行业动态      

ChatGPT在药物发现中能帮我们做些什么

发布时间:2023-05-31

    近年来,AI制药已经成为医疗领域的新晋热门赛道。2023年ChatGPT的爆火,让人们看到生成式AI在制药领域应用的多种新可能。


    ChatGPT是由OpenAI开发的最先进的语言模型。创建者OpenAI在测试阶段免费提供了原型软件,并鼓励用户分享他们的反馈。随着ChatGPT的广泛覆盖,人工智能的学习迭代及其在新药研发实践中的探索迅速升温。本文初步探讨ChatGPT对药物发现带来的影响和变化。

1.ChatGPT在药物发现方面的未来前景


    药物发现是一个非常困难和复杂的过程,原因有以下几方面:一是生物复杂性,人体是一个极其复杂的系统,在分子水平上理解人体如何工作相当困难;二是高失败率,大多数进入临床试验的药物最终未能获批上市;三是药物发现过程漫长且成本高昂,将一种新药推向市场可能需要长达15年的时间,花费数十亿美元;四是严格的监管要求,药物研发的过程受到严格监管,药物必须经过一系列临床前研究和临床试验才可能被批准上市。此外,许多已知的药物靶点已经被开发,而寻找新的靶标变得越来越困难。


    近年来,CADD(计算机辅助药物研发)以及AIDD(AI辅助药物研发)在加速新药研发进展方面已经取得一定成就,不少研究机构和企业采用CADD/AIDD辅助进行研发。作为生成式AI技术的代表,ChatGPT在药物发现方面有以下前景。

识别和验证新的药物靶标


    ChatGPT可以应用于科学文献的数据集,并用于生成给定疾病或生物靶标的最新研究总结。这可以帮助研究人员快速识别新的潜在靶标,或更好地了解特定领域的研究现状。

设计新药


    ChatGPT可以应用于已知药物分子的数据集,并用于生成具有相似性质的新化学结构。这可以帮助研究人员确定成功几率更高的新先导化合物。

优化药物特性


    ChatGPT可用于预测新药的药代动力学和药效学,并支持早期药物发现中化学库的虚拟筛选。

评估毒性


    ChatGPT可以在毒性数据的数据集中进行应用,并用于预测新药的潜在毒性作用。

生成药物相关报告和论文


    ChatGPT可以应用于药物相关论文的数据集,并用于生成总结特定领域研究现状的报告和论文。


    通过提供一种经济有效的方法来处理大量数据并产生新的知识,ChatGPT可以帮助研究人员作出更明智的决定,加速药物发现过程。值得注意的是,ChatGPT只是药物发现中使用的许多工具中的一个,它不能替代实验验证和临床试验。然而,它可以通过提供一种经济有效的方法来处理大量数据和产生新的知识,从而显著加快和改善药物开发过程。

2.ChatGPT在药物研发中可能起到的作用


    传统的创新药物研发,是通过对大量化合物进行实验筛选,找到有活性的药物先导化合物。而使用计算化学方法的药物发现,是基于物理原理和应用计算机算法来帮助发现新药。它涉及使用计算机模拟和建模技术来预测潜在药物分子的性质和相互作用。这些方法可用于了解蛋白质和其他生物靶标的结构和行为,设计和优化能与这些靶标结合并调节其活性的新化合物。可以说,计算化学通过提供一种经济有效的方法来筛选大量化合物,预测其潜在的疗效和毒性,并确定新的先导化合物用于进一步开发,在现代药物发现中发挥着至关重要的作用。此外,它还可使研究人员能够设计选择性更强、副作用更少的新药,以及从分子水平了解药物作用机制,并优化药物的药代动力学和药效学。


    在使用计算化学方法的药物发现过程中,ChatGPT可能起到以下十方面作用。

计算化学物质的多样性(multiplicity)


    当使用者询问Zn的多样性时,ChatGPT给出了正确的答案:“Zn是原子序数为30的过渡金属,它的电子构型有30个电子。Zn的电子构型为[Ar]3d^10 4s^2。由于所有的电子都在轨道中配对,Zn的multiplicity为1。这意味着HOMO中的所有电子都是配对的,分子中没有未配对的电子。”可见,ChatGPT可以利用密度泛函理论(DFT)在量子力学计算中确定各种化学物质的多样性。

与AutoDock对接


    ChatGPT成功给出了AutoDock(分子模拟软件)的输入文件,还解释了其中提到的参数。

查找PDB文件


    ChatGPT在PDB(蛋白质结构数据库)搜索中也很有用。例如,它可以提供金属蛋白、与DNA结合的蛋白、刺突蛋白等的PDB ID。然而,ChatGPT未能回答复杂的问题。

给出Fasta序列


    Fasta是一种基于文本用于表示核酸序列或多肽序列的格式。ChatGPT可以给出Fasta序列但不能比较Fasta序列。在这种情况下,ChatGPT无法提示Fasta序列,然而它建议可以从UniProt数据库中获得Fasta序列。

ADMET特性


    关于药物的ADMET(吸收、分布、代谢、排泄和毒性)特性,ChatGPT只能给出已知药物的特性,这些内容可以很容易地从各种药物数据库中获得。

文献检索帮助


    ChatGPT的一个主要应用是文献检索,并列出与主题相关的具体结果。

对接代码


    ChatGPT可以帮助编写基本代码,这一功能可在药物发现的许多方面广泛使用。

检查剽窃


    ChatGPT可用于检测剽窃,使研究成果顺利发表。

机器学习和数据分析


    ChatGPT可以使用其应用程序编程接口(API)集成到程序或应用程序中,允许开发人员输入文本并接收模型生成的响应。可以使用Python、JavaScript和C#等编程语言访问API。此外,OpenAI团队还发布了模型的预训练版本,可以使用称为转移学习的过程针对特定任务进行微调。

创新


    创新是研究领域的一个主要部分,只有提出不同的问题才能做到创新。在这一方面,ChatGPT对于帮助药物研发人员提出新颖的想法非常有用。

3.ChatGPT在药物发现方面的局限性


    当然,与其他机器学习模型一样,ChatGPT所提供的答案在准确性、广泛性方面仍存在局限,在药物发现方面也不例外。局限性主要体现在以下方面。

依赖于数据的质量和可用性


    如果数据不完整、存在偏倚或不准确,则模型的预测可能不可靠。

缺乏实验验证


    ChatGPT可以生成预测和假设,但不能进行实验或测量化合物的性质。因此,模型作出的预测需要实验验证。

对潜在生物学的理解有限


    虽然ChatGPT可以生成类似人类语言的文本,但它不理解它正在模拟的系统的潜在生物学意义。因此,模型做出的预测可能并不总是反映系统的真实复杂性。

可解释性有限


    ChatGPT与其他机器学习模型一样,可能难以解释,且不清楚模型是如何得出特定预测的。

处理不确定性的局限性


    ChatGPT是一种确定性模型,不能解释数据和预测中的不确定性。

缺乏透明度


    ChatGPT是一个黑盒模型,很难理解和解释模型的内部工作原理,这会使模型的预测难以信任。

总之,ChatGPT是一种强大的语言模型,可以协助药物发现。通过处理和生成类人文本,可以帮助研究人员快速识别新的潜在靶标,更好地了解研究现状、以及设计新药、优化新药的药代动力学和药效学。然而,要注意的是,ChatGPT只是药物发现中使用的许多工具中的一个,它并不能替代实验验证和临床试验。此外,它不能进行复杂计算,如模拟和分析分子水平研究。尽管如此,ChatGPT在药物发现中的应用是一个很有前景的领域,它有可能显著加快和改善药物开发过程。


(来源:中国医药报)