ChatGPT会改变生物医疗吗?
2022年12月,两位计算生物学家凯西·格林(Casey Greene)和米尔顿·皮维多里(Milton Pividori)开创了一项不寻常的实验:他们请一位非科学家助理帮助他们改进三篇研究论文。在一份生物学手稿中,助理甚至发现了一个引用方程式的错误,审核进行得很顺利,费用也不高,每份文件不到0.5美元。这个助手不是人,而是一个叫GPT—3的人工智能算法。这个算法将帮助我们提高研究人员的工作效率。
今天,ChatGPT,一个基于这种通用的大规模模型算法的产品,一经推出就引起了人们的关注。有一段时间,全球科技巨头宣布他们将把ChatGPT引入他们的业务。人们或惊叹狂欢,或居安思危。ChatGPT所承载的意义似乎超越了它本身。在百花齐放的应用场景中,生物技术领域如何搭上ChatGPT的快车?
ChatGPT和生物技术的结合
2020年,人工智能公司OpenAI发布的一个模型自发布以来就被大肆宣传,它是一个人工智能聊天机器人般的工具,无论是创作散文、诗歌、计算机代码还是编辑研究论文,它似乎无所不能。最近,微软表示将把ChatGPT集成到其搜索引擎必应和网络浏览器中,谷歌今天展示了其名为巴德的人工智能对话系统。这些系统可以对用户提供的复杂问题提供全面的答案,从制定详细的旅行计划到分析公司运营策略。
ChatGPT在生物技术中最有前途的应用似乎是在蛋白质生产和基因测序领域
总部位于加利福尼亚州的生物技术公司Profluent使用类似于ChatGPT的人工智能模型,创造了新的抗菌蛋白,并显示它们可以在实验室中杀死细菌。该模型被称为ProGen,是一个大的语言模型(LLM),使用大量的文本作为训练数据来开发分析和生成语言的能力-类似于ChatGPT,但Progen的语言是蛋白质的语言。简而言之,使用人工智能和大型语言模型,比如为ChatGPT提供动力的模型,来学习生物学的基本语言,并设计具有治疗疾病潜力的新蛋白质。目前,ProGen已经产生了100万个不同的人工序列,研究人员从中选择了100个在实验室合成,其中66个产生了类似于蛋清溶菌酶的化学反应,并用作阳性对照。研究小组随后选择了五种新型抗菌蛋白,并对大肠杆菌进行了测试。其中两种新的蛋白质能够杀死细菌。同时,X射线成像显示,尽管这些抗菌蛋白的氨基酸序列与任何已知的天然蛋白质相差30%以上,但它们仍然折叠成几乎与它们的“天然表亲”相同的形状。这项研究或许意味着,未来我们可以与人工智能合作,创造出不属于自然的蛋白质,并赋予这些蛋白质不同的功能,人类将成为微观世界中的神。
在征服了蛋白质之后,ChatGPT似乎又向基因进军了
科技公司英伟达在今年的摩根大通医疗大会上表示,随着下一代基因组测序的速度越来越快,成本越来越低,我们目前的基因组DNA测序能力已经超过了分析DNA序列并从中获得洞见的能力。人工智能能更快速有效地处理海量的基因组序列信息。大规模语言模型可以像人类语言一样分析DNA序列,从而加快基因组的拼接和基因突变的发现,并将发现结果以人类对话的形式表达给研究人员。例如,集成了ChatGPT的基因测序分析系统在处理患者的基因组测序数据后可能得出结论——“该患者的某个基因突变可能导致罕见的遗传病A”,这似乎取代了医生。