近日,谷歌宣布推出全新开源模型 TxGemma,专为提升治疗性药物的研发效率而设计。这一模型由谷歌 DeepMind 团队基于其先进的 Gemma 模型家族微调开发,融合了强大的语言理解、科学预测以及多轮对话功能,旨在为药物研发领域带来革命性的突破。TxGemma 的发布被视为人工智能技术在生物医药领域的重要进展,有望大幅缩短药物从实验室到临床的周期,同时降低高昂的研发成本和失败率。

全流程支持药物研发

TxGemma 的核心优势在于其能够模拟药物研发的完整流程,从早期药物筛选到后期临床试验结果预测,覆盖多个关键环节。研究人员可以利用该模型进行药物分子的毒性预测、药物靶点识别以及疗效评估等任务。得益于其强大的计算能力,TxGemma 能够快速分析小分子化合物、化学物质和蛋白质等生物实体特性,帮助科学家更高效地筛选出潜在的候选药物,并预测其在临床试验中的表现。这种端到端的支持使得 TxGemma 成为药物研发中的“全能助手”,有望改变传统研发模式中耗时长、风险高的现状。

Google 发布 TxGemma 开源模型,助力加速治疗性药物研发-Mo 动态

图源备注:图片由AI生成,图片授权服务商Midjourney

三种规模,灵活适配需求

为了满足不同研究场景和计算资源的需求,TxGemma 提供了三种模型规模:2B(20亿参数)、9B(90亿参数)和27B(270亿参数)。这些模型根据参数量的大小,适用于从轻量级任务到高复杂度研究的多种应用场景。每种规模的模型均包含“预测”(Predict)版本,专为特定任务优化,例如判断某一分子是否具有毒性或能否通过血脑屏障。此外,9B 和27B 规模的模型还推出了“聊天”(Chat)版本,不仅能执行预测任务,还能通过自然语言与研究人员进行多轮对话,解释预测背后的推理过程,并回答复杂的科学问题。这种对话能力为研究人员提供了一个互动性更强的工具,进一步提升了研发的灵活性和深度。

Google 发布 TxGemma 开源模型,助力加速治疗性药物研发-Mo 动态

性能卓越,通用性突出

TxGemma 的性能表现尤为亮眼,尤其是其最大的27B 参数“预测”版本。据悉,该版本在几乎所有测试任务中都超越或匹敌了谷歌此前的通用模型 Tx-LLM,显示出极高的预测精度和稳定性。更令人瞩目的是,27B 模型甚至能与专为单一任务设计的专业模型相媲美,展现了其在多任务场景下的强大适应性。这种通用性不仅减少了研究人员对多种专用模型的依赖,还为跨领域药物研发提供了新的可能性。谷歌表示,TxGemma 的开发过程中使用了来自 Therapeutics Data Commons 的700万个训练样本,确保其在药物相关任务上的专业性和可靠性。

Google 发布 TxGemma 开源模型,助力加速治疗性药物研发-Mo 动态

开源模式推动协作创新

作为一款开源模型,TxGemma 已通过谷歌的 Vertex AI 平台和 Hugging Face 向全球研究社区开放。谷歌强调,TxGemma 的设计初衷不仅在于提供强大的计算工具,更在于通过开放性激发全球科学家和开发者的协作创新。研究人员可以根据自身需求对模型进行微调,适配特定的治疗性药物开发场景。谷歌还同步发布了配套的 Colab 笔记本,展示如何将 TxGemma 集成到复杂的研究工作流中,进一步降低了使用门槛。

未来展望

药物研发一直是一个高风险、高投入的领域。据统计,90%的候选药物在第一阶段临床试验后即告失败,而成功研发一款新药往往需要数十亿美元和超过十年的时间。TxGemma 的出现为这一现状带来了新的希望。通过结合人工智能的预测能力和多轮对话功能,该模型不仅能加速药物筛选和优化过程,还能为研究人员提供更具洞察力的决策支持。业界专家认为,TxGemma 的开源发布可能推动药物研发进入一个更加高效和协作的新时代。

随着 TxGemma 的逐步应用,其在实际药物研发中的表现将成为关注的焦点。谷歌表示,未来将继续优化模型性能,并期待社区反馈以推动其进一步迭代。可以预见,随着人工智能与生物医药的深度融合,像 TxGemma 这样的工具将在拯救生命、改善人类健康的道路上发挥越来越重要的作用。

官方介绍:

https://developers.googleblog.com/en/introducing-txgemma-open-models-improving-therapeutics-development/

来源https://www.aibase.com/zh/