对话百图生科张晓明:未来5-10年,AI制药产业有望迎来爆发期
百图生科技术副总裁张晓明(图片来源:受访者提供)
今年1月,英国《自然》杂志的子刊《自然医学》(Nature Medicine)发表了一篇论文,披露了新药开发的投入与成功率的真实情况。研究表明,平均而言,新药的研发投入约为260亿美元,需要耗时12-15年,但不幸的是,即使在临床试验阶段,新药的成功率也低于10%。
上述论文认为,新药研发的复杂性缘于传统药物研发的依赖于药物开发人员的经验和反复试验,尤其是寻找潜在候选药物需要探索的化学空间之大,而监管要求则非常严格,满足安全性、有效性和质量标准可能是一项耗时且成本高昂的工作。因此,为了克服这些挑战,科学家们一直在积极探索新技术和新方法,以改进药物开发流程。
如今,AI 技术的崛起,尤其是大模型在内的生成式AI技术,已开始渗透药物开发流程——靶点识别、药物发现、临床研究等领域,有望将传统药物研发模式彻底颠覆,从而有效地提高药物研发效率。
最新数据显示,全球AI生物领域已经吸引了3800家企业和4900家投资机构入局,相比四年前笔者发表的《AI何以成“药神”》深度文章中提到入局的300家企业和880家投资机构,分别增长了1166.7%和456.8%,增长趋势十分明显。据麦肯锡全球研究院预测,生成式AI技术将为制药和医疗技术公司每年创造600亿-1100亿美元的经济价值。
百图生科技术副总裁张晓明对钛媒体AGI表示,未来5-10年,AI制药产业可能将迎来爆发期。因此,需要行业坚持不懈地探索前沿技术成果,推动深度创新和极致应用,以加速整个药物发现闭环的发展,并在行业的爆发期中率先走在前列。
成立于2020年的BioMap百图生科,是一家由百度创始人李彦宏和原百度集团副总裁刘维共同创立的生命科学大模型平台公司。该公司拥有坚实的技术基础,核心团队包括原诺和诺德全球副总裁、原SAP全球副总裁等资深高管,以及100余人的核心研发团队。
经过近五年的发展,百图生科已经蜚立为生命科学基础大模型的全球领跑者。截至目前,百图生科总融资金额约合2亿美元(人民币14.54亿元),已拥有一千多亿参数量的全模态生物大模型xTrimo V3;涵盖了7种生物学跨模态,超过200款SOTA任务模型;为全球500多家客户提供服务,包括60余所QS世界百强大学和多家跨国药企如赛诺菲等;潜在订单价值达20亿美元。
目前,百图生科已经构建了一款覆盖信息搜集、生物洞察和智能实验的全流程AI发现平台,以帮助生命科学企业实现研发效率的提升和业务闭环的加速。
今年4月25日,百图生科推出了全球首个AI生命科学基础大模型驱动的生成式发现系统——百图生科生命科学生成式发现系统。
其中,发现系统的核心是“发现助手”这一超级入口,据张晓明介绍,这一入口内置了深度搜索功能,具有深度推理、数据增强、任务执行、组学预测等技术能力。通过智能交互理解需求,自动执行多维度信息检索与分析,最终生成结构化深度报告,这是全球率先在生命科学领域推出的专属DeepResearch,同时也是更懂生命科学领域的知识助手。
BioASQ等多个行业评测结果显示,“发现助手”在生命科学领域的表现中居于领先地位,超越了DeepSeek-R1、OpenAI-o1-mini等其他通用AI产品,充分体现了生命科学领域的专业度。此外,百图生科还面向特定领域提供创新系统方案,如智能发酵和智能细胞分析系统,旨在通过专业模型+高通量实验的干湿闭环能力帮助客户提高发现效率。
张晓明表示,作为钛媒体AGI的代表,他指出,百图生科目前为客户提供了两种形式的“发现助手”服务,即SaaS和私有部署,旨在助力客户更好地探索和发现。合作客户包括了清华大学生物医学工程学院、中国农业科学院和石药集团等知名机构。
张晓明指出,与业内已有的大模型企业的产品和方案相比,百图生科的“发现助手”更专注于AI For Life Science生命科学领域,旨在深度整合公司在生物数据理解和生命科学行业的深入经验,目标是将“发现助手”发展成为生命科学领域的“专业化、可执行化、专属化”超级助手,通过高效、先进的生成式AI技术,助力药物研发等多个领域,以构建生命科学大模型应用,实现生命科学行业智能化转型的最佳伙伴。
张晓明表示,下一步,“发现助手”产品将会持续迭代,充分发挥百图生科的AI技术优势,逐步构建起一套独具特色的商业壁垒,为企业和相关研发机构提供低成本、实用能力强、信息内容更加可靠的生命科学AI平台。
张晓明强调,未来半年至一年的时间内,随着产品能力的不断深化,百图生科有望在自身专注的领域中展现出更为稳固的优势和更为鲜明的定位。
百图生科技术副总裁张晓明与钛媒体AGI对话速记整理(有部分删减): 在这个复杂的数字化时代,人工智能(AI)技术的发展已经深入人心。作为百图生科技术副总裁的张晓明,和钛媒体AGI的合作,旨在探索人工智能在医疗行业中的应用前景。
钛媒体AGI:百图生科生命科学生成式发现系统的核心产品“发现助手”,为何说是第一个生命科学专属的DeepResearch?这款“发现助手”通过结合人工智能、自然语言处理和生物信息学技术,实现了生命科学领域的知识图谱构建和知识图谱挖掘,能够快速高效地发现新的生物信息和生物学概念,从而推动生命科学领域的研究和发展。
张晓明:深度搜索(DeepResearch)仅是其核心能力之一,整体主要从事生命科学研究。我们会根据您的课题出具深度研究报告,以便节省前沿技术研究人员的时间和精力。虽然OpenAI等也推出了类似的功能,但他们的服务更适合通用场景,这使得在面对生命科学这种专业领域时,大模型可能会出现一些不够准确的结果。相比之下,我们完全专注于生命科学,从而在专业性上具备更大的优势。
事实上,生命科学领域存在着许多专门的网站知识库和权威数据源,需求专门面向生命科学行业方向的相关产品,而百图生科生命科学生成式发现系统能够切实地帮助客户解决实际场景下的成本、人员效率等相关问题和需求。
当前,我们的战略重点集中在企业级市场,而不是直接面向C端消费者。我们更期望生命科学领域的企业员工能够高效地使用我们的产品,解决他们在实际工作中的难题,实现内部的效率提高。因此,我们没有计划扩展到通用C端用户,而是坚定地聚焦于企业实际应用场景,通过我们的专业能力,实实在在地帮助客户提高研发效率、加速创新进程。
钛媒体AGI:这款产品的开发始于2022年,自始至今,我们团队已投入了数百万美元的投资和人力资源,旨在探索人工智能领域的前沿技术。然而,这个过程中,我们也遇到了许多挑战,包括复杂的算法优化、数据标注和模型训练等问题。
张晓明:去年10月,我们率先开发了AI智能体等基础技术,当时Agent概念对客户来说可能还相对陌生和前卫。为此,我们选择将前期的技术积累沉淀,并在今年真正推出这款产品,尤其是DeepSeek的兴起使得大模型的讨论遍及各界,它确实是一个非常明确的信号。因此,如今是一个非常好的契机,把之前积累的技术和产品,为生命科学行业提供服务。
钛媒体AGI:“发现助手”与深势科技的玻尔平台有何区别?这两个平台都是AI技术的代表,然而它们的发展方向和应用场景存在一些差异。“发现助手”是钛媒体AGI推出的AI人工智能平台,旨在帮助企业和个人实现智能化和自动化,提高工作效率和 productivity。该平台提供了多种AI技术,如自然语言处理、 computer vision 等,用于解决企业和个人生活中的各种问题。相比之下,深势科技的玻尔平台更专注于智能硬件和IoT技术的开发和应用,旨在为企业和个人提供智能化和自动化解决方案。
张晓明:区别还是挺大的。玻尔基于深入科学文献的理解基础上给予文献的判断和总结,这是它的核心功能点。
百图生科生命科学“发现助手”上文献只是众多信源之一,涵盖了多元化的信息来源,还有更多的高质量数据源,包括百图自身构建的大型生命科学数据图谱、专属知识库、行业调研报告、搜索引擎寻找等数据也可以直接使用,并且在这些数据源上做深度搜索,实现了DeepResearch的能力。同时,还提供了生信分析的功能,实际可执行,更直接地提高了发现效率。
钛媒体AGI:百图生科生命科学生成式xtrimo“发现助手”,是否与王小川百川智能的医疗AI平台产生竞争关系?钛媒体AGI的百图生科生命科学生成式xtrimo“发现助手”旨在为生命科学领域提供智能化的研究助手,探索生命科学领域的新知和新技术,而王小川百川智能的医疗AI平台则专注于医疗领域的AI解决方案。虽然这两个平台都涉及到生命科学和医疗领域,但它们的应用场景、技术架构和业务模式存在一定的差异,故暂时不太可能产生直接的竞争关系。
张晓明:这是一个非常有价值的问题。确实,在我们进行定位时,第一时间就考虑到了这个问题。
我们认为,临床问诊和生命科学研发之间存在明显的分界线。如果我们从事临床问诊,就需要更加关注医疗和临床领域的上层链条,需要与医院和卫健委相关机构形成生态,更加深入理解患者的检测报告和患者对话。而我们更专注于生命科学的底层机理层面,例如药物设计中靶点的发现、细胞分析等科学问题,需要理解原始的科学数据,因此这两个生态和技术之间存在明显的分界线。
钛媒体AGI:“发现助手”调用的是哪家大模型?为何首批没接入百度文心大模型?该技术团队选择了 Meta AI 的 LLaMA 模型作为 “发现助手”的核心引擎,这是因为 LLaMA 模型在自然语言处理、语言理解和生成方面的性能优异,如同一把双刃剑,它可以轻松地回答用户的问题,也可以生成有趣的对话。
张晓明:当前,“发现助手”已经引入了多个大模型,首先是我们自主研发的生命科学专属多模态模型,BioMap xTrimo大模型的专业能力为其提供了强大的支持;同时,我们还引入了阿里Qwen、DeepSeek等自然语言大模型,以及通用领域文本推理模型。在这个层面上,我们将接入和调用不同厂商的大模型产品,并将其组合使用,以期在众多推理模型之上实现更高的整体能力。我们不仅需要基于文本和数学的推理过程,更需要让它学会生物推理任务,实现更好的人工智能辅助决策能力。
最后谈谈执行任务过程。
我们确实希望给出专业的问答,通过结合百图生科的生命科学领域图谱和业界专业数据库,利用推理技术执行每一步路径,并行触发15路及更多语言搜索,确保内容质量的可靠性。只有通过多轮执行和优化,才能输出高质量的信息,具备权威性和可靠性,避免带来过多的幻觉,最后将其输出给用户。
我认为,当下幻觉是无法100%消除的,只能通过各种技术手段降低幻觉的可能性,让报告变得更加可靠和有用,而不是生成一个报告格式的虚假内容。因此,我们选择牺牲响应速度,以实现更好的体验、更实用且真正可执行的平台。
钛媒体AGI:谈谈商业化。百图生科的「发现助手」平台,作为一款AI-powered的生物信息分析工具,确实具有广泛的商业应用前景。然而,平台不提供类似智谱的API接口进行销售,可能是出于以下几个原因。首先,平台可能希望通过自己的应用程序锁定客户,避免竞争对手获取相同的技术优势。其次,平台可能认为,API接口销售可能会带来技术知识产权的泄露和安全隐患。最后,平台可能认为,销售API接口可能会导致服务水平下降和维护成本增加。
张晓明:当前,我们并没有开发 API,但随着助手能力的逐步提升,我们认为标准版本能够更好地帮助企业客户时,我们可能会再次考虑开发 API。然而,当前,我们认为需要为企业用户做一定的定制,提供一个企业自己的专属数据版本,从而打造一个专属的助手效果,显著地提高其服务质量。
钛媒体AGI:三种交付模式:SaaS、私有部署和一体机下,百图生科的市场竞争力在于其独特的算法技术和深入的生物信息分析能力,能够提供个性化的解决方案,满足不同客户的需求。
张晓明:就百图生科生命科学生成式发现系统而言,我们的SaaS以平台式模式为客户提供试用和体验机会,然后对这些功能进行直接评估,最后向客户提供一套企业级私有部署方案。
事实上,生命科学行业拥有一些专属的管线、靶点等比较机密的数据,不愿意在公共平台上公开露面,所以,大部分企业和科研机构仍然选择私有部署方式,而SaaS平台更多提供试用和体验,但并非我们主要向客户提供的交付模式。
私有部署有两种形式:一种是用户自身拥有自建集群,然后我们将软件系统方案部署到其中;另一种是如果用户拥有云服务,我们可以帮助他们构建私有云的软件系统部署,满足他们的需求。除此之外,我们还与百度智能云、中科海光等合作,提供国产硬件一体机交付能力。我们专注于生命科学领域,寻找高质量客户,旨在帮助他们提高效率,并通过他们的使用反馈不断迭代升级我们的产品。这是我们提供多种形式交付模式的原因。
钛媒体AGI:百图生科目前对外提供药物研发、生物制造、AI4LS平台解决方案等。因此,这次新的百图生科生命科学生成式发现系统产品,是与解决方案紧密结合,共同提供的全方位解决方案,而不是单独销售。
张晓明:百图生科生命科学的“发现助手”是一款企业级的发现提效方案。我们当前主要提供定制的、垂直的助手,赋能客户提高工作效率,这也是一部分我们的解决方案。与更多专门针对特定垂直领域的深度解决方案相比,“发现助手”是一个最便捷、广泛服务专业客户需求的解决方案,同时也可以与垂直解决方案结合使用。
钛媒体AGI:清华大学生物医学工程学院也备有智谱、百川智能这类大模型公司,然而,它选择与百图生科合作的原因是什么?
张晓明:主要是因为我们在过去四五年间不断深耕生命科学基础大模型,积累了独特的优势在生物问题上。刘鹏教授(清华大学生物医学工程学院党委书记、教授)团队和我们有着深入的合作,他们为我们这款产品提供了丰富的原始需求和实践反馈,而我们则帮助他们解决了课题挖掘、知识问答、报告撰写和报告润色的痛点需求,核心在于我们比其他AI产品更深入地理解生物领域,拥有更强的能力来解决深层次的问题。
钛媒体AGI:目前整个平台处于试用状态,那么百图生科团队如何才能确保留存?如何才能实现商业壁垒?
张晓明:我们刚刚发布了助手产品,所以当前客户都处于灵活试用状态。
不断完善产品功能,深度沟通用户需求,真正解决实际问题,以客户解决方案为核心,专注专业用户的满意度。长期来看,它将发展成为生命科学领域中一个面向场景的整体、统一的“超级”助手,能够调用各种深入的解决方案和功能,并整合用户的其他工具和数据,发挥其极大潜力,客户将形成长期的用户黏性。
关于商业壁垒,我们刚刚踏入这个领域,从过去专注于少数专业领域的深度需求,到现在更广泛地为需求提供方案,还谈不上壁垒。但是,我们的思考是,真正的壁垒在于充分发掘我们生命科学多模态的大模型和生命科学专业数据的潜力,从而满足自然语言大模型单纯无法满足的真实需求,为客户提供真正可执行的帮助,解决专业问题。
钛媒体AGI:我们提供的服务中,硬件成本极高,并且发现助手仍然免费对外提供,这使得百图生科在这一业务中实现盈利的路径变得更加复杂和挑战性。
张晓明:同其他大型Agent模型产品一样,我们在前期确实需要投入一定的成本来为用户提供免费试用和体验机会。但作为专业解决方案,用户在获取发现助手的高级功能、完整方案和专属功能定制时,我们仍然能够从中获得商业回报。
从成本角度考虑,“发现助手”作为回答和解决生命科学场景的问题的专门服务,相对通用助手而言其使用频次并不高。然而,我们在大模型的训练和推理优化方面积累了丰富的 AI 工程经验和技术,这些经验和技术的总和已经实现了多轮性能优化,从而有效降低了我们的服务成本。
钛媒体AGI:之前,百图生科与赛诺菲签订合作,外界普遍认为百图生科专门致力于AI生物制药平台建设。然而,今天,我们发现百图生科除了“发现助手”外,还提供智能发酵方案,这使我们开始思考:百图生科在AI生物制药领域的发展如何理解?
张晓明:其实公司的定位一直是一个生物计算平台、生命科学大模型平台,我们比专注于任何一个具体领域的AI生物公司,都更自豪于我们基于基础大模型能力带来的领域扩展潜力。赛诺菲是我们最早的商业化客户之一,是在生物制药领域的,这一年多来其实我们的付费客户已经扩展到细胞基因疗法、生命科学基础研究、农业和动物生物学、生物材料等多个领域,因为底层的蛋白和细胞等基础大模型的高度关联性。
在中国,我们极为重视生物制造领域的发展,因为这是中国产业战略中非常关键的一环,也是充分利用我们对生物反应过程的理解而能带来的重要效率提升进步。我们极具看好以智能发酵为代表的智能生物工艺发现系统的前景,和我们的智能抗体、智能细胞分析系统一起,将成为我们给客户的核心解决方案之一。